You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1 line
1.1 MiB

5 years ago
{"index":{"version":"0.5.12","fields":[{"name":"title","boost":10},{"name":"keywords","boost":15},{"name":"body","boost":1}],"ref":"url","documentStore":{"store":{"./":["65","个实践任务,涵盖了《机器学习》中的前十章内容,并已在南京大学投入使用。","体验整套机器学习实训课程。该课程是与南京大学合作共建的实训课程,总共有","本资料主要介绍一些机器学习的入门知识例如什么是机器学习常见的机器学习算法原理常用的模型性能评估指标怎样快速入门sklearn等内容。","简介","若想更加全面系统的学习机器学习相关知识可以输入链接https://www.educoder.net/paths/194"],"machine_learning.html":["\"experience\"","\"performance\"。","0.96","1","5","class","comput","e","e.\"","experi","experience指的根据历史数据总结归纳出规律的过程即学习过程或模型的训练过程。模型这个词看上去很高大上其实我们可以把他看成是一个函数。例如现在想用机器学习来识别图片里的是香蕉还是苹果那么机器学习所的事情就是得到一个比较好的函数当我们输入一张香蕉图片时能得到识别结果为香蕉的输出当我们输入一张苹果图片时能得到识别结果为苹果的输出。","improv","k","k1","learn","measur","p,","perform","performance指的是模型的性能。对于不同的任务我们有不同的衡量模型性能的标准。例如分类时可能会根据模型的准确率精准率召回率auc等指标来衡量模型的好坏回归时会看看模型的msermser2","program","respect","score等指标回归时会以fm指数db指数等指标来衡量聚类的效果怎么样。对各种性能指标感兴趣可以阅读模型评估指标章节。","t","t,","task","。然后您可能觉得哎呀我的模型很厉害了但其实并不然因为这样的验证集让您的模型的性能有了误解。那有没有更加公正的验证算法性能的方法呢那就是k","不甜","个⼦数据集来训练模型。在这","个不重合的⼦数据集,然后我们做","乌黑","什么是机器学习","但如果仅仅是从训练集中抽取一小部分作为验证集的话,有可能会让我们对模型的性能有一种偏见或者误解。","假如现在有一些水果的图片作为训练集(无标签),现在想要机器学习算法能够根据训练集中的图片将这些图片进行归类,但是并不知道这些类别是什么。像这样的任务我们称为聚类任务。","假如现在有一些苹果、西瓜和香蕉的图片作为训练集(有标签),现在想要机器学习算法能够根据新的测试图片来分辨出该图片中的是苹果、西瓜还是香蕉。像这样的任务我们称为分类任务。","假如现在有一些苹果的售价数据作为训练集(有标签),现在想要机器学习算法能够根据新的测试图片来分辨出该图片中的苹果能卖多少钱。像这样的任务我们称为回归任务。","假设我们收集了一份西瓜数据:","其实欠拟合与过拟合的区别和我们生活中学生考试的例子很像。如果一个学生在平时的练习中题目的正确率都不高,那么说明这个学生可能基础不牢或者心思没花在学习上,所以这位学生可能欠缺基础知识或者智商可能不太高或者其他种种原因,像这种情况可以看成是欠拟合。那如果这位学生平时练习的正确率非常高,但是他不怎么灵光,喜欢死记硬背,只会做已经做过的题,一碰到没见过的新题就不知所措了。像这种情况可以看成时是过拟合。","分类","和","回归","因此这份数据是一个有4个样本3个特征的训练集训练集的标签是“甜不甜”。","在k","<EFBFBD>