This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
# 5.1 什么是回归
在上一章介绍了如何使用k近邻算法来对红酒的品质进行检测。由于红酒的品质是一种离散值,所以,红酒品质检测这件事说白了,就是将对红酒的品质进行分类。
那么细心的你可能会发现一个问题,如果我们想要的输出是连续值而非离散值,该怎么办呢?
![](1.jpg)
那这个时候,就可以引出一个概念了,那就是回归。那回归是什么意思呢?其实说白了,就是这个我们的算法的输出的结果是个连续的值。如果输出不是个连续值而是个离散值那就叫分类。那什么叫做连续值呢?非常简单。
举个栗子:比如我告诉你我这里有间房子,这间房子有 40 平,在地铁口,然后你来猜一猜我的房子总共值多少钱?这就是连续值,因为房子可能值80万,也可能值 80.2 万,也可能值 80.111 万。再比如,我告诉你我有间房子,120 平,在地铁口,总共值 180 万,然后你来猜猜我这间房子会有几个卧室?那这就是离散值了。因为卧室的个数只可能是 1, 2, 3,4,充其量到 5 个封顶了,而且卧室个数也不可能是什么 1.1 , 2.9 个。所以呢,对于数据挖掘新手来说,你只要知道我要完成的任务是预测一个连续值的话,那这个任务就是回归。是离散值的话就是分类。
所以预测房价其实就是一种回归问题。而接下来要介绍的线性回归算法就是回归算法中的一种。