监督学习(Supervised Learning)是在监督者在场的情况下进行的,就像小孩子在老师的帮助下进行的学习一样。当孩子在老师的监督下被训练识别水果、颜色、数字时,这种方法就是监督学习。在这种方法中,孩子的每一步都由老师检查,孩子从他必须产生的输出中学习。
无监督学习(Unsupervised Learning)不需要监督者的帮助,就像鱼自己学会游泳一样,这是一个独立的学习过程。在此模型中,由于没有输出映射到输入,因此目标值是未知的/未标记的。系统需要自己从输入的数据中学习,并检测隐藏的模式。
| 监督学习 | 无监督学习 |
|---|---|
| 给定输入的输出是已知的。 | 给定输入的输出是未知的。 |
| 算法从标记的数据集中学习。这些数据有助于评估训练数据的准确性。 | 算法从未标记的数据集中学习,它试图在数据项之间找到模式和关联。 |
| 一种预测建模技术,可以准确预测未来的结果。 | 一种描述性建模技术,可以解释元素和元素历史之间的真实关系。 |
| 包括分类和回归算法。 | 包括聚类和关联规则学习算法。 |
| 监督学习的一些算法是线性回归、朴素贝叶斯和神经网络。 | 一些用于无监督学习的算法是K-Means聚类算法、Apriori算法等。 |
| 这种类型的学习相对复杂,因为它需要标记数据。 | 不太复杂,因为不需要理解和标记数据。 |
| 比无监督学习更准确,因为输入数据和相应的输出是已知的,机器只需要给出预测。 | 输入数据未标记,准确性较低。机器必须先理解和标记数据,然后给出预测。 |
| 一个在线数据分析过程,不需要人工交互。 | 对数据实时分析。 |

