如何假装你懂机器学习？

AI梗图，早期的“AI”，是大量手写的规则（hand crafted rules），而眼下我们讨论AI，通常是在讨论机器学习，在理清机器学习领域的诸多概念之前，我们先来白话一下机器学习的本质。

机器学习的本质是：寻找一个函数。

（重要的事情说三遍）

01 “函数”

函数是什么就不解释了，我2岁的表弟都知道。

我们可以使用一个线性函数（例如：f(x)=a*x+b）来解决一个简单的问题，这就是我们常听到的“线性回归”。

我们也不一定使用线性函数，因为世界规律不一定是线性的，例如，我们可以使用Logistic函数，这就是我们常听到的“逻辑回归”。

我们还可以把线性函数替换成Sigmoid函数、ReLU函数，并且把一批此类函数组合在一起，这就是我们常听到的“神经网络”。

我们还可以把更多的神经网络叠成不同的层，上一层的输出作为下一层的输入，这就是我们常听到的“深度神经网络”。（你耳熟能详的GPT，也属于深度神经网络）

如果你觉得神经网络、深度神经网络概念还是有点复杂，那么在宏观上，你也可以把他们整体看成是一个“大函数”，一个可以拥有亿万个参数的函数。

以上，实际上是从模型层面对机器学习进行归类。

02 “寻找”

这个寻找，就是确定参数值的数学过程（例如：确定f(x)=a*x+b中的a和b的值），用fancy的词来说，就叫做“学习”，或者也可以叫做“训练”，它们基本上是一个意思。

确定参数值的过程中使用的数据，就叫做“训练数据”，训练数据通常包含成对的函数输入值x，和函数输出值f(x)，函数输出值我们也称为“标签”或“Label”，使用带标签的数据进行训练的过程，就叫“监督学习”。

使用一部分带标签的数据和一部分不带标签的数据进行训练，这就是我们常听到的“半监督学习”。

完全使用不带标签的数据进行训练，这就是我们常听到的“无监督学习”。

以上，实际上是从训练层面对机器学习进行归类。

03 其他

当然，我们还可以从任务层面对机器学习进行分类，将其分为Regression, Classification, Structured Learning，这个太简单，不赘述了。

下面是我整理的思维导图，hope u find it informative！

如何假装你懂机器学习？ - Morven.Huang