1

如何假装你懂机器学习? - Morven.Huang

 1 year ago
source link: https://www.cnblogs.com/morvenhuang/p/17384381.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

如何假装你懂机器学习?

10907-20230509110804101-455102334.jpg

AI梗图,早期的“AI”,是大量手写的规则(hand crafted rules),而眼下我们讨论AI,通常是在讨论机器学习,在理清机器学习领域的诸多概念之前,我们先来白话一下机器学习的本质。

机器学习的本质是:寻找一个函数。

机器学习的本质是:寻找一个函数。

机器学习的本质是:寻找一个函数。

(重要的事情说三遍)

0函数

函数是什么就不解释了,我2岁的表弟都知道。

我们可以使用一个线性函数(例如:f(x)=a*x+b)来解决一个简单的问题,这就是我们常听到的“线性回归”。

我们也不一定使用线性函数,因为世界规律不一定是线性的,例如,我们可以使用Logistic函数,这就是我们常听到的“逻辑回归”。

我们还可以把线性函数替换成Sigmoid函数、ReLU函数,并且把一批此类函数组合在一起,这就是我们常听到的“神经网络”。

我们还可以把更多的神经网络叠成不同的层,上一层的输出作为下一层的输入,这就是我们常听到的“深度神经网络”。(你耳熟能详的GPT,也属于深度神经网络)

如果你觉得神经网络、深度神经网络概念还是有点复杂,那么在宏观上,你也可以把他们整体看成是一个“大函数”,一个可以拥有亿万个参数的函数。

以上,实际上是从模型层面对机器学习进行归类。

02 “寻找”

这个寻找,就是确定参数值的数学过程(例如:确定f(x)=a*x+b中的a和b的值),用fancy的词来说,就叫做“学习”,或者也可以叫做“训练”,它们基本上是一个意思。

确定参数值的过程中使用的数据,就叫做“训练数据”,训练数据通常包含成对的函数输入值x,和函数输出值f(x),函数输出值我们也称为“标签”或“Label”,使用带标签的数据进行训练的过程,就叫“监督学习”。

使用一部分带标签的数据和一部分不带标签的数据进行训练,这就是我们常听到的“半监督学习”。

完全使用不带标签的数据进行训练,这就是我们常听到的“无监督学习”。

以上,实际上是从训练层面对机器学习进行归类。

03 其他

当然,我们还可以从任务层面对机器学习进行分类,将其分为Regression, Classification, Structured Learning,这个太简单,不赘述了。

下面是我整理的思维导图,hope u find it informative!

10907-20230509111711781-471547779.png

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK