4

学习机器学习一定要会推公式吗

 2 years ago
source link: https://www.v2ex.com/t/872116
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

V2EX  ›  程序员

学习机器学习一定要会推公式吗

  ligiggy · 10 小时 2 分钟前 · 2004 次点击

不推公式可以简单上手吗,比如可以把库拿过来就用?

然后,有无这类的上手书推荐。

34 条回复    2022-08-11 19:52:46 +08:00
LavaC

LavaC      9 小时 53 分钟前

可以试试 coding train 的 ml5.js 入门视频
Jooooooooo

Jooooooooo      9 小时 51 分钟前

这和 "编程一定要学网络技术, 操作系统之类的内容吗?" 是一样的问题.

我看来答案是 要学.

机器学习里一门相当重要的课是矩阵论, 先把这个学好吧.
hlpureboy

hlpureboy      9 小时 48 分钟前

如果只是玩玩的话,大概知道怎么回事就行惹,如果想明白具体的损失函数是怎么推出来的,那就得具体学学数学。
ligiggy

ligiggy      9 小时 48 分钟前

@hlpureboy 所以要怎么玩,我就只想玩玩看。
hlpureboy

hlpureboy      9 小时 39 分钟前

@ligiggy 你要具体做什么呀,定义好问题,找到 match 的领域,看看综述啥的,然后找一篇相关顶会论文跟着复现一下,在结合自己的具体问题调整就行惹。如果像是目标检测、图像分类这种问题很多人都讲解过了,跟着看视频就 ok 了
jarence

jarence      9 小时 16 分钟前

不需要公式推导的情况:要处理的问题有了非常成熟的解决方案以及大量有效的数据。现有很多 autoML 的框架,比如 AutoGluon ,只要数据够多且有效,那么基本没啥问题。
需要公式推导的情况:没有成熟的解决方案,或者需要做一些定制,又或者遇到了一些奇奇怪怪的问题。
czfy

czfy      9 小时 13 分钟前

推公式是什么意思?
ligiggy

ligiggy      9 小时 2 分钟前

@czfy 应该是有一个复杂的机器学习公式,推公式就是从原理开始讲,建造一个公式,然后一步一步推导到结果。
albert0yyyy

albert0yyyy      9 小时 1 分钟前

不用吧,pytorch 框架,
建个模型类,加载数据,前向传播函数调用,反向传播函数调用,看看准确度和损失函数输出

当然会推肯定是锦上添花的
ligiggy

ligiggy      9 小时 0 分钟前

@albert0yyyy 有书籍或者教程推荐吗?想玩玩
albert0yyyy

albert0yyyy      8 小时 59 分钟前

@albert0yyyy 要推的公式涉及到的也不是很多应该,矩阵运算,导数偏导数求导。好像就没了
kenvix

kenvix      8 小时 57 分钟前

初学推啥公式啊,又不是专门研究机器学习本身的。你用 java 还要把 jdk 代码全翻一遍不成?
albert0yyyy

albert0yyyy      8 小时 54 分钟前   ❤️ 1

@ligiggy
视频和书:动手学深度学习 pytorch (李沐)

想推公式:深度学习入门( 斋藤康毅)
pluvet

pluvet      8 小时 49 分钟前

只是用用的话不必。但是这样肯定找不到工作。
jmc891205

jmc891205      8 小时 19 分钟前

Deep Learning for Coders with Fastai and PyTorch
nightwitch

nightwitch      8 小时 2 分钟前 via Android

直接拿来用就叫用机器学习,不叫学习机器学习。。
DefoliationM

DefoliationM      7 小时 59 分钟前

只是用的话无所谓, 要自己写的话主要数学
ligiggy

ligiggy      7 小时 22 分钟前

@albert0yyyy 找到资料了,感谢!
MrZhaoyx

MrZhaoyx      6 小时 46 分钟前

推荐李航老师的《统计学习方法》
xiang578

xiang578      5 小时 57 分钟前

b 站上也有一个系列视频,手把手教你推公式:白板机器学习。
ligiggy

ligiggy      5 小时 15 分钟前

@xiang578 手把手也不喜欢推公式,过了这个年纪了。
tfdetang

tfdetang      4 小时 39 分钟前

机器学习从业者来回答这个问题: 一般只有要准备面试的时候才会去推公式
当然我比较水不能代表所有从业者。 其实大部分时候看论文什么的大概能看出是怎么回事,也能看懂就行了,关键是思路,很少真的去推公式
dabaisuv

dabaisuv      4 小时 25 分钟前

谷歌的机器学习:
aHR0cHM6Ly9kZXZlbG9wZXJzLmdvb2dsZS5jbi9tYWNoaW5lLWxlYXJuaW5nL2NyYXNoLWNvdXJzZS9tbC1pbnRybw==
ipwx

ipwx      3 小时 52 分钟前

分情况。

* 如果是用树算法处理工业数据,一般不需要推公式,调参就行。
* 如果用神经网络处理图片数据,一部分工作者不需要推公式,用 PyTorch 搞就行。
* 如果用神经网络处理自然语言,推公式的比重会增大。
* 如果处理的是无监督学习,或者顶会不怎么覆盖的新领域上做深度学习,那就得会大量原理性的东西,做各种 regularization ( loss / 结构),不会公式基本寸步难行。
ligiggy

ligiggy      3 小时 44 分钟前

@ipwx 为啥每次问问题,基本上大佬都能知道……太强了。
ligiggy

ligiggy      3 小时 43 分钟前

@ipwx 暂时我还没有应用场景,仅限于去了解一下玩玩,还没想当成自己的 工作技能。
ipwx

ipwx      3 小时 39 分钟前

@ligiggy 其实现在 DL 比较成熟的也就 CV/NLP 。

大量工业数据没那么规整的,各种不同量纲、不同单位、不同性质的 heterogeneous data ,一般用树算法更舒服。经典的比如 RandomForest ,新锐的比如 GBDT 。除了这些树算法,还有就是 Bagging / Boosting 算法的思想得了解一下。
ipwx

ipwx      3 小时 38 分钟前

@ligiggy 我上面举的这四个例子都不怎么需要推公式,工业数据上又比较万金油,投入产出比 DL 高。当然它们基本没法处理图片 /NLP ,CV/NLP 还是神经网络得天下。
ligiggy

ligiggy      3 小时 36 分钟前

@ipwx OK ,好的,有没有书推荐,我看了下楼上大佬推荐的 pytorch 教程,感觉挺不错的。
ipwx

ipwx      3 小时 32 分钟前

@ligiggy ummm 很遗憾我已经脱离教材很久了。。。(今年 phd 毕业了
xz410236056

xz410236056      3 小时 30 分钟前

“比如可以把库拿过来就用”
当然可以,但是你不会相关的数据你怎么设计自己的神经网络呢?你只能用别人封装好的网络啊。

https://mofanpy.com/learning-steps/
推荐个学习网站。
rpman

rpman      1 小时 11 分钟前 via iPhone

要搭神经网络总得会推公式,不然搭出来一坨

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK