5

这都不开除?字节跳动P0级事故:实习生删除GB以下所有模型

 2 years ago
source link: https://blog.csdn.net/m0_59163425/article/details/122702114
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

这都不开除?字节跳动P0级事故:实习生删除GB以下所有模型

original.png
小马不会过河 于 2022-01-26 14:53:35 发布 7914
专栏收录该内容
16 篇文章 1 订阅

昨晚脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型

**什么是lite模型?**该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。

当晚全公司通报,直接被列入 P0 事故等级(严重事故):

据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:

大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:

所以说一定要稳住别慌,问题不大。

有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。

还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。

我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。

而别的对手就权限不一了。

**到底删除了多少模型?**根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。

又有字节的工程师网友表示删除的都是离线数据,影响不大。该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。

实习生“立大功”

2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。

字节都有什么出名的机器学习产品?字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。

据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。

LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:
1. 高性能;
2. 支持模型功能多;
3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。
据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。

虽说如此,但程序里的bug是个玄学,有时哪怕某个小bug产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。但是,还是希望各位公司谨记「天干物燥,小心火烛」。
Python 易学难精,不是一朝一夕就能深入掌握。在这分享我珍藏的「 Python学习资料大合集」,系统地梳理了入门 Python 的必备知识点,同时奉上鄙人多年收集的优质学习资料,建议保存。希望这些能给大家的学习方向提供一些帮助。

一、Python学习路线汇总

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末!!!!

二、Python必备开发工具

三、精品Python学习书籍

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

四、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

五、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

六、Python练习题

检查学习结果。

七、面试刷题

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

这份完整版的Python全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码【100%免费获取】
watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5bCP6ams5LiN5Lya6L-H5rKz,size_20,color_FFFFFF,t_70,g_se,x_16#pic_center


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK