2

10年了,这是中国科技圈最卷的一周!

 1 year ago
source link: https://news.iresearch.cn/content/202304/466680.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

10年了,这是中国科技圈最卷的一周!

来源:极客公园    作者:      2023年04月17日 10:06

几年之后再回首,人们可能会意识到,这个平平无奇的四月第三周,可能是中国 AI 史上的一个重要节点。

因为在这周,阿里、腾讯、字节、商汤、360 等互联网大厂,纷纷「祭出」自己的 AI 大语言模型及产品——「整个晋西北都乱成一锅粥了」。

自从几年前的「买菜大战」之后,中国互联网行业第一次这么热闹。

大概每一次历史潮流的开场,总是这么熙熙攘攘,令人猝不及防。

01.王小川开搞大模型,杠上老冤家

上周一,王小川宣布创建百川智能,启动资金 500 万美元,正式投入到了中国大模型建设的大军中,不少成员是在搜狗时的老伙伴。

他在媒体交流会中透露,公司已经开始训练 500 亿参数的大模型,年底前预计发布对标 GPT-3.5 的大模型。

「大家好像忘了,搜索也是一个人工智能的产品。」从搜狗一路走过来,王小川成为了国内大模型创业圈里炙手可热的人物。

要说他现在最着急什么,留在他公开信后的一长串招聘邮箱也许能说明问题,那就是人才!人才!

当然,这周最热闹的吃瓜现场,还要属王小川和百度互怼。

百度李彦宏:文心一言确实不如现在最好的 ChatGPT 版本,但差距也不是很大,可能就是一两个月的差别。

王小川:李彦宏生活在平行宇宙,文心一格与 ChatGPT 的差距绝对不是一两个月,而是三年。

百度副总肖阳:王小川脱离一线太久,和百度不在一个宇宙,对国内人工智能技术的发展缺乏了解。当年搜狗也立志取代百度搜索,结果也是显而易见的。

王小川:什么样的平行宇宙里,才能做到让一个脱离一线 15 年的人,去怼一个脱离一线 1.5 年的人。

现在王小重新创业,跟百度大厂的身份不一样了。

李彦宏说,大厂开始聚焦后,创业公司的机会便很少了,建议创业公司不要重复制造轮子。王小川则认为创业公司不会受固有业务限制,会比大公司跑得快。

看 NBA 的同学都知道,开场前双方队员来点「垃圾话」是惯例动作,没有才会令人奇怪。

真身离开一线多久不重要,重要的是,心要永远在前线上。

02.「通义千问」,全面改造阿里,钉钉打头阵

同一天,阿里正式推出大模型产品「通义千问」。这是阿里云大模型系列中的最新成员,既可以做多轮对话,也能做文生图等跨文字、图像等方面的应用,并能够和外部 API 进行互联。

这也是张勇在兼任阿里云智能集团 CEO 后,第一次在阿里云峰会带队露面,足见此次活动的意义。

张勇说,「面向 AI 时代,所有产品都值得用大模型重新升级。」首先接受改造的,是阿里自己的产品。

阿里宣布未来会将所有的业务都接入「通义千问」。首先接入「通义千问」的业务,是协同办公钉钉,以及智能音箱天猫精灵。

钉钉接入通义千问后,已经可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项。还有一些低代码方面的尝试,比如用户拍一张功能草图,能自动生成一个小程序。

不久前,阿里宣布将集团分拆成六大集团,所有业务接入,可见阿里决心之大。

阿里云未来还将推出「企业专属大模型」、「行业专属大模型」产品,在正式发布前,已经定向邀约企业客户开始内测,首批企业客户包括 OPPO、吉利汽车等。

「通义千问是既定路线中的一个节点,不是起点,也不是终点。」阿里云 CTO 周靖人如此定性通义千问。

当国内云计算市场开始增速放缓时,AI 大语言模型之战,重新「激活」了阿里云。

03.腾讯,要来「硬」的

上周五,腾讯云发布新一代 HCC(High-Performance Computing Cluster)高性能大模型计算集群,采用腾讯云星星海自研服务器,搭载英伟达最新代次 H800 GPU,服务器之间采用业界最高的 3.2T 超高互联带宽,号称是国内性能最强。

人工智能大模型训练,离不开高性能的算力集群。此前腾讯万亿参数的混元 NLP 大模型已经完成训练,基于上一代高性能算力集群,腾讯将自己大模型的训练时间,从 50 天缩短到 11 天。实测显示,新一代集群的算力性能较前代提升高达 3 倍。这也意味着如果基于此次发布的新一代集群,训练时间将进一步缩短至 4 天。

随着国内外厂商加速布局千亿级参数量的大模型,训练需求和推理需求也进一步增长。

模型再厉害,还是需要算力作为基础能力,相比于前几家,腾讯云走的低调,但有着深圳人「一心搞钱」的务实。

04.字节 AI,落子飞书

上周,字节跳动旗下办公软件飞书透露了一条视频,预告专属智能助手「My AI」。

在演示中,用户可以通过 My AI 总结生成会议纪要,并可根据会议纪要创建对应的待办事项,辅助用户规划后续工作。同时,该 AI 能够根据文档数据,生成报告等内容;并能够根据用户的编辑内容,进一步续写文档内容;以及协助用户创建会议、查询案例参考、进行头脑风暴、规划项目进程等。

从演示来看,「My AI」的定位并不是像 ChatGPT 的对话型 AI,而更类似微软推出的 Office Copilot,在工作上提供实际的帮助。

对于「先进企业」用的工具来说,如何让组织内沉淀下来的无数知识和信息,去主动找人,可能是团队下一步要格外关注的。而 更聪明的 AI 助理,绝对是个好抓手。

05.知乎 AI,迂回前进

周四,知乎发布「知海图 AI」中文大模型。

「知海图 AI」被运用进了知乎热榜中,首个大模型功能「热榜摘要」上线并开启内测。它能对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。

像知乎、小红书这样的中厂,跟大厂在业务有竞争,未来没办法安心使用大厂提供的大模型,那么他们该怎么办?

知乎给出了他们的答案:用联合研发与战略投资的方式,与国内大模型团队面壁智能合作,共同开发中文大模型。

06.商汤、京东和昆仑万维

上周二,商汤发布日日新 SenseNova 大模型,包括自然语言生成、文生图、感知模型标注以及模型研发功能。此外还推出自研中文语言大模型应用平台「商量」,除了文字创作和长文本处理能力外,还有提供辅助编码能力、以及基于医学专业知识的对话咨询。

昆仑万维和奇点智源合作自研的大语言模型——「天工」3.5 即将发布,会在下周一启动邀请测试。昆仑万维表示,「天工」大模型已经非常接近 OpenAI ChatGPT 的智能水平,未来「天工」4 和「天工」5 也将陆续诞生。

京东计划今年发布新一代产业大模型「言犀」,据称其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率 95%+、生成文字 30 亿 +。

07.一个彩蛋 马斯克,身体却很诚实

马斯克此前签署公开信呼吁暂停大模型的研究,这周就被爆出暗中推进 AIGC 项目。

据称他最近购买了约 1 万个 GPU,用于公司的两个数据中心之一。该项目涉及 AICG,推特将根据自己的海量数据进行训练。AIGC 可以增强推特的搜索功能或帮助重建其广告业务。

就在刚刚,他在美国内华达州成立了一家名为 X.AI 的人工智能公司。

马斯克还在招聘人才。自 2 月以来马斯克就已经和人工智能领域的人才进行接触,截至 3 月,他已经从谷歌的人工智能部门 DeepMind 聘请了两位工程师 Igor Babuschkin 和 Manuel Kroiss。

马斯克算是明白了,指责 OpenAI 变成 CloseAI 是没意义的,必须挽起袖子,自己打造真·OpenAI。

(文章为作者独立观点,不代表艾瑞网立场)

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK