4

加入AI大战,商汤科技浴火重生?

 1 year ago
source link: https://awtmt.com/articles/3686218
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

加入AI大战,商汤科技浴火重生?

胡描 发表于 2023年04月11日 11:12
摘要:在这股AI大模型的风口中,5年亏损超438亿元的商汤科技,抢到了先机,推出了自研的AI大模型体系,站到了与阿里、百度、华为等巨头同台竞争的位置。但要成为中国版Open AI,商汤还差多远?

本文来自全天候科技,阅读更多请登陆www.awtmt.com或华尔街见闻APP。

作者|胡描 编辑|罗丽娟

发酵了一个季度,年初被ChatGPT引爆的AI大模型,在近期迎来了集中爆发。被誉为中国“AI四小龙”之一商汤科技,也抢到了先机,交出了自己的AI大模型体系——“日日新SenseNova”。

在4月10日的技术交流日上,商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”,AI文生图创作“秒画”、2D/3D数字人生成“如影”、大场景/小物体生成“琼宇”“格物”等一系列生成式AI模型及应用。

公开资料显示,其服务于大模型的AI大装置SenseCore,共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。甚至在英伟达A100的储存量上,商汤也达到了上万张,占到了与BAT同台竞争的位置上。

不过,强大的算力背后,商汤也付出了巨额的代价。据商汤财报,在2018年—2022年之间,其研发费用率从45.9%飙升至105%。在2022年,商汤全年净亏损60.45亿元。据公开数据, 2018年至今,商汤累计亏损达到了438亿元。

在资本“输血”的路径上,商汤与OpenAI有着相似之处。但不同于微软对后者的坚定支持,商汤扛着“AI第一股”的光环登上了港交所,又在半年后,上市前投资者、基石投资者股权解禁时,迎来了投资者的退出套现,股价下挫,市值腰斩。

ChatGPT刮起的AI大模型热潮,无疑是商汤的一次跃升机会,而商汤又会如何抓住呢?

01 商量,能力如何?

在4月10日的发布会上,商汤一口气展示了多个产品。

在“日日新”这个大模型体系下,商汤有与ChatGPT相似产品“商量”(SenseChat)。这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

在现场,徐立演示了其创作广告语,与用户一人一句续写儿童故事,解答法律、医疗问题,编程等功能。

将超长文本《专利法》“投喂”给“商量”后,再向它提问。可以看到,“商量”能够理解《专利法》的文本,而后对用户的问题进行解答,回答的内容并非复制《专利法》的大段内容。

62d5faa6-556f-4d71-8b55-6c455051b12d.png

在医疗咨询上,当用户提出症状后,“商量”并没有给出病情诊断。而是进行多次询问,根据用户的患病时长、其他症状等,才给出了可能的病症和求医科室建议,更加类似人工的问诊。

图片

商汤表示,目前“问诊助手”功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。

在编程的能力上,徐立表示,内部实测代码编写效率提升62%,在HumanEval测试集上,准确率达到了40.2%。在AI的辅助下,新一代软件开发的”二八定律”正在形成,未来将会是80%AI生成+20%人工。

1b95b75d-b0c1-4f6f-9feb-40f5565c5de2.jpeg

目前,“商量”还未开启内测,其能力对比ChatGPT、文心一言如何,还需要后续观察。不过,发布会上,商汤还展示出了其他让人眼前一亮的生成式AI模型及应用。

“秒画”为文生图创作平台,它的逻辑与Midjourney类似,用户选定风格后,输入提示词即可生成相应的图片。其一大亮点在于可以由用户自添加批量图片,自训练图片风格。

在展示中,徐立尝试创作一副港风美女图,在平台自生成效果并不如意后,在平台自添加进了数十张八九十年代香港女星照片。而后“秒画”生成的图片风格便更接近于用户想要的效果。

图片

据商汤方面介绍,“秒画”可以做到2秒生成1张512K分辨率的图片,用户可基于单卡A100自训练。基于平台发布的模型,可设置to B服务API(应用程序编程接口),结合商汤大算力对外提供服务。

“如影”是商汤推出的AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

aeddf077-d4b7-4735-bb48-6fb35e7b2ed9.gif

在应用场景中,不乏直播带货、名师教学、宣传视频、短视频等。

“琼宇”、“格物”均为3D内容生成平台,分别指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于3D内容生成技术实现对空间、物体的复刻与交互,快速生成大到城市、小到花朵的建模。

5851e244-9b67-4c69-a258-4907043e33cf.jpeg

商汤方便表示,两者结合,可以高效、低成本生成大规模的三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间,可在商业广告、直播间等场景下应用。

从几款产品展示出来的效果来看,商汤的图片生成能力、打造数字人能力,以及制作视频,3D建模的能力,都达到了不错的效果。

不过,作为面向B端的技术,目前“日日新”大模型体系开放面向政企客户的API接口。何时开放内测,还未能确定。

02 商汤的“底气”

在国内,商汤可能是最早将人工智能大模型写入招股说明书的上市公司。作为中国“AI四小龙”之一,商汤对AI大模型的研发,也并非起于当下。

在2019年时,商汤便推出了10亿参数量规模的视觉模型,彼时,商汤已经使用了上千张GPU卡进行单任务训练。在过去两年里,商汤还训练了百亿参数规模的超大视觉模型。

在今年3月,商汤又推出了多模态多任务通用大模型书生(INTERN)2.5,具有30亿参数。

训练这些模型的基础,包括当前推出的大模型“日日新”,均得益于商汤AI大装置SenseCore的搭建。

在2015年,商汤开始研发深度学习训练框架SenseParrots,并逐渐以此为核心、持续研发,搭建起了AI基础设施SenseCore。据2022年财报,SenseCore AI大装置基于2.7万块GPU的并行计算,系统实现了5.0 exaFLOPS的算力输出,可支持最多20个千亿参数量超大模型(以千卡并行)同时训练。

到目前,SenseCore已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。 

这一轮国内的AI大模型竞争中,算力竞争是一个十分重要的元素。

商汤联合创始人、首席科学家王晓刚曾表示,2021 年,商汤在上海的临港建立了AIDC的超算中心,有5000P 的算力,1万块的A100,而且可以实行数千卡的大规模的并行的训练。

9c83b707-efde-4ce6-a2b2-c769a34ad6e3.jpeg

商汤公布的一份纪要中提到,要训练像ChatGPT这样的生成式AI,所需的算力至少需要1万张英伟达A100加速卡的支持。在目前,国内只有6家公司具备这样的硬件实力,分别为商汤、百度、腾讯、字节、阿里、幻方。

这也意味着,在算力的硬件储备上,商汤站到了与BAT同台竞争的位置上。

此外,不仅是英伟达的专用显卡,商汤也在采购并适配国产的GPU。

在去年,商汤已在AI大装置中适配了许多寒武纪、海光的GPU卡。消息人士表示,商汤AI大装置当前的算力中,有10%左右的算力,是由国产GPU卡提供的,商汤也一直在进行适配。

不过,相比于资金实力更加雄厚的大厂,商汤仍有不小的差距。相关消息显示,当前阿里云云上至少有上万张A100,整体能够达到10万张,阿里集团所拥有的量级为阿里云的5倍。

短期来看,商汤在国内AI大模型研发上算力不弱。但从长期来看,商汤如何能持续获得高端GPU,如A100、A800,存在不确定性。

毋庸置疑的是,国内的AI大模型正在开展一场“追逐战”,百度的文心一言、阿里的通义千问、华为的盘古、京东言犀,以及商汤的日日新纷纷加入战场。在未来,或还将有更多的“入局者”。

中国到底需要多少个AI大模型?氪信科技CEO、粤港澳大湾区数字经济研究院计算金融CTO工作室负责人朱明杰曾告诉全天候科技,AI大模型是一个基础设施,可以理解智能手机时代中的手机系统,如iOS、安卓。朱明杰认为,AI行业不需要太多的“系统”。

而从当前来看,“入局者”们都不想放过成为AI“顶层设计者”的可能性。这场争分夺秒的追逐战,也难以避免。

03 亏钱能力堪比openAI?

相比之下,商汤比起入局的互联网、科技巨头而言,还有许多“内忧”未曾解决。

商汤基础设施优势的代价,是高比例的研发投入。

在2022年,商汤在研发支出上合计40亿元,同比增长11%;研发人效相比去年进一步提高90%,人均每年研发模型数9.35个;累计商用模型数提高了93%至6.7万个。截至2022年12月31日,公司的研发队伍达3466人,占员工总数的68%。

但高昂的研发投入,暂时还未“兑换”成同等比例的营收,商汤仍在持续亏损。

据财报显示,在2022年商汤净亏损60.93亿元。在2018年至2022年5年中,商汤累计亏损总金额达438亿元。

78e01e0d-52f0-4529-b651-3cc55acd669e.png

商汤能够发展至今并在2021年底登陆港交所,一定程度上离不开“资本输血”。在上市前,商汤经历了12轮融资,累计融资金额达到了52.2亿美元,在它的背后,曾经站着软银、阿里、银湖、IDG、中国国有企业结构调整基金、上海国际集团、赛领、鼎晖等资本方。

这似乎也与OpenAI的成长路径有所相似。

在2019年,微软宣布和OpenAI建立独家合作伙伴关系,投资总额10亿美元。这笔资金放在如今爆火的AI行业来看,也是一笔“巨款”。而10亿美元还只是开始,截至目前,微软多次注资,已陆续向OpenAI投资130亿美元。在当前,OpenAI估值接近300亿美元。

相比于投入的金额,当前OpenAI的营收还微不足道。根据研究机构PitchBook的数据,OpenAI今年有望产生2亿美元的收入,较2022年增长150%。

但不同于微软对OpenAI坚定的支持,商汤已经经历了投资人的撤离变现。

在去年6月30日,商汤科技上市前投资者、基石投资者股权基本解禁,涉及股份占公司总股本的73%。在短短一天之内,商汤科技的市值蒸发了915亿港元。而后半年,阿里、软银、环球资本等投资方已纷纷减持套现。

今年以来,在AI大模型热潮之下,商汤的股价有所回温。当前的市值为1104亿港元,距离最高时的3200亿港元,仍有2000亿的差距。

商汤的确抢到了AI大模型的先机,但作为一家市场化的企业,在发力“日日新”大模型体系的同时,商汤更需要推进自身业务结构转型。

截至2022年末,商汤的业务主要分为智慧生活、智慧城市、智能汽车、智慧商业四大板块。其中,智慧生活与智能汽车增速显著,但智慧商业、智慧城市下滑也十分明显。在过去一年中,增长业务并未拉齐下滑业务,商汤实现营业收入38.09亿元,同比下降18.97%。

目前,商汤的“日日新”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市四业务板块。但大模型能够为这四块业务带来多少的增值,也还有待市场检验。

46dca52f-5839-4c71-8718-5ec0ec76a7b8.png
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK