2

AI 普惠,vivo 为先

 8 months ago
source link: https://www.ifanr.com/1572008
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

如果要评选过去三年里最重要的发明,那 ChatGPT 的票数无疑会遥遥领先。

自 2022 年 11 月 30 日以来,ChatGPT 已经上线 400 天了,从质疑到讶异再到恐慌和振奋,已经没有人会否认大语言模型带来的 AI 产业革命,是下一个千亿美元级别的机会。

1280X1280.jpeg!720

▲ AI 绘制的钨丝灯泡发明场景. 图片来自:BlueLM

1831 年,迈克尔·法拉第发现了电磁感应,造就了发电机的发明。近半个世纪之后,托马斯·爱迪生发明了能够长久照明的钨丝灯泡,真正推动了电力在工作与生活中的广泛使用。

如果说 ChatGPT 打开了 AI 技术的应用思路,那么大语言模型时代的钨丝灯泡在哪里?

对于 vivo 的用户来说,可能就在自己的手机里。

1280X1280-111JPEG.jpeg!720

AI 不该是少数人能施的魔法,而是更多人能享受的普惠

当我们聊起 ChatGPT 的时候,许多人聊的不是怎么去用 AI 提升生产力,而是怎么注册一个新账号。

受多重因素叠加影响,ChatGPT 不是一个信手拈来、唾手可得的工具,如果具体到我们日常生活中,尤其是形影不离的手机上,会发现虽然 AI 大模型的发展态势喜人,但真正好用的产品并不多——绝大多数大模型都属于「心愿单」排队的阶段,你需要申请内测才有机会用上,而且在使用时,他们可能会占掉你一整个屏幕,在应用之间反复横跳几次就体验全无。

这也是为什么 vivo 蓝心大模型值得关注的原因,这个由 vivo 自主研发的通用大模型已经接入到旗下最新的 OriginOS 4 中,下半年发布的 vivo X100 系列、iQOO 12 系列、iQOO Neo 系列和 S18 系列已经实装了这个系统,并搭载了蓝心小 V 人工智能助理,开机就能用。

1280X1280-3.png!720

跟其他大模型应用相比,根植于系统底层的蓝心小 V 采用了一个很有趣的设计——在手机屏幕边缘滑动就可以呼出,有一个专门的大模型聊天窗口,占用屏幕约三分之一的尺寸。你可以很方便地在这个窗口向小 V 发起咨询,无论是文生文、文生图还是图生图都能胜任,也可以实现全局的图片、文件检索,并且直接可以从小 V 的聊天框拖拽文件到微信、Word 里,用起来非常方便。

1280X1280-11111.jpeg!720

易使用、查询准的优异表现,依靠的是 vivo 蓝心大模型背后颇高的完成度。

考虑到智能手机是主要的产品体验入口,且使用场景复杂,因此蓝心大模型一开始就不是孤军作战,而是由五个不同参数的模型组合起来的大模型矩阵——覆盖 10 亿、70 亿、700 亿、1300 亿和 1750 亿五个参数量级。

其中,10 亿量级模型是主要面向端侧场景打造的专业文本大模型,具备本地化的文本总结、摘要等能力;70 亿模型是面向手机打造的端云两用模型,具有优秀的语言理解、文本创作能力;而 700 亿模型以及参数量级破千亿的模型,则是面向云端服务的主力模型,在 C-Eval、CMMLU、SuperCLUE 等榜单的 10 月测试结果中,均处于中文大模型的第一梯队。

现阶段,10 亿跟 70 亿两个参数的模型已经在多款 vivo 手机中实装,支持高通和 MTK 双芯片平台的部署,用来提炼文案、生成图片甚至梳理脑图,都是不错的选择。

8625e5cf-9a59-48b2-b78e-a75bc229dea0.png!720

这是综合考虑手机能耗、响应速度和使用安全等各方面之后权衡的结果,日常使用响应速度非常快。微信聊天时经常会聊到一些新知识点,这时候边缘右划调出蓝心小 V 科普一下或做个脑图会非常方便,后续随着更高参数大模型的开放,蓝心小 V 也有着更多的进化空间。

当然,vivo 也知道在日新月异的行业趋势面前,开源能够帮助蓝心大模型走得更远。目前,vivo 已经宣布将开源 70 亿参数量级的蓝心大模型 7B,这个模型采用了 2.6 万亿的 token 数进行训练,以中英文语料为主,是更适合中文情景下使用的产品。日后,说不定我们可以在许多 vivo 之外的产品上用上蓝心大模型,而这些宝贵的使用场景,也将促进蓝心大模型的迭代。

这些也是 vivo 蓝心大模型特质的具体表现——大而全、算法强、真安全、自进化、广开源。

9267c8e5-2857-4739-86a8-eb60a497f823.png!720

为了让更多人直接体验到蓝心大模型,2024 新年伊始,vivo 就在上海、深圳、广州、杭州、武汉、南京等多个城市开启了蓝心大模型的线下体验活动。这也是第一次有厂商做大规模面向普通用户的 AI 体验活动,侧面也反映了 vivo 对蓝心大模型的自信。

用户可以通过手机快速让蓝心大模型画出新年心愿卡、写新年祝福语、生成新年头像等,这些都是过新年要花不少时间去张罗的工作,但 AI 的加入让这件事变得高效又有趣起来。vivo 用浅显易懂的方式,直接把大模型的使用场景带到用户面前。

jp3.jpg!720

vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围表示:

我们举办这次活动,是希望有很多的人,可以了解最先进的人工智能技术和产品,用上蓝心小 V,帮助大家有更轻松地学习,更高效地工作和更美好的生活体验。

6 年时间、千人团队和不断地投入、创新和突破,才有了综合得分第一的蓝心大模型,我们希望实现 AI 普惠,真切地帮助到更多的人,共同促成生活与社会的进步。

试想一下,当搭载大模型的手机,在学习用户操作习惯之后,将不仅仅是通信工具,也能成为你的健康管理助手、旅行指南、购物推荐等——让生活更加便捷舒适,最终成为你的私人助理。同时大模型还将学会使用手机里的各类 app,比如制订旅行攻略、预订更合适的机票酒店;在购物时全程双向沟通,辅助用户挑选到心仪商品等,深入用户生活的方方面面,让 AI 真正走进千家万户。

如果你不在这些城市,也没有 vivo 手机,还可以下载「蓝心千询」app——这是 vivo 基于蓝心大模型开发的 AI 助理。相较蓝心小 V,虽然少了一些系统全局调用的能力,但同样可以体验到蓝心大模型的文生文、文生图等各项实用功能,支持 iOS 和 Android 双端,完全免费且无广告。

aa9965e1-ca70-460d-a040-683f339db50a.jpeg!720

基于 AI 技术的应用,vivo 也不止于让大语言模型担任个人助理。

得益于蓝心大模型, OriginOS 4 更新了「vivo 看见」和「vivo 读谱」两个面向视障群体的无障碍能力——

其中,vivo 看见是一款支持环境描述、物品查找和拍摄辅助的视觉辅助产品,蓝心大模型的识图和理解能力,可以在多种场景下助力用户识别信息,并给出直观的描述,对于视障人士的日常生活非常有帮助。

a19d504a-a0f6-4200-9b63-51fb90329e3b.png!720

而 vivo 读谱则拥有本地乐谱便捷导入、听曲成谱、乐谱朗读等能力,对于许多视障用户而言,音乐是理解世界的重要途径,有了大模型能力的支持,一个人也能享受音乐学习的乐趣。

12cd4034-2f90-436b-893c-d9339a7697b2.png!720

在 vivo 看来,好产品必然是普惠的,即便是到了 AI 时代,我们依然能在 vivo 的产品理念和设计中找到这家公司一以贯之的人情味。

手机行业的长跑选手,在正确的赛道上先跑起来

自 2011 年进入智能手机市场至今,vivo 是手机行业的长跑型选手。

这家将「本分」根植于文化基因中的企业,当遇见长坡厚雪的赛道时,也会是最先跑起来的那一个。

c72ca70e-8a7c-4319-abd6-8f618df2fe73.jpeg!720

实际上,自发布到落地,vivo 蓝心大模型只花了 60 天就在四个系列八款手机上部署,并且随着 OriginOS 4 的升级接入到更多的产品当中,放眼全球也是独一档的速度。

显然,人工智能就是那个千载难逢的机会,而 vivo 早在五年前就已经预见了。

2018 年的世界人工智能大会上,vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围预测,手机行业将在两年后迎来变革,将会成为一个「自学习、自索引、自推荐的智能终端」——当时,AI 化的手机成为影像手机之后,vivo 又一个重金押注的赛道。

af1e0b27-2faf-4aad-a090-530400472026.png!720

就在大会前两个月,vivo 宣布在深圳、北京、杭州、南京以及美国圣地亚哥,投资建立「vivo AI 全球研究院」,进行人工智能领域基础科学和颠覆式技术的创新研究,是中国第一个建立 AI 全球研究院的手机厂商。

也是在这一年,OpenAI 发表了题为《通过生成式预训练提高语言理解能力》(Improving Language Understanding by Generative Pre-Training)的论文,在其中首次介绍了基于转换器的生成式预训练模型系统(Generative Pre-trained Transformer),简称 GPT。

彼时的 vivo 不会想到,五年后,GPT 会成为奠定万亿美金产业的基石,但就在那时,vivo 已经意识到人工智能的本质——那就是信息交互方式的决定性变化。周围曾在演讲中提到:

它是一个金字塔,简单的说,人工智能是通过数据 + 算法,得到新的数据,最重要的是,精确识别出场景,把消费者需要的服务,精准、按时、按需推送给消费者,这个过程就是人工智能。

手机在出厂的时候,就内置了超过 100 个功能与服务,而随着技术的发展,这些功能将会全部被 AI 化——计算摄影是手机相机的 AI 化,蓝心小 V 则是语音搜索的 AI 化。人工智能的发展源流,就是 AI 从这些服务和能力的基础设施,变成这些服务和能力本身的历史。

1098ad1a-999f-4484-bfde-fbc67a8cfec1.jpeg!720

尽管智能手机的进化才刚刚开始,但经过五年的积淀,vivo 已经在人工智能这条赛道上跑了很远。人工智能技术最需要积累的能力有四个——数据、人力、算法、算力。

在数据方面,2018 年 vivo 成立了图谱研究院,通过专业团队建设知识图谱,目前已积累了超过 2800TB 的数据;

在人力方面,vivo 从 2017 年开始就一直维持着一支 1000 人规模的专业人工智能团队,其中有超过 600 人专注研发大模型;

在算法层面,vivo 累计发表了 70 多篇人工智能相关论文,其中很多应用成果我们在 vivo 手机上已经可以用上了;

在算力层面,vivo 已经储备了能够训练出千亿级大模型的算力系统,并且在中文大模型领域已经有先发优势。

去年的这个时候,vivo 创始人沈炜在线上年会上发表了《埋头种因,基业长青》的致辞。这八个字,也可以说是 vivo 这家公司的真实写照。今天我们看到 vivo 手机中的优势能力,本质上都是这家企业十几年来埋头种下的因——设计如此,影像如此,AI 也是如此。

476ac2c7-3c3d-4895-8f56-f83b4bd74a0a.jpeg!720

十年前,拍照还是一个高门槛的技术活,你需要买镜头选机身,还要学布光懂构图,拍好照片,后期也是一个大工程。但如今,你用 vivo X100 Pro 就可以拍出不逊于相机品质的照片,一部手机里有多个焦段的镜头,且按下快门后,无需软件后期就可以有好看的色彩影调和虚化效果——某种意义上讲,这也是一种技术普惠。

全球有数亿人,他们可能是因为产品设计、影像或性能,选择使用 vivo 的产品,他们是 vivo 在智能手机时代的同行者。未来,也会是这家公司在 AI 普惠时代的受益者。

因为我们都知道,这家信奉长期主义的公司,他们最好的时候不在当下,而在未来。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK