1

如果大模型不可靠,那钉钉的解药是什么?

 10 months ago
source link: https://www.geekpark.net/news/323579
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

如果大模型不可靠,那钉钉的解药是什么? | 极客公园

d43cf51c9fe7303bc74e1bd761327f95.png

是快,还是疯?

最近两周,钉钉异常活跃,看点频频。从成为阿里集团独立业务的消息开始,到发布个人版,8 月 22 日钉钉又宣布推出 AI PaaS 及其最新的 AI 应用——数字员工。在今年这一波大模型技术浪潮中,而钉钉给外界的感觉是:快。从 4 月发布的一条「斜杠」开始,钉钉相继发布文档、IM、会议、低代码、Teambition、脑图等各个场景下的「+AI」功能,最新的 AI 应用是钉钉个人版和数字员工。钉钉方面表示,在大会前,已经完成了 17 条产品线、55 大场景的智能化改造。此次钉钉总裁叶军提出,面向生态伙伴和客户开放智能化底座 AI PaaS,表示将用大模型帮助生态把产品重新做一遍。但,快不一定等于有序。前几个月,钉钉的产品功能迭代,更像是一个个独立产品「+AI」的过程。这种一窝蜂的快的背后,到底怎么思考钉钉在大模型链条中的位置?有没有壁垒、怎么认知用户所关心的实用性、数据隐私等关键问题?极客公园独家采访了叶军与钉钉首席产品官齐俊生。叶军认为,AI 现阶段的「主要矛盾」是用户对大模型的高期待,和大模型本身能力之间的差距。在齐俊生看来,「从落地角度,这的确有一个从技术到实际应用的落差。坦白讲,整体体系逻辑,我们一开始确实没完全想明白,但钉钉有创业文化,团队先跑起来总不会错。于是钉钉全线产品都接入大模型在试,这个试的过程很关键,让我们逐步想明白钉钉智能化的目标、价值和路线,也沉淀诞生了 AI PaaS 这种底座。」大模型虽然在快速进化,但目前还存在很多不可靠问题,钉钉怎么解这道题?他回应,经过 100 多天、十几款产品的摸索,钉钉逐渐把智能化的路径趟出来了,依托 AI PaaS 的底座,和「魔法棒」统一的 LUI 入口,钉钉正在从原来的提供生产力工具,转向追求直接给客户输出生产力

01 从工具,到创造工具

AI PaaS 和数字员工,是钉钉想明白智能化顶层设计逐渐清晰后的一次落地。这是钉钉发展中的一次关键价值转变。数字员工,是钉钉推出的一种新的 AI 应用形态。在钉钉的理解中,数字员工可以被拉入群,被「@」,还可以使用工具做任务,甚至可以不断学习、扩展新技能。最为关键的,它能被赋予权限,参与到业务流程中去。比如,在面对诸如写招聘 JD,安排面试,甚至候选人推荐、能力分析这样的问题,一位「HR 数字员工」可以即便在下班时间,也能 7x24 实时秒回,并根据提问者的自身情况精准作答,甚至会依据 1 号直聘(钉钉合作伙伴)的沉淀的行业数据,给出候选人的能力分析。

83e5e130207e6e3b2886c7e4153e7226.jpeg

钉钉总裁叶军介绍数字员工|钉钉

拟人化的数字员工,是钉钉认为的一种「价值很直观|的产品形态。齐俊生认为,「去讲 AI 辅助创新,去讲自然语言交互带来产品升级,给客户的价值并不直观。但换成雇几个招聘、财务、IT 的数字员工,就能帮助几个人解决过去几十人解决不了的问题,客户瞬间听懂了。」当然,在钉钉上,AI 与用户交互的方式和应用形态,不只是数字员工这一种,还有比如在钉钉音视频会议中,「数字分身」可以代替用户出席会议,帮助用户了解会议的重要信息,会后还可以推送会议总结;点餐拼单场景,用户可以在钉钉群内用自然语言点单、拼单,无需离开群聊一键付款;「AI 小助教」则可以帮助教师智能批改作业、沉淀学情数据,生成备课建议和讲解用的 PPT 等。这么多场景里的「AI 生产力」,虽然来自不同的软件服务商,但都源于一个共同的技术底座——AI PaaS。借助它,钉钉生态的 ISV 和企业客户的 IT 部门,可以开发各种场景下的「AI 生产力」。就像前文展示的,饿了么基于这一底座做了拼单助手,蜜蜂家校做了 AI 小助教助手;1 号直聘做了数字员工;钉钉自己做了会议助手。这是底层逻辑的转变。在之前,钉钉给人们的认知是提供 AI 生产力工具,来帮企业解放生产力;现在钉钉造了一个 AI PaaS,来让生态、客户,可以创造 AI 生产力工具。

02 大模型之痛的钉钉解法

AI PaaS,原理是是一个技术平台,简言之是提供了一个将 AI 开发、训练的过程,进行标准化、简单化的规范。其目的,是让 SaaS、软件接入 AI,或者训练专属数据模型更容易。叶军介绍,如果说过去几个月,钉钉是在自己「+大模型」,现在的 AI PaaS,是钉钉来帮助生态伙伴「+大模型」更进一步。

6dbc931d43aca57ad2299b3b334e84ba.png

钉钉总裁叶军解释 AI PaaS 详情|钉钉

这一逻辑自然没错。但关键问题是同样是「+大模型」,为什么 ISV 需要 AI PaaS,而不是直接合作大模型厂商?最核心的原因,是当前的大模型还在快速进化中,远还没到人们想象中那样无所不能。即便是有 OpenAI 加持、工程化能力最为出众的微软,也不得不面对一系列「+大模型」的现实问题。例如,震撼世界的 Copilot 系列产品,直到概念片发布的 4 个月后,才以高出普通版 40% 的价格向一些大客户开放一部分功能,而要实现概念片里的全部效果,取决于大模型和工程化两方面能力的再进化。日前,业内有消息称,微软新版 Windows 和 PC 厂商合作的订单正在洽谈延期发布,因为前者没有按计划如期推进。再或者,几个月前刷屏的 AutoGPT,作为大模型应用之一——Agent 领域的代表,也被众多用户吐槽,「实际上用不起来」。Demo 演示的使用场景看起来很流畅,可以自主使用工具帮助用户完成任务,但 Demo「可能是从 1000 个使用场景里面挑了一个最好用的,剩下的 900 多个,大部分都没法用」。而在钉钉看来,今天 AI 的「主要矛盾」是用户日益增长的对大模型的期待,和大模型本身能力之间的差距。齐俊生表示,大模型的演进从外界看,迭代速度是很快,但真正到了深水区,特别是要落到 To B 领域,就必须保持客观理性的态度去使用它。他举例,比如财务场景、法务场景,是不允许出错的。To C 看上限、看想象空间,To B 更强调下限强调可靠。「只有客观先以理性的态度和严谨的路径去推进大模型的落地,才能更有效地通过工程化等能力提升他的准确性、可靠性和易用性。」客户侧的反应也侧面验证这一观点。在钉钉向企业客户邀测的 4 个月里,邀测客户呼声最高的是类似问答机器人、知识库机器人这样能高效解决问题的 AI 功能,它们能直接进知识库阅读文档,输出相比大模型更为准确结果。他的直观感受是:客户在提升效率、辅助决策的场景对大模型有期待,甚至希望大模型可以解决原先专家决策类问题——诸如「你看我这一百个项目里哪个风险最高」。这是他眼中的 AI PaaS 的必要性所在。

03 试错试出来的系统设计

AI PaaS,被齐俊生认为是钉钉在 AI 发展中最具竞争力的壁垒,也是发挥钉钉业务场景、数据价值的核心优势。其核心在于工程化能力,包含对大模型的上下文、记忆、推理、预处理等能力的「抽象」,以及数据安全、性能等问题。有了 AI PaaS,钉钉下接大模型能力,上接千行百业的用户真实需求,让大模型的能力可以更简单的进入企业场景。钉钉里的生态 ISV 和企业 IT 部门只需要按照 AI PaaS 所定义的流程、规范,就可以训练专属数据模型、开发 AI 技能,不必烦恼「怎么才能使开发的应用具备大模型的推理能力」,「怎么让训练完的数据突然『懂行』」在 AI PaaS 之上,是钉钉伙伴伙伴甚至客户所开发的各种 AI 技能,这些技能按不同需求组合后,可以以不同的形态与用户交互,包括拟人化的数字员工,场景化的 AI 如聊天 AI、文档 AI、会议 AI,和行业化的 AI 如 AI 助教。

c48ad46657bf58c89cc0185164c23dd8.png

钉钉公布的智能化产品体系|钉钉

这是钉钉团队在想清楚后,对于智能化的整体思考输出——一个囊括 AI 定价、底模型交互调度、数据训练、AI 应用开发、技能体系,以及最终面向用户的数字员工、智能助手等产品形态的系统设计。这一套设计被钉钉称为「魔法棒套件」,类似于微软不仅有 Copilot 的 AI 交互方式,也设计了更后台的 Grounding(落地)、Graph(图谱)等等,与之不同的,是钉钉正在将这一套逻辑开放给生态伙伴,且一同还带着钉钉上丰富的应用场景。在智能化系统设计的摸索过程中,钉钉也陆陆续续解决了重新设计交互、重新评估模型的「底线」、重新组织 AI 生产力的问题,来重建大模型时代的数字化:

  • Re-design(重新设计):ChatGPT 使得 Chat 成为必要的前表层架构,从用户体验的角度来看,需要统一的交互界面,钉钉魔法棒应运而生。这次发布会上,钉钉发布了/ 魔法棒的升级产品体验,在钉钉右上角会出现一个/,点这个/ 出现一个界面,可以进入钉钉统一的 LUI 交互模式。所有的功能交互,会逐渐被这根魔法棒替代,包括钉钉自己的 AI、和钉钉生态的 AI。
  • Re-evaluate(重新评估):PaaS 层抽取共性需求时,需要给分层分类给予技能,也需要给出「置信区间」,即在多大程度上生成的结果是准确的,因为这是企业场景,需要在准确、效率、合规、成本等条件中取平衡。
  • Re-organize(重新组织):数字化在大模型时代的需求,是通过 AI 能力实现自动化并直接增加生产力。数字员工本质上就是改变了企业的生产力组织方式,把 AI 从工具,变成组织里生产力的一部分。而钉钉也需要由过去向企业提供数字化工具,变成直接提供生产力

齐俊生说,钉钉在今年 4 月时也提出过 No APP 的思路,这个观点背后,就是未来可能不再需要那么多 GUI 的功能页面,而是交由 AI 代替处理过程信息,一根魔法棒实现完成所有的生产需求。而开放 AI PaaS,其实也是在将钉钉的魔法棒设计开放给行业,这些由 AI PaaS 创造的工具,也正在完成从 GUI 到 LUI 的转变。叶军在生态大会上也提出,在即将上线的钉钉 7.1 版本,这根魔法棒将会完成阶段改造。届时,无论是协同场景的文档、会议、Teambition,管理场景的人事、OA,或者是更侧重业务的数字员工、宜搭、生态伙伴的应用等等,都将可以从这根魔法棒中唤起。甚至,也许钉钉上的功能栏,陆陆续续会消失掉,用户通过对话来实现所有功能、产品的交互,而不用再去打开一个个窗口,作为一个拥有 2300 万客户的企业数字化头部企业,钉钉看起来是国内第一个在大模型技术落地的思考上,形成了完整生态战略的平台。它的思考和动作、后续的产品创新和生态演进,值得进行持续的关注。在大模型还在成长的过程中,让它从玩具到工具,这也是中国 AI 发展迫切需要的。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK