7

昆仑万维「天工SkyAgents」Beta版全网测试

 8 months ago
source link: https://www.qbitai.com/2023/12/109303.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

昆仑万维「天工SkyAgents」Beta版全网测试

量子位的朋友们量子位的朋友们 2023-12-25 16:17:32 来源:量子位

AI Agents三大核心模块:大脑、感知、执行

12月25日,昆仑万维AI Agents开发平台「天工SkyAgents」Beta版正式开放测试,用户可在https://model-platform.tiangong.cn/立即体验。

昆仑万维「天工SkyAgents」AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”,并能将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。

在大模型技术高速发展、AI Agents应用不断进步的当下,昆仑万维「天工SkyAgents」是我们在智能体领域的一次探索与尝试。这个平台也许并不完美,但我们希望与广大开发者们携手共建、互助成长,不断开拓人工智能技术的应用边界。现在不完美是为了未来的完美,我们一直在技术追求的过程中,坚信而勇于突破。

携手探索,合作共创

大模型时代,交互式AI有望成为未来大模型技术的主流落地方向。历史告诉我们,新兴事物的演进总会找到一个稳定的术语来描述这种载体,而AI Agents(智能体)已经显现出了巨大潜力。

目前,全球对智能体的关注异常热烈,OpenAI高度关注智能体领域,并在OpenAI dev day发布会上发布了自定义GPTs以及Assistance API;DeepMind的联合创始人最近也提到下一代人工智能技术的发展方向将是交互式AI,而不是生成式AI。这种交互式AI很大程度上与智能体的描述是相符的,用户可以通过要求智能体完成各种任务,而智能体则可以操作软件或与人类协作,完成复杂场景的工作。

在技术范式上,昆仑万维也在不断思考驱动智能体技术快速发展的底层技术和架构。我们同时也清楚地认识到,即使在大模型的语言交互能力的加持下,我们离一个完全可以自动做决策并执行任务的智能体还有距离。

今天,昆仑万维正式开放「天工SkyAgents」Beta版,作为我们在AI Agents技术能力和应用能力上的一次探索。我们希望通过此次探索,能让越来越多的用户与开发者能够将大模型技术应用到工作生活中,打造出满足日常需求、激发灵感创新的专属AI Agents。我们也希望更多对AI Agents感兴趣的朋友们能够与我们一同携手共创。欢迎广大伙伴们提出建议与意见。

昆仑万维「天工SkyAgents」Beta版全网测试

什么是AI Agents?

Agent一般译为“智能体”或“代理”,其概念最早由麻省理工学院人工智能实验室(MIT AI Lab)创始人之一Marvin Minsky在其1986年出版的《思维的社会》一书中提出。它由社会与社会行为概念被引入计算系统内,指的是在某一环境下,能持续自主地发挥作用的计算实体。

AI Agents指的则是由人工智能技术驱动,能够感知环境、进行决策和执行动作的智能实体。

AI Agents并不是一个新兴的概念,自人工智能技术学科建立以来,就陆续有围绕AI Agents的研究出现。2012年深度神经网络浪潮兴起后,有一支以强化学习训练AI Agents的学术派系诞生,轰动全球的围棋机器人AlphaGo可以看作是这一流派的研究成果。不过,此类AI Agents更适合对抗性游戏场景,在真实世界中较难落地。

然而,大模型的出现改变了这一切。

2023年,随着大模型技术在自然语言理解、工程能力、数据能力、存储能力等领域的突破,大量对话交互类“GPT”涌现,以大模型技术驱动的AI Agents在通用性、实用性、可落地性等都得到了飞速发展,在全球掀起了又一阵AI Agents热潮。

传统大模型应用大多基于Prompt(用户提示词)实现,Prompt的质量将直接影响大模型的回答效果,缺乏提示词工程能力的普通用户难以将大模型的真正能力发挥到极致。而AI Agents只需要用户给定工作目标,就可以通过独立思考、调用工具去逐步完成任务,极大降低大模型技术应用门槛。

AI Agents三大核心模块:大脑、感知、执行

根据复旦大学论文《The Rise and Potential of Large Language Model Based Agents: A Survey》,AI Agents可以划分为大脑(Brain),感知(Perception)、执行(Action)三大模块化能力。

昆仑万维「天工SkyAgents」Beta版全网测试

(图片来源:《The Rise and Potential of Large Language Model Based Agents: A Survey》)

1. 大脑(Brain)

大脑是AI Agents的“核心信息处理中心”,具备理解当前环境并形成“记忆(Memory)”的能力,同时也具备存储并检索长期记忆的能力。“大脑”可以根据“记忆”和当前接收的信息进行逻辑推理,并将复杂问题拆解成可实现的子任务,应对复杂场景任务。同时,通过RAG(检索增强生成)技术,AI Agent可以根据当前场景和用户设定的目标进行进一步决策,实现独立思考、规划(Planning)和推理(Reasoning)。

2. 感知(Perception)

感知模块能够让AI Agents基于当前的环境和场景获取足够的信息,这正是其与传统RPA系统的区别之处。RPA系统在面对大量未知信息、难以预测的环境时无法进行工作,AI Agents则可以通过感知信息并做出对应的思考和行动,从而实现感知、理解和自主探索世界。

3. 执行(Action)

执行模块赋予了AI Agents执行任务的权限和能力。AI Agents在接收到用户任务指令后,结合由感知模块收集的当前场景信息,通过大脑进行总结和推理后,输出到执行模块中,使AI Agents能够根据用户需求完成指令。同时,AI Agents拥有调用、使用工具(Tool use)的能力,这些工具可以帮助Agents更高效地完成复杂任务,同时也提高了其在某些具体场景中的可信度和灵活度,相关应用场景包括让AI Agents购买飞机票、点外卖、完成企业IT/客服/法律任务等。

天工SkyAgents

「天工SkyAgents」基于昆仑万维「天工大模型」打造,拥有专属“大脑”、“感知”、“执行”模块。

个人用户/开发者可以通过「天工SkyAgents」进行自然语言和简单操作,无需代码编程能力,即可在几分钟之内部署属于自己的AI Agents,完成行业研究报告、单据填写、商标设计、甚至健身计划、旅行航班预定等多项私人定制需求。

企业用户/开发者则可以将「天工SkyAgents」的众多能力按需拼装成企业IT、智能客服、企业培训、HR、法律顾问等众多个性化的应用,并支持一键服务部署,确保其在不同业务系统中的无缝接入。

「天工SkyAgents」的AI能力背后,是昆仑万维AI Agents技术在模块化任务组件、智能知识库构建、第三方工具调用、个性化AI Agents一键分享等领域的能力积累。

1. 模块化任务组件,零代码打造专属AI Agents

当前,多数用户既不具备代码开发经验,也不具备训练大模型提示词工程(Prompt Engineering)的能力,难以将众多日常生活的实际需求通过对话问答形式快速实现,无法将大模型能力发挥到极致。为了解决这一问题,「天工SkyAgents」将大量任务组件模块化,集成了智能对话、信息加工、信息提取、信息分类、第三方数据获取、向量检索等能力。

智能对话:智能对话模块借助 AI 能力,将用户发送的内容,通过大语言模型进行处理并回复给用户指定内容。

信息加工:通过预设提示词(Prompt)的方式让大模型对特定信息输入进行加工,以获得符合需求的内容。

信息提取:通过大模型对语义的理解,可以从输入信息中提取目标信息

信息分类:借助大模型的智能分析,将用户问题进行分类,针对不同类型的问题执行不同操作,方便进行个性化处理;

第三方数据获取:第三方数据接入会携带相关的参数,系统向指定地址发送POST请求,并接收响应。系统在携带相关参数的同时,可以实现与其他应用服务的数据互联互通。基于第三方数据获取模块可以极大扩展AI Agents的能力,打通数据库操作、联网搜索等更多场景。

向量检索:针对常见的用户提问,系统可以将问题添加进知识库,便于搜索和查找。而对于“知识库”模块而言,用户可以输入问题,系统将在知识库中搜索相关问题与解答,并用自然语言进行输出。

2. 智能知识库构建,支持大规模知识导入

大模型能力虽强,但也有其天生的弱项。一方面,大模型通过参数训练获得的知识只能停留在某一时点,更新成本很高;另一方面,大模型的训练数据通常以通用知识为主,细分领域的数据往往缺乏。为了解决这一问题,「天工SkyAgents」支持导入更多格式和更大规模的数据和知识,给大模型增加了“知识库外脑”。

支持多种数据导入形式:文本、文件、网站、问答对、在线文档等方式,轻松将已有知识进行导入

知识库Embedding:将知识库中的内容元素表示为低维度的向量,使得知识库中的元素可以更容易地进行计算相似性、寻找相邻的实体等数学运算,从而提高了知识库在 AI Agents 中的可操作性。

知识库自由链接:每个AI Agents可以自由链接所属知识库并同时由多个知识库进行内容供给,每个知识库也可以同时链接多个AI Agents,知识库内容可根据需要启用和弃用,实现更灵活的知识内容管理。

3. 第三方工具调用,多场景随心应对

第三方工具调用:工具调用能力是将AI Agents与大量对话类GPT区别开来的核心能力之一,比如在机票预订场景中,除了对用户需求与航班信息进行分析判断,AI Agents还需要调用票务平台、电子支付等不同工具。因此,除了基础的模块外,「天工SkyAgents」还支持各类第三方工具的调用,用户可以根据自身需要进行工具的开发,使得构建 AI Agent 时拥有更多灵活的自由度。

4. 个性化AI Agents一键分享

一键分享:为了回馈广大用户与开发者们,更便捷地打造与使用AI Agents,「天工SkyAgents」上线新年专属活动,推出理想伴侣、有缘机伴、暖心家园三款官方新年模版,并全面简化了分发和使用流程。用户根据自己的创意设计出的AI Agents可以通过链接的方式向更多人分享,使用者只需点击链接,即可获得对该AI Agents的访问权。点击创建:https://model-platform.tiangong.cn/

能力更全面、应用更智能、分享更便捷、平台更好用。本次「天工SkyAgents」beta版的正式开放内容,将进一步推动大模型技术的普惠化,帮助缺乏代码开发能力的个人与中小企业积极拥抱大模型技术,助力大模型走入千家万户,为人工智能生态发展贡献力量。

扫码进入“天工开放平台” ,快速构建AI Agent

昆仑万维「天工SkyAgents」Beta版全网测试
版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK