4

北京市三部门:谋划建设国家级数据训练基地,推动大模型赋能千行百业

 1 year ago
source link: https://awtmt.com/articles/3689195
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

北京市三部门:谋划建设国家级数据训练基地,推动大模型赋能千行百业

赵颖 发表于 2023年05月19日 12:05
摘要:计划指出,支持发展基于AIGC技术的合成数据新产业,实施大模型底层支撑性技术筑基工程,加速工艺能力建设进程,以Chiplet技术进步弥补先进工艺技术代差,超前布局先进计算芯片新技术、新架构。

5月19日周五,北京市经济和信息化局等三部门拟组织实施“北京市通用人工智能产业创新伙伴计划”。

计划明确,划建设国家级数据训练基地。探索高价值数据共享的版权、安全和激励机制问题,推动形成基于贡献的商业化合作模式。支持发展基于AIGC技术的合成数据新产业。

同时指出,推动大模型赋能千行百业。支持本市企业在“模型即服务”人工智能产业链中布局,加强垂直领域攻关,实现重点场景应用突破,丰富行业应用生态。聚焦本市虚拟数字人、数字医疗、电商零售等创新活跃的数据优势领域,加快推进大模型商业化落地应用,加速文字创造、人机交互、教育、影音等场景落地应用。

实施大模型底层支撑性技术筑基工程。支持企业加大研发投入,加强互联协议、网络传输、能耗优化等技术研发,提升片间互联速率,构建高速计算集群网络传输系统,提升芯片算力水平及集群表现。推进芯片制造工艺突破,加速工艺能力建设进程,以Chiplet技术进步弥补先进工艺技术代差,超前布局先进计算芯片新技术、新架构。

以下是北京市通用人工智能产业创新伙伴计划原文:

为抢抓通用人工智能产业发展新机遇,推动大模型技术创新应用,拟组织实施“北京市通用人工智能产业创新伙伴计划”。伙伴计划聚焦于汇聚产业链上下游合作伙伴,构建政产学研用深度融合的协同联动产业体系,推进大模型研发和应用,解放和发展数字经济时代新的生产力,赋能千行百业数智化转型,助力全球数字经济标杆城市建设。

一、指导思想

以习近平新时代中国特色社会主义思想为指导,深入贯彻落实党的二十大精神,深刻把握人工智能技术演进趋势和创新发展规律,充分发挥本市人工智能领域的技术创新优势和产业资源优势,围绕人工智能大模型的开发迭代,以场景应用为牵引,集聚上下游伙伴,优化配置算力、数据和算法,加速大模型的行业应用落地,推动构建通用人工智能产业生态,打造数字经济发展新的突破点、引爆点和增长点。

二、工作原则

创新驱动。加快推动大模型基础理论、关键技术和应用模式研究,取得一批标志性、引领性、示范性的创新应用成果,提升北京人工智能创新策源能力。

应用牵引。有序推进本市智慧城市应用场景开放,加快推动大模型在行业应用领域尽早落地,不断提高场景应用的整体性、系统性、可靠性和前瞻性,以场景应用促进技术和产品的迭代升级。

重点突破。围绕当前智能算力不足、高质量数据供给不够等问题,抓住症结、精准施策,利用我国在垂直领域的场景优势,弥补关键薄弱环节,力争打通痛点、难点和堵点,实现行业大模型的率先突破。

开放合作。结合大模型发展关键环节,遴选各个环节合作伙伴,合作伙伴紧密合作、高效协同,形成产业链共同体,共投资源、共有成果、共享收益、共筑生态。

三、工作目标

到2025年,基本形成要素齐全、技术领先、生态完备、可有力支撑数字经济高质量发展的通用人工智能产业发展格局。上下游产业链布局持续优化,优质算力、高质量数据供给支撑能力大幅提升,大模型创新应用引领全国,每年落地10个以上重点场景商业化标杆应用并形成10个以上行业标杆解决方案,培育一批应用大模型技术实现突破性成长的标杆企业,建成具有国际影响力的通用人工智能产业发展高地。

四、“伙伴计划”范围

“伙伴计划”旨在搭建人工智能大模型的开放合作平台,建立协同合作机制,寻找利益契合点和最大公约数,推进合作伙伴协同联动,实现资源供给充裕、技术自主创新、应用落地见效、合作机制灵活的良性发展态势。具体划分为五类伙伴,即算力伙伴、数据伙伴、模型伙伴、应用伙伴和投资伙伴。根据自身业务类型,各类市场主体可承担一个或多个伙伴角色。

(一)算力伙伴

算力伙伴提供多元化高质量算力资源,保障本市大模型企业和AIGC企业产品研发和技术创新,优先为本市大模型团队和创新企业提供优质算力服务,提供一系列的人工智能开发增值服务工具,降低中小企业和个人开发者的算力使用门槛,扩大本市大模型发展集聚引领优势。

(二)数据伙伴

数据伙伴是数据要素市场中包括数据提供方、数据服务方、数据交易方在内的市场主体。针对大模型训练所需的高质量数据,发挥数据提供方海量数据资源优势,基于数据交易方搭建的流通交易平台和数据服务方的技术支撑,实现训练数据的有效供给及合规高效、安全有序的流动。

(三)模型伙伴

模型伙伴是服务政务、工业、医疗、交通、金融、教育、文旅等行业的解决方案服务商,通过行业典型场景牵引,在通用大模型的基础上开发行业模型,落地行业应用并提供日常服务,打通模型即服务的最后一公里,并以行业模型反哺通用大模型技术的迭代。

(四)应用伙伴

应用伙伴是指应用大模型能力支撑业务发展的各类行业用户,通过开放自身典型场景,支撑打造基于行业数据的精准模型,带动业务发展,实现差异化竞争优势。

(五)投资伙伴

投资伙伴以资本赋能通用人工智能产业发展,发挥孵化、引导、带动作用,驱动科技创新、培育标杆企业、促进项目落地,推动数字经济高质量发展。

五、主要任务

(一)加快满足近期迫切算力需求。发挥本市算力资源优势,通过与云厂商建立合作,加快归集现有算力,为市场主体提供多元化优质普惠算力,保障本市大模型团队和AIGC企业产品研发和技术创新。采用用户单位与大模型团队结对方式,对形成场景应用模式或试点案例的本市大模型团队训练、初创企业行业模型调优及行业应用推理算力,给予10%的财政补贴。探索支持各区重点布局的产业园区、基地按照入驻即享原则,对大模型企业给予算力支持。

(二)提升中长期算力供给能力。加快建设海淀区北京人工智能公共算力、朝阳区北京数字经济算力中心等重点项目,尽快形成算力供给,完善本市算力供给体系。建设北京市公共算力服务平台,汇聚云厂商和本地算力,形成统一服务窗口并实现算力任务调度,提升集约化、规模化、专业化算力能力,以商业化运营为主、政府适度补贴为辅,满足未来5-10年本市人工智能企业对算力的规模化需求。提高环京地区算力一体化服务能力,形成全国算力网络调度枢纽节点。

(三)推出一批高质量训练数据。梳理大模型训练数据需求清单和供给目录,建立数据供需对接机制。基于市大数据中心和北京国际大数据交易所探索建设可用于大模型训练的公共数据专栏和社会数据专区,推动公共数据和社会数据定向有条件开放。发挥在京国家机关、科研院所、企事业单位丰富的数据资源优势,用好北京国际大数据交易所社会数据专区成果及智源研究院中文语料库,形成训练数据的定向供给,对数据提供方给予一定比例的补贴支持。

(四)谋划建设国家级数据训练基地。在数据基础制度先行示范区布局中谋划建设国家级数据训练基地,探索高价值数据共享的版权、安全和激励机制问题,推动形成基于贡献的商业化合作模式。发挥本市从事人工智能训练数据的专业服务商优势,为大模型预训练的各个阶段所需的数据提供数据支撑和技术服务,开发涵盖文本、图像、视频等多模态的高质量数据集,助力国家级数据训练基地建设。支持发展基于AIGC技术的合成数据新产业。

(五)实施大模型应用创新标杆试点工程。围绕首都之窗智能问答、在线导办等场景,依托私有化部署的算力集群资源,逐步开展政务服务行业专有模型训练、精调、剪枝、蒸馏等工作,赋能“12345接诉即办”辅助场景,总结专用模型实施部署经验,探索政务服务大模型服务模式。支持金融机构利用大模型技术打造“全能业务助理”,提升金融从业者的服务半径和服务质量。探索大模型助力智慧城市建设,推动城市大脑等城市管理公共平台开放数据接口引入大模型辅助治理。

(六)推动大模型赋能千行百业。支持本市企业在“模型即服务”人工智能产业链中布局,加强垂直领域攻关,实现重点场景应用突破,丰富行业应用生态。聚焦本市虚拟数字人、数字医疗、电商零售等创新活跃的数据优势领域,加快推进大模型商业化落地应用,加速文字创造、人机交互、教育、影音等场景落地应用。加速信息交互领域的数字化转型,变革知识创造行业生产方式,激发持续的数字创新活力,深度赋能千行百业。

(七)培育软件开发新范式。变革软件领域的开发应用模式,提升软件生产力工具效能,利用生成式AI重构企业软件。以开源聚合创新,构建大模型开源社区,吸引科研院所、代码托管平台、开发者及团队在京形成开放、包容、活跃的创新氛围。在基础软件领域引入大模型应用,提升国产操作系统、办公、设计、编程软件性能,丰富信创软件品类。加强工业软件与大模型融合,加快推进智能工业软件开发应用,提升软件质量、丰富应用功能。倡导模型即服务,提升云服务商、集成企业服务水平。鼓励互联网服务迭代升级,推动涌现大模型+互联网新软件新服务。

(八)实施大模型底层支撑性技术筑基工程。支持企业加大研发投入,加强互联协议、网络传输、能耗优化等技术研发,提升片间互联速率,构建高速计算集群网络传输系统,提升芯片算力水平及集群表现。推进芯片制造工艺突破,加速工艺能力建设进程,以Chiplet技术进步弥补先进工艺技术代差,超前布局先进计算芯片新技术、新架构。开展面向不同芯片架构、不同应用场景的软硬件精准适配攻关,加快不同芯片架构的接口适配、共性算子开发,加速推出基于自主算力的软硬一体化解决方案。

六、组织实施

(一)多渠道征集伙伴计划成员。通过有关部门邀请、企业自荐、行业组织推荐等方式,广泛征集伙伴计划成员,形成伙伴计划成员名单,发挥伙伴计划成员资源优势,帮助加快大模型研发迭代、推广应用。

(二)建立常态化联系服务机制。建立与伙伴计划成员常态化联系服务机制,将伙伴计划成员纳入市区两级重点企业服务机制。

(三)加大资金支持力度。利用高精尖产业发展资金等支持通用人工智能产业发展,推动算力基础设施建设、数据流通交易、关键技术研发等。充分利用高精尖发展基金,加大对通用人工智能产业投资,积极引入社会资本,鼓励设立通用人工智能产业基金,加大对企业投入力度。

(四)广泛开展宣传引导。充分发挥本市人工智能领域行业协会、产业联盟等社会组织的作用,积极推广伙伴计划,做好政策宣传,挖掘伙伴成员优秀经验做法、先进技术产品、试点示范案例,加大推广力度。

(五)加快大模型领域人才引育。支持伙伴计划成员引育更多具有国际竞争力和发展潜力的人才,打造大模型人才集聚高地。

(六)积极开展先行先试。努力在国家相关部委指导和支持下,争创国家数据基础制度先行先试示范区,建立健全鼓励包容创新和审慎监管的环境氛围。

原文来源:北京市经济和信息化局

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK