3

腾讯正式发布向量数据库,用于大模型训练

 1 year ago
source link: https://lieyunpro.com/archives/488865
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

今日,腾讯云正式发布向量数据库Tencent Cloud VectorDB,预计8月上线腾讯云官网。

腾讯介绍道,该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景,是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

据了解,该数据库面向大模型训练,可以让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。

大模型的“黄金搭档”

什么是向量数据库?

向量数据库是一种专门用于存储、 管理、查询、检索向量的数据库,可以把复杂的非结构化数据通过向量化,处理统一成多维空间里的坐标值。

目前,向量数据库主要应用于人工智能、机器学习、数据挖掘等领域。

具体来看,向量数据库被广泛地用于大模型训练、推理和知识库补充等场景:支撑训练阶段海量数据的分类、去重和清洗,给大模型的训练降本增效;通过新数据的带入,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;提供一种私有数据连接大模型的方式,解决私有数据注入大模型带来的安全和隐私问题,加速大模型在产业落地。

简而言之,向量数据库可以解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。

据第三方调研数据预测,全球向量数据库到2030年预计将迎来超过500亿美元的市场。国内也将以每年超过20%的速度在增长。目前全球已有的向量数据库产品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超过一半的向量数据库具有云化部署的能力。

提供10亿级向量检索能力

据介绍,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。

具体而言,腾讯发布的向量数据库有以下特点。

一是高性能向量存储、检索。腾讯云向量数据库具备高性能的向量存储和检索能力,单索引能够轻松支持10亿级别的向量规模。在分布式弹性扩展的架构下,单实例可支持百万级别QPS,AI场景下向量检索的P99响应延迟可控制在20ms以内,能够覆盖绝大多数AI场景对向量存储和检索的业务需求。

二是可视化数据管理。在向量存储、检索能力之上,腾讯云向量数据库还提供了可视化的数据管理界面,进一步降低向量数据库的接入和使用门槛。用户可以通过控制台进行数据库、集合层面的数据管理,还可以快速执行向量检索等常用操作。此外,腾讯云向量数据库还提供了可视化的数据上传能力,帮助用户快速构建专属知识库。

三是一站式向量检索方案。为了进一步提升产品的易用性,腾讯云向量数据库会提供一站式的向量检索方案,实现从文本输入到文本搜索的端到端检索能力,用户可以直接上传.pdf、.txt等原始文本文件,通过平台自动化地执行文本分割、embedding向量化,全托管地完成知识构建和检索任务。

腾讯官方信息称,使用腾讯云向量数据库后,企业接入大模型需要花费的时间,能从一个月降低至三天左右,极大降低企业的接入成本。

在具体落地应用层面,腾讯方面表示,该向量数据库目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。

数据显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%。

腾讯方面表示,在未来“向量数据库+大模型+数据”将产生“飞轮效应”,共同助力企业步入AI Native(AI原生)时代。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK