2

英特尔锐炫显卡驱动升级,总经理高宇:轻薄本可跑160亿参数大模型

 1 year ago
source link: https://finance.sina.com.cn/tech/2023-08-29/doc-imziwkqa1420157.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

英特尔锐炫显卡驱动升级,总经理高宇:轻薄本可跑160亿参数大模型|英特尔_新浪科技_新浪网

广告
e060-ea6691913e4050ec71e54b7b18400576.png

  新浪科技讯 8月29日晚间消息,近日,英特尔宣布旗下锐炫显卡迎来驱动重要升级。与此同时,通过软件生态的构建和模型优化,英特尔正与PC产业伙伴合作推动生成式AI在轻薄本、全能本、游戏本等消费终端的应用,致力于让广大用户在日常生活和工作中,也能通过AI的辅助来提高效率。

  当前,一谈到生成式AI,大家往往想到的是云端运行,基于英伟达等企业的大型GPU运行。那么,生成式AI能不能在PC端、轻薄笔记本上运行呢?在与新浪科技等媒体沟通中,英特尔中国区技术部总经理高宇给出了确定答案。

  “肯定的,轻薄本也可以运营大模型,请大家拭目以待。”高宇表示。据他介绍,通过对模型优化,英特尔降低了模型对硬件资源的需求,进而提升了模型的推理速度,让社区开源模型能够很好地运行在个人电脑上。

  以大语言模型为例,英特尔通过第13代英特尔酷睿处理器XPU的加速、low-bit量化以及其它软件层面的优化,让最高达160亿参数的大语言模型,运行在16GB及以上内存容量的个人电脑上。

  此外,基于OpenVINO PyTorch后端方案,英特尔可以通过Pytorch API让社区开源模型运行在英特尔的客户端处理器、集成显卡、独立显卡和专用AI引擎上。

  以图形视觉为例,由于集成了英特尔OpenVINO 工具包,Stable Diffusion实现的Automatic1111 WebUI,已经能通过上述方式,在英特尔客户端平台的CPU和GPU(包括集成显卡和独立显卡)上运行FP16精度的模型,用户可以在文字生成图片、图片生成图片以及局部修复等功能上获得良好的使用体验。

  在现场演示中,英特尔展示了接入Stable Diffusion及基于ChatGLM-6b、Llama 2-13b模型的运行结果。其中,ChatGLM-6b可以做到首个token生成first latency 241.7ms,后续token平均生成率after latency 55.63ms/token。同时Llama 2-13b则执行了更为复杂的中文与英文生成,在几乎不影响阅读速度的情况下,笔记本也能够做到快速的生成效果。

1e37-e5520b14ef22b8ad7b056d4956b11073.png

  一组由国外专业人士测评提供的数据显示,将集成英特尔OpenVINO工具包的Stable Diffusion WebUI与英特尔Arc A770 16GB显卡配合使用,可实现比未集成前54%的工作效率提升,在相同场景下,Arc  A750同样实现了40%的提升。这一性能,已经超越了未集成OpenVINO工具包的英伟达RTX 4060显卡,且A770 16GB也紧随RTX 4060 Ti后。

5e24-45733d44ec5e2e9eee4bc9f807882f61.png

  据介绍,为适应当下快速发展的大语言模型生态,目前,英特尔已兼容了HuggingFace上的Transformers模型。已经验证过的模型包括但不限于LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen等。此外,英特尔还提供了Transformers、LangChain等易用API接口,并支持Windows、Linux操作系统。

广告

  “随着英特尔后续几代产品进一步扩展,规模和数量的大幅增长将让数亿人轻松享受AI加速体验,并实现更优的智能协作、更快的处理速度和更强的功能特性实现前所未有的体验变革。”英特尔表示。

  生成式AI外,英特尔还通过对Game On驱动的升级发布,提升了锐炫显卡在运行一系列DirectX 11游戏的性能,为用户带来平均约19%的帧率提升,平均约20%的99th Percentile帧率流畅度提升。

  此外,为帮游戏开发者、发烧友们更好地了解游戏运行及相关软硬件资源使用情况,英特尔还升级发布了名为“PresentMon”的工具,帮助衡量和评估系统性能,并根据个人需求进行优化。目前PresentMon首个Beta测试版已经放出,适用于评估所有 GPU厂商,并且可以在DirectX 9、11、12和Vulkan 上运行。

  据介绍,自台式机显卡发布以来,英特尔已累积发布30次驱动更新,为57款新游戏提供发售首日(Game on)优化支持。由AI驱动的英特尔XeSS技术,现已获得超过70款游戏的支持。 (文猛)


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK