4

国产AI视觉芯片,谁是最强“卷王”?

 1 year ago
source link: https://www.eefocus.com/component/528278
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

人工智能三大主要应用场景:语音识别、自然语言处理、视觉应用,其中,视觉是发展最为成熟的领域之一。

对于快速发展的AI视觉来说,一个非常重要的基础就是AI芯片。随着落地规模越来越大、场景越来越丰富,对AI视觉芯片也提出了更高要求。哪类芯片更受欢迎?主要落地哪些场景?能够解决哪些行业痛点?本文梳理了18家本土厂商的AI视觉芯片及相关应用,试图分析出一些技术和落地趋势。


渐成主流的三大AI视觉方案

根据应用方向来看,市面上的AI视觉方案可以简单划分为三大类:低功耗AI视觉方案、AI IPC模组方案、AI算力盒子。

第一,随着端侧智能需求越来越旺盛,低功耗AI视觉方案在迅速发展,主要应用品类有手机、智能门锁、智能门铃、家用AI摄像机等等。这些方案采用电池供电方式,因此对功耗要求非常高,使得低功耗AI视觉方案成为主流的应用。

面对越来越高的场景复杂度和图像质量要求,传统ISP图像处理技术已近瓶颈。随着参数库逐渐庞大,调试越发困难,开发周期逐步拉长,画质提升的投资收益率也越来越低。此时,画质技术与AI技术的深度融合至关重要。利用AI算力深度学习海量场景和数据,智能调优复杂参数,输出算法模型辅助图像处理,使图像质量突破传统ISP极限。AI与传统ISP的结合趋势在手机中非常突出,并且也在走入泛安防领域。

第二,随着AI视觉应用在泛安防场景落地加速,传统安防的人脸识别、人形检测、入侵侦测等技术需求已经向消费场景渗透,网络摄像头(IP Camera)设备越来越趋向高清化、智能化。

IPC设备本身有一定的开发门槛,需要众多技术支持。而AI IPC模组由于自带应用算法,通常支持多种无线接入方式,且SDK便于用户二次开发,因此比较受欢迎。这类方案相对比较成熟,进入了大批量出货阶段。

第三,AI算力盒子是AI和边缘计算结合的设备,可实现端侧和边缘系统中的高性能计算和AI性能。

随着端侧智能需求提升,数据量也水涨船高,这类“盒子”设备越来越受到市场欢迎,它们往往具备丰富的功能拓展性,包括以太网、USB等接入功能,方便接入各种传感器和外设,如连接摄像头进行图像采集等,支持HDMI显示或CAN工业总线等,支持Wi-Fi、4G/5G通信,从而实现视觉识别+数据处理/分析的一站式控制,让数据的传输、处理更高效,一定程度上推动了AI从云端的下沉应用。


五类AI视觉芯片大PK

剖开这些方案内部,AI视觉主芯片可以简单区分为GPU、CPU/集成GPU、带NPU的SoC、FPGA、以及RISC-V架构芯片等。这些芯片分别面向不同的应用和用户类型,也各自呈现出不同的发展趋势。

其中,基于GPU的开发板可能是许多用户刚开始AI开发时就接触到的,比如NVIDIA TX2或Nano,AMD的APU SoC等。这类产品最大的优势是生态完善,不论是Tensor Flow、Caffe、PyTorch哪种框架,或是哪种AI库,运行起来都很流畅,开发体验也比较好。

第二类CPU/集成GPU,主要针对中低算力需求的应用,只需已有的CPU或是集成GPU就可以满足。优势在于整体硬件成本更低,且方案成熟;缺点就是算力不够大,不能支持太大的AI模型。

第三类是带NPU的SoC,已经越来越成为AI视觉主芯片的一大趋势,它们将NPU与主处理器集成在一起,可满足中高算力需求。这方面的代表有海思3519AV100、Hi3559A,瑞芯微RK3399Pro、RK1808等。由于是单芯片,硬件成本也适中,挑战主要在于模型的量化部署方面,以及模型部署工具的成熟度,主要依赖于芯片厂商成熟的工具链支持。

除了这类单芯片设计,市面上还有一类神经计算加速棒产品,例如Intel Movidius、瑞芯微等都提供这类产品,可以通过USB插到板卡上提供运算能力。但是这类方案需要进行相互之间的数据传输,对于整体的方案设计、硬件的稳定性等都有一定挑战。

第四类基于FPGA的主控芯片,主要满足对实时性要求较高的应用,比如自动驾驶/辅助驾驶、工业级应用等。挑战在于开发难度,涉及一些自研AI加速FPGA逻辑,需要底层的加速设计和量化方案设计,以及相应的转换、编译。

第五类是RISC-V架构的芯片,近两年得到了较大的发展。比如嘉楠基于双核64位RISC-V架构+ISP图像处理器的K510、全志科技最新推出的ARM Cortex-A7+RISC-V协处理核的多目异构AI视觉芯片V853、晶视智能基于平头哥的双核RISC-V IP+TPU+ISP的AI视觉芯片等。

由于需要进行图像处理,这类芯片往往需要采用RISC-V主处理器+ISP或是Arm CPU+RISC-V协处理器的异构形式,以应对更大的算力需求和更高的图像处理性能。


新老国产芯片厂商猛攻AI视觉赛道

OPPO马里亚纳X影像处理芯片

自研DSA架构,其中包含多个IP:有自研NPU IP—MariNeuro、自研ISP IP—MariLumi、自研MIPI接口IP、Arm控制IP,以及自主设计的双层内存系统等。MariLumi主要进行图像信号的降噪和HDR处理,MariNeuro主要负责AI降噪算法加速,自研MIPI用于对接各种图像传感器,包括OPPO和Sony定制的传感器,Arm控制IP主要用于I/O口控制等,双层内存架构用于内部数据搬运。

vivo AI-ISP影像芯片

vivo最近宣布新一代自研影像芯片由传统ISP架构升级到了AI-ISP架构,可实现 1.3 万亿 bit /s的数据吞吐速率,16.3 Tops/w能效比,夜景视频降噪效果提升 20%。

基于AI-ISP架构革新,vivo新一代自研芯片实现了三大突破:第一、片上内存单元的升级,带来了每秒1.3万亿bit的数据吞吐速率,拥有了强大的算力保障。第二、AI计算单元的升级,带来超高能效比,DLA加速器的峰值能效比达到每瓦16.3 万亿次运算。第三、图像处理单元的升级,提升了AI-NR降噪、HDR影调融合、MEMC插帧等算法效果。

MediaTek天玑9000

MediaTek天玑9000在影像技术方面比较有代表性,采用Imagiq 790 ISP,处理速度最高可达90亿像素/秒,据称几乎是竞争对手的3倍。集成了第 5 代 APU(APU590)旗舰级 AI 处理器,性能和能耗表现相比上代均提升 400%。以 GPU+APU 协同工作,平衡功耗与画质需求。通过游戏 AI 低负载技术,GPU 只需更低的渲染资源消耗,就能获得接近原生高分辨率的画质,起到提升游戏画质同时降低功耗的作用。短视频也是目前最受用户喜爱的重点应用之一,APU590 可为抖音带来 2K 超分视频体验,画面清晰度可提升 18%,让 2K 短视频高清视觉体验触手可及。

爱芯元智

爱芯元智先后推出了AX630A、AX620A、AX620U、AX170A两代四颗端侧、边缘侧AI视觉感知芯片。AX630A针对智慧城市、智慧交通等密集场景,以暗光图像视频处理能力和20路1080p 30fps的解码能力为主要卖点;AX620A则更强调这些场景下满足电池应用方案的低功耗优势,兼顾IoT、智能运动相机、手机等应用场景。

Pre ISP芯片AX170A今年3月通过手机客户验收,正式进入商用阶段,落地消费领域。这是一颗影像专用AI处理芯片,最高算力28.8TOPS,独立DDR带宽最高可达8.5GBps,可对4K 30fps(每秒传输帧数)影像实时画质优化,配合主控芯片可实现超级夜景视频和暗光拍摄功能,完成4K夜景视频的预览和拍摄。

海思

在暗光场景,海思综合利用8级3D降噪和多光谱融合多种技术提供暗光成像品质。其中8级3D降噪技术利用8级滤波器进行降噪处理,它可以在空域滤波过程中同时实现图像去噪和增强,以及在时域滤波过程中混合两种不同的时间模式。8级3D降噪技术还包含两个用于细节增强的IE模块和一个锐化模块,可以在实现更强的去噪的同时,保留并增强更多的图像细节。而多光谱融合则通过红外补光,在ISP将可见光、850nm、940nm等常见光谱融合,在不增加光污染的同时,最终使图像效果达到暗光全彩,细节纹理丰富,过曝区和非过曝区准确处理。

此外,市面上还有搭载海思Hi3559A等芯片的AI算力盒子,这款芯片深耕于高性能影像处理,通过DSP可以加速视频解码,且拥有NNIE来支援深度学习神经网路,可以做到影像大解析度的分析以及高速的资讯交互传输,适合智慧安防及智慧零售等相关影像视觉AI应用。

国科微

国科微2015年进入安防IPC领域,正逐步构建安防前后端全系列布局。基于新一代AI ISP引擎,国科微最新推出高端IPC SoC GK7608。面对夜间彩色成像难题,GK7608引入 “黑白彩色双光融合”技术,无需补充白光,在夜晚仍可获得光彩鲜艳的图像,为客户提供高质量的低噪全彩方案。GK7608搭载高算力双核NPU实现多个神经网络并行运算,可应用到200个人/车的高密度场景,消除高密度场景盲区。 

顺应智能化和超高清发展趋势,NVR芯片必须支持更多的接入路数,具备更高的清晰度、集成智能分析能力。国科微NVR SoC GK7618可同时解码24路1080P30 视频,集成多核处理器和图像分析处理器,支持后端多种智能算法应用,提供高性能、智能化、易开发的NVR方案。

瑞芯微

瑞芯微三大类视觉芯片包括智慧视觉方案RV1126和RV1109、AIoT平台RK3568、边缘计算高性能平台RK1808和RK399Pro,可满足不同场景的算力需求。

基于自研的ISP 2.0技术及NPU性能,RV1126及RV1109适用于智能网络摄像头IPC、电池IPC/智能门铃、门禁/闸机、智慧屏摄像头及车载视觉等应用场景。RK3568主要面向网络视频录像机(NVR&XVR)、云终端、物联网网关、智能闸机/门禁等领域。采用四核A55架构CPU,G52 GPU;内置NPU,可提供1T算力。内置独有的ISP图像处理器,支持8M处理能力,强大的HDR,支持畸变矫正、去雾、噪点消除等功能。RK3399Pro和RK1808是瑞芯微第一代内置有NPU的高性能人工智能处理器,算力3T,应用于各类对算力有较高要求的嵌入式智能产品。

君正

视觉AI应用协处理器T02拥有8T计算能力,全速运行情况下功耗1.5W,可以搭配各大平台实现视频结构化——车牌、车型、人脸、人形,完成检测及分析,用于平安城市、电力、学校等多种安防项目中。

最新一代智能视频SoC芯片T31系列采用22纳米工艺,拥有1.8G主频,最高支持500万25帧。可在设备端集成君正的系列深度学习算法,包括深度学习的人形、人脸、车牌的检测和识别。相较于传统的CV算法,君正深度学习算法在复杂环境如遮挡、大角度等场景下更准确,解决了CV算法的痛点,赋能端级AI,主要应用包括智能门铃、HIVE智能卡片机、热成像与人脸识别一体机等。

全志

全志科技最新发布了V853多目异构AI视觉芯片产品,采用三核异构设计,包括Arm Cortex-A7主核、RISC-V协处理核与AI NPU。其中,Arm Cortex-A7主核可适应于兼容各类应用开发调试,RISC-V协处理核重点负责各类传感器场景,提高实时响应速度,AI NPU则专注解决复杂多变的视觉检测识别场景,其检测识别帧率相较于传统CPU方式可最少提升20倍以上。三核异构解决了传统单核面对复杂视觉场景体验不佳的痛点问题。这款芯片已进入量产阶段,多个目标细分市场客户正在进行产品方案开发和优化工作,不久即将面市。

嘉楠

勘智K510是嘉楠公司推出的第二代AI边缘侧推理芯片,提供高性能的图像及语音处理能力。K510-CORE是核心模组,板载一颗K510芯片,CPU采用双核64bit RISC-V架构,K510搭载自主研发的第二代神经网络处理器KPU2.0,采用计算数据流技术,算力较上一代提升3倍同时降低功耗。板载内存为512MB LPDDR3@1600MHz。支持两路MIPI串行图像输入和一路DVP并行图像输入,支持1路MIPI图像输出。可用于工业/专业相机、3D识别模组、考勤门禁门锁智能终端、AI教育开发板/机器人等。

云天励飞

云天励飞嵌入式视觉AI大脑芯片DeepEye1000是一款异构多核视觉分析SoC芯片,内嵌自定义指令集神经网络处理器,可广泛用于摄像机以及数字城市、新零售等场景。

针对机器人市场,云天励飞基于DeepEye1000打造了Mini PCIe AI加速卡,能够快速满足机器人厂商对现有产品和方案智能升级的需求。应用云天励飞DeepEye1000的厂商不仅能够直接应用云天励飞自研的上百种计算机视觉算法,也能够通过云天励飞的开放的工具链,搭载自研或第三方厂商的算法。

亿智电子

亿智电子SH系列AI芯片,支持基于深度神经网络的指尖识别、文字识别(OCR)、手势识别、人形跟踪、人脸检测、人脸识别、骨骼分析等智能算法,为智能云台、扫译笔、消费和办公场景摄像头提供AI算力。SV系列AI芯片主要面向视像安防场景,集成人脸识别、口罩识别、支持红外测温等功能,实现无接触式测温、考勤、鉴权等功能,广泛应用于考勤门禁、AI-IPC等。

在汽车电子领域,SA系列的AI芯片集成高级驾驶辅助系统(ADAS)、驾驶员行为监控(DMS)、盲区检测(BSD)等智能算法,应用于AI行车记录仪、智能部标机、电子后视镜、智能车载摄像头等智能车载电子产品。

清微智能

清微智能TX510是一款面向IoT设备的超低功耗视觉处理芯片,基于可重构计算架构,内置3D引擎支持AlexNet、GoogleNet、ResNet、VGG等主流神经网络,可实现人脸识别、物体识别、手势识别、目标跟踪等功能。清微智能的可重构技术通过实现“软件可编程、架构能变换”的能力,在同等功耗下具有更强算力,并具有低成本、应用开发简便等特征。

TX510芯片的AI算力为1.2T(Int8)/9.6T(Binary),峰值功耗小于450mW,启动时间小于200ms,AI有效能效比达5.6TOPS/W。支持3D结构光,支持3D活体检测、红外活体检测、可见光活体检测等,可以抵御照片、视频等二维攻击,面具等三维攻击。可广泛应用于智能安防、金融支付、机器人、航空航天等多种领域。

雄迈

XM530BX0-LP1 是一款多功能高效的网络视频处理器芯片,包含了雄迈第三代ISP处理技术,相比传统的ISP除了功能,还支持透雾、宽动态、以及RGB-IR等新一代特征。同时该芯片还支持H.264/H.265,MJPEG等视频、图像压缩编码及视频传输,能够高效地完成图像编码及传输。ISP图像处理具有最大300W 像素(2048*1536)图像处理能力,支持bayer图像输入,支持MIPI CSI接口输入。可方便应用于视频监控,网络处理等方面的应用。

知存科技

WTM8000系列是一款针对视频增强处理的存算一体AI处理芯片,可实现基于AI的各种视频增强处理,包括物体识别、分类检测,以及视频增强等算法,适应于各种高能效复杂边缘计算场景;能为视频显示提供4K/8K@60/120FPS 的插帧、超分、HDR宽动态和降噪能力;能为AI-ISP提供4K@60FPS的高能效NPU及高清视频增强能力,例如HDR宽动态、降噪处理等。 WTM8000系列产品通过3D IC融合高能效存内计算与先进逻辑工艺,实现高算力、低功耗与高性价比 的AI解决方案。

晶视智能

晶视智能CR182x系列芯片采用平头哥RISC-V C906内核,是一款定位于泛安防市场的轻智能AI视觉芯片。该芯片具备0.5 TOPs算力,支持2路MIPI或者DVP视频输入,最大分辨率2880*1620@30fps,内置DDR以及百兆MAC PHY。这款芯片除了采用双核RISC-V,还集成了晶视智能自研的TPU、ISP,在9X9平方毫米的小封装尺寸上提供双摄+屏显+内建DDR的紧凑设计。

酷芯微电子

酷芯AR9201以自研ISP边缘端芯片技术加视频解码器完成高清图片和影像传输,支持超低延时基带芯片补足5G通讯、CPU算法调度和4颗DSP处理全向视觉避障信息,集通信、图传、避障、算法调度于一体。

针对无人机应用,酷芯端侧AI SoC芯片包括影像视觉和机器视觉功能,用于目标检测、识别、分析、跟踪、三维重建等。目前,酷芯影像及智能视觉处理芯片已历经一代AR9201、二代ARD33和AR9341,将在未来发布三代AR9521和AR9541。

地平线

地平线旭日3系列AIoT芯片有旭日3M和旭日3E两个型号,分别应对不同AI算力的需求。旭日3系列能够接入4到8路摄像头,摄像头分辨率可支持最高1200万像素,硬件支持多摄像头之间的精确同步,也可支持对于摄像头进行校正,内置的高性能ISP,可以进行高效能的图像处理,得到清晰、高质量画质,再加上高性能低带宽的特性,旭日3系列能够支持智能NVR、DVR在车载里面的环视,以及各种常见的视觉应用。

智能驾驶芯片方面,地平线产品也是由视觉处理向多传感器数据融合方向发展。征程5芯片可实现传感器融合,算力/功耗达到96TOPS/20W。

AI催生了新的视觉应用,也颠覆了传统的视觉设备。

由于AI的出现,处理器架构已经发生了翻天覆地的变化,把算法和处理器进行联合优化已经成为重要趋势。跨界阵营的扩大,也将继续延伸AI视觉应用的多样化功能,创造出更多更为贴近用户需求的产品。

据Counterpoint数据,2023 年由 SoC 驱动的具有专用AI核心的智能手机的比例预计将超过75%,而 2020 年时这个数字仅约为 35%。未来 1-2 年,独立的 AI 核心不仅会运用在旗舰机、高端机上,还会在主流机、入门机中得到大量普及。

智能家居方面也值得期待。视觉和传感交互的应用有望成为语音之后智能家居新的增长点,智能家居设备将向多模态交互发展,进一步催生可移动性产品的发展。更多的智能家居细分场景以及单品点位将持续爆发,尤其是围绕安全需求的单品与系统,将会更加具有前瞻性与突破性。

在工业领域,AI视觉已被誉为工业之“眼”,正逐步代替人眼,深度赋能智能制造。同时,在汽车智能化的趋势下,AI视觉也已经围绕舱内智能、ADAS等应用展开竞争。

我们已经进入了海量数据爆发的时代,端边云协同的AI视觉产业正在形成,这对算力、算法、数据、模型等又提出了新的要求。AI视觉已经在工业、消费、泛安防等领域逐步实现商用价值,未来也将继续在更多领域步入规模化落地应用,国产AI芯片也将迎来新的发展机遇。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK