国产AI视觉芯片，谁是最强“卷王”？

人工智能三大主要应用场景：语音识别、自然语言处理、视觉应用，其中，视觉是发展最为成熟的领域之一。

对于快速发展的AI视觉来说，一个非常重要的基础就是AI芯片。随着落地规模越来越大、场景越来越丰富，对AI视觉芯片也提出了更高要求。哪类芯片更受欢迎？主要落地哪些场景？能够解决哪些行业痛点？本文梳理了18家本土厂商的AI视觉芯片及相关应用，试图分析出一些技术和落地趋势。

渐成主流的三大AI视觉方案

根据应用方向来看，市面上的AI视觉方案可以简单划分为三大类：低功耗AI视觉方案、AI IPC模组方案、AI算力盒子。

第一，随着端侧智能需求越来越旺盛，低功耗AI视觉方案在迅速发展，主要应用品类有手机、智能门锁、智能门铃、家用AI摄像机等等。这些方案采用电池供电方式，因此对功耗要求非常高，使得低功耗AI视觉方案成为主流的应用。

面对越来越高的场景复杂度和图像质量要求，传统ISP图像处理技术已近瓶颈。随着参数库逐渐庞大，调试越发困难，开发周期逐步拉长，画质提升的投资收益率也越来越低。此时，画质技术与AI技术的深度融合至关重要。利用AI算力深度学习海量场景和数据，智能调优复杂参数，输出算法模型辅助图像处理，使图像质量突破传统ISP极限。AI与传统ISP的结合趋势在手机中非常突出，并且也在走入泛安防领域。

第二，随着AI视觉应用在泛安防场景落地加速，传统安防的人脸识别、人形检测、入侵侦测等技术需求已经向消费场景渗透，网络摄像头（IP Camera）设备越来越趋向高清化、智能化。

IPC设备本身有一定的开发门槛，需要众多技术支持。而AI IPC模组由于自带应用算法，通常支持多种无线接入方式，且SDK便于用户二次开发，因此比较受欢迎。这类方案相对比较成熟，进入了大批量出货阶段。

第三，AI算力盒子是AI和边缘计算结合的设备，可实现端侧和边缘系统中的高性能计算和AI性能。

随着端侧智能需求提升，数据量也水涨船高，这类“盒子”设备越来越受到市场欢迎，它们往往具备丰富的功能拓展性，包括以太网、USB等接入功能，方便接入各种传感器和外设，如连接摄像头进行图像采集等，支持HDMI显示或CAN工业总线等，支持Wi-Fi、4G/5G通信，从而实现视觉识别+数据处理/分析的一站式控制，让数据的传输、处理更高效，一定程度上推动了AI从云端的下沉应用。

五类AI视觉芯片大PK

剖开这些方案内部，AI视觉主芯片可以简单区分为GPU、CPU/集成GPU、带NPU的SoC、FPGA、以及RISC-V架构芯片等。这些芯片分别面向不同的应用和用户类型，也各自呈现出不同的发展趋势。

其中，基于GPU的开发板可能是许多用户刚开始AI开发时就接触到的，比如NVIDIA TX2或Nano，AMD的APU SoC等。这类产品最大的优势是生态完善，不论是Tensor Flow、Caffe、PyTorch哪种框架，或是哪种AI库，运行起来都很流畅，开发体验也比较好。

第二类CPU/集成GPU，主要针对中低算力需求的应用，只需已有的CPU或是集成GPU就可以满足。优势在于整体硬件成本更低，且方案成熟；缺点就是算力不够大，不能支持太大的AI模型。

第三类是带NPU的SoC，已经越来越成为AI视觉主芯片的一大趋势，它们将NPU与主处理器集成在一起，可满足中高算力需求。这方面的代表有海思3519AV100、Hi3559A，瑞芯微RK3399Pro、RK1808等。由于是单芯片，硬件成本也适中，挑战主要在于模型的量化部署方面，以及模型部署工具的成熟度，主要依赖于芯片厂商成熟的工具链支持。

除了这类单芯片设计，市面上还有一类神经计算加速棒产品，例如Intel Movidius、瑞芯微等都提供这类产品，可以通过USB插到板卡上提供运算能力。但是这类方案需要进行相互之间的数据传输，对于整体的方案设计、硬件的稳定性等都有一定挑战。

第四类基于FPGA的主控芯片，主要满足对实时性要求较高的应用，比如自动驾驶/辅助驾驶、工业级应用等。挑战在于开发难度，涉及一些自研AI加速FPGA逻辑，需要底层的加速设计和量化方案设计，以及相应的转换、编译。

第五类是RISC-V架构的芯片，近两年得到了较大的发展。比如嘉楠基于双核64位RISC-V架构+ISP图像处理器的K510、全志科技最新推出的ARM Cortex-A7+RISC-V协处理核的多目异构AI视觉芯片V853、晶视智能基于平头哥的双核RISC-V IP+TPU+ISP的AI视觉芯片等。

由于需要进行图像处理，这类芯片往往需要采用RISC-V主处理器+ISP或是Arm CPU+RISC-V协处理器的异构形式，以应对更大的算力需求和更高的图像处理性能。

新老国产芯片厂商猛攻AI视觉赛道

OPPO马里亚纳X影像处理芯片

自研DSA架构，其中包含多个IP：有自研NPU IP—MariNeuro、自研ISP IP—MariLumi、自研MIPI接口IP、Arm控制IP，以及自主设计的双层内存系统等。MariLumi主要进行图像信号的降噪和HDR处理，MariNeuro主要负责AI降噪算法加速，自研MIPI用于对接各种图像传感器，包括OPPO和Sony定制的传感器，Arm控制IP主要用于I/O口控制等，双层内存架构用于内部数据搬运。

vivo AI-ISP影像芯片

vivo最近宣布新一代自研影像芯片由传统ISP架构升级到了AI-ISP架构，可实现 1.3 万亿 bit /s的数据吞吐速率，16.3 Tops/w能效比，夜景视频降噪效果提升 20%。

基于AI-ISP架构革新，vivo新一代自研芯片实现了三大突破：第一、片上内存单元的升级，带来了每秒1.3万亿bit的数据吞吐速率，拥有了强大的算力保障。第二、AI计算单元的升级，带来超高能效比，DLA加速器的峰值能效比达到每瓦16.3 万亿次运算。第三、图像处理单元的升级，提升了AI-NR降噪、HDR影调融合、MEMC插帧等算法效果。

MediaTek天玑9000

MediaTek天玑9000在影像技术方面比较有代表性，采用Imagiq 790 ISP，处理速度最高可达90亿像素/秒，据称几乎是竞争对手的3倍。集成了第 5 代 APU（APU590）旗舰级 AI 处理器，性能和能耗表现相比上代均提升 400%。以 GPU+APU 协同工作，平衡功耗与画质需求。通过游戏 AI 低负载技术，GPU 只需更低的渲染资源消耗，就能获得接近原生高分辨率的画质，起到提升游戏画质同时降低功耗的作用。短视频也是目前最受用户喜爱的重点应用之一，APU590 可为抖音带来 2K 超分视频体验，画面清晰度可提升 18%，让 2K 短视频高清视觉体验触手可及。

爱芯元智

爱芯元智先后推出了AX630A、AX620A、AX620U、AX170A两代四颗端侧、边缘侧AI视觉感知芯片。AX630A针对智慧城市、智慧交通等密集场景，以暗光图像视频处理能力和20路1080p 30fps的解码能力为主要卖点；AX620A则更强调这些场景下满足电池应用方案的低功耗优势，兼顾IoT、智能运动相机、手机等应用场景。

Pre ISP芯片AX170A今年3月通过手机客户验收，正式进入商用阶段，落地消费领域。这是一颗影像专用AI处理芯片，最高算力28.8TOPS，独立DDR带宽最高可达8.5GBps，可对4K 30fps（每秒传输帧数）影像实时画质优化，配合主控芯片可实现超级夜景视频和暗光拍摄功能，完成4K夜景视频的预览和拍摄。

海思

在暗光场景，海思综合利用8级3D降噪和多光谱融合多种技术提供暗光成像品质。其中8级3D降噪技术利用8级滤波器进行降噪处理，它可以在空域滤波过程中同时实现图像去噪和增强，以及在时域滤波过程中混合两种不同的时间模式。8级3D降噪技术还包含两个用于细节增强的IE模块和一个锐化模块，可以在实现更强的去噪的同时，保留并增强更多的图像细节。而多光谱融合则通过红外补光，在ISP将可见光、850nm、940nm等常见光谱融合，在不增加光污染的同时，最终使图像效果达到暗光全彩，细节纹理丰富，过曝区和非过曝区准确处理。

此外，市面上还有搭载海思Hi3559A等芯片的AI算力盒子，这款芯片深耕于高性能影像处理，通过DSP可以加速视频解码，且拥有NNIE来支援深度学习神经网路，可以做到影像大解析度的分析以及高速的资讯交互传输，适合智慧安防及智慧零售等相关影像视觉AI应用。

国科微

国科微2015年进入安防IPC领域，正逐步构建安防前后端全系列布局。基于新一代AI ISP引擎，国科微最新推出高端IPC SoC GK7608。面对夜间彩色成像难题，GK7608引入 “黑白彩色双光融合”技术，无需补充白光，在夜晚仍可获得光彩鲜艳的图像，为客户提供高质量的低噪全彩方案。GK7608搭载高算力双核NPU实现多个神经网络并行运算，可应用到200个人/车的高密度场景，消除高密度场景盲区。

顺应智能化和超高清发展趋势，NVR芯片必须支持更多的接入路数，具备更高的清晰度、集成智能分析能力。国科微NVR SoC GK7618可同时解码24路1080P30 视频，集成多核处理器和图像分析处理器，支持后端多种智能算法应用，提供高性能、智能化、易开发的NVR方案。

瑞芯微

瑞芯微三大类视觉芯片包括智慧视觉方案RV1126和RV1109、AIoT平台RK3568、边缘计算高性能平台RK1808和RK399Pro，可满足不同场景的算力需求。

基于自研的ISP 2.0技术及NPU性能，RV1126及RV1109适用于智能网络摄像头IPC、电池IPC/智能门铃、门禁/闸机、智慧屏摄像头及车载视觉等应用场景。RK3568主要面向网络视频录像机（NVR&XVR）、云终端、物联网网关、智能闸机/门禁等领域。采用四核A55架构CPU，G52 GPU；内置NPU，可提供1T算力。内置独有的ISP图像处理器，支持8M处理能力，强大的HDR，支持畸变矫正、去雾、噪点消除等功能。RK3399Pro和RK1808是瑞芯微第一代内置有NPU的高性能人工智能处理器，算力3T，应用于各类对算力有较高要求的嵌入式智能产品。

君正

视觉AI应用协处理器T02拥有8T计算能力，全速运行情况下功耗1.5W，可以搭配各大平台实现视频结构化——车牌、车型、人脸、人形，完成检测及分析，用于平安城市、电力、学校等多种安防项目中。

最新一代智能视频SoC芯片T31系列采用22纳米工艺，拥有1.8G主频，最高支持500万25帧。可在设备端集成君正的系列深度学习算法，包括深度学习的人形、人脸、车牌的检测和识别。相较于传统的CV算法，君正深度学习算法在复杂环境如遮挡、大角度等场景下更准确，解决了CV算法的痛点，赋能端级AI，主要应用包括智能门铃、HIVE智能卡片机、热成像与人脸识别一体机等。

全志

全志科技最新发布了V853多目异构AI视觉芯片产品，采用三核异构设计，包括Arm Cortex-A7主核、RISC-V协处理核与AI NPU。其中，Arm Cortex-A7主核可适应于兼容各类应用开发调试，RISC-V协处理核重点负责各类传感器场景，提高实时响应速度，AI NPU则专注解决复杂多变的视觉检测识别场景，其检测识别帧率相较于传统CPU方式可最少提升20倍以上。三核异构解决了传统单核面对复杂视觉场景体验不佳的痛点问题。这款芯片已进入量产阶段，多个目标细分市场客户正在进行产品方案开发和优化工作，不久即将面市。

嘉楠

勘智K510是嘉楠公司推出的第二代AI边缘侧推理芯片，提供高性能的图像及语音处理能力。K510-CORE是核心模组，板载一颗K510芯片，CPU采用双核64bit RISC-V架构，K510搭载自主研发的第二代神经网络处理器KPU2.0，采用计算数据流技术，算力较上一代提升3倍同时降低功耗。板载内存为512MB LPDDR3@1600MHz。支持两路MIPI串行图像输入和一路DVP并行图像输入，支持1路MIPI图像输出。可用于工业/专业相机、3D识别模组、考勤门禁门锁智能终端、AI教育开发板/机器人等。

云天励飞

云天励飞嵌入式视觉AI大脑芯片DeepEye1000是一款异构多核视觉分析SoC芯片，内嵌自定义指令集神经网络处理器，可广泛用于摄像机以及数字城市、新零售等场景。

针对机器人市场，云天励飞基于DeepEye1000打造了Mini PCIe AI加速卡，能够快速满足机器人厂商对现有产品和方案智能升级的需求。应用云天励飞DeepEye1000的厂商不仅能够直接应用云天励飞自研的上百种计算机视觉算法，也能够通过云天励飞的开放的工具链，搭载自研或第三方厂商的算法。

亿智电子

亿智电子SH系列AI芯片，支持基于深度神经网络的指尖识别、文字识别(OCR)、手势识别、人形跟踪、人脸检测、人脸识别、骨骼分析等智能算法，为智能云台、扫译笔、消费和办公场景摄像头提供AI算力。SV系列AI芯片主要面向视像安防场景，集成人脸识别、口罩识别、支持红外测温等功能，实现无接触式测温、考勤、鉴权等功能，广泛应用于考勤门禁、AI-IPC等。

在汽车电子领域，SA系列的AI芯片集成高级驾驶辅助系统(ADAS)、驾驶员行为监控(DMS)、盲区检测(BSD)等智能算法，应用于AI行车记录仪、智能部标机、电子后视镜、智能车载摄像头等智能车载电子产品。

清微智能

清微智能TX510是一款面向IoT设备的超低功耗视觉处理芯片，基于可重构计算架构，内置3D引擎支持AlexNet、GoogleNet、ResNet、VGG等主流神经网络，可实现人脸识别、物体识别、手势识别、目标跟踪等功能。清微智能的可重构技术通过实现“软件可编程、架构能变换”的能力，在同等功耗下具有更强算力，并具有低成本、应用开发简便等特征。

TX510芯片的AI算力为1.2T(Int8)/9.6T(Binary)，峰值功耗小于450mW，启动时间小于200ms，AI有效能效比达5.6TOPS/W。支持3D结构光，支持3D活体检测、红外活体检测、可见光活体检测等，可以抵御照片、视频等二维攻击，面具等三维攻击。可广泛应用于智能安防、金融支付、机器人、航空航天等多种领域。

雄迈

XM530BX0-LP1 是一款多功能高效的网络视频处理器芯片，包含了雄迈第三代ISP处理技术，相比传统的ISP除了功能，还支持透雾、宽动态、以及RGB-IR等新一代特征。同时该芯片还支持H.264/H.265，MJPEG等视频、图像压缩编码及视频传输，能够高效地完成图像编码及传输。ISP图像处理具有最大300W 像素(2048*1536)图像处理能力，支持bayer图像输入，支持MIPI CSI接口输入。可方便应用于视频监控，网络处理等方面的应用。

知存科技

WTM8000系列是一款针对视频增强处理的存算一体AI处理芯片，可实现基于AI的各种视频增强处理，包括物体识别、分类检测，以及视频增强等算法，适应于各种高能效复杂边缘计算场景；能为视频显示提供4K/8K@60/120FPS 的插帧、超分、HDR宽动态和降噪能力；能为AI-ISP提供4K@60FPS的高能效NPU及高清视频增强能力，例如HDR宽动态、降噪处理等。 WTM8000系列产品通过3D IC融合高能效存内计算与先进逻辑工艺，实现高算力、低功耗与高性价比的AI解决方案。

晶视智能

晶视智能CR182x系列芯片采用平头哥RISC-V C906内核，是一款定位于泛安防市场的轻智能AI视觉芯片。该芯片具备0.5 TOPs算力，支持2路MIPI或者DVP视频输入，最大分辨率2880*1620@30fps，内置DDR以及百兆MAC PHY。这款芯片除了采用双核RISC-V，还集成了晶视智能自研的TPU、ISP，在9X9平方毫米的小封装尺寸上提供双摄+屏显+内建DDR的紧凑设计。

酷芯微电子

酷芯AR9201以自研ISP边缘端芯片技术加视频解码器完成高清图片和影像传输，支持超低延时基带芯片补足5G通讯、CPU算法调度和4颗DSP处理全向视觉避障信息，集通信、图传、避障、算法调度于一体。

针对无人机应用，酷芯端侧AI SoC芯片包括影像视觉和机器视觉功能，用于目标检测、识别、分析、跟踪、三维重建等。目前，酷芯影像及智能视觉处理芯片已历经一代AR9201、二代ARD33和AR9341，将在未来发布三代AR9521和AR9541。

地平线

地平线旭日3系列AIoT芯片有旭日3M和旭日3E两个型号，分别应对不同AI算力的需求。旭日3系列能够接入4到8路摄像头，摄像头分辨率可支持最高1200万像素，硬件支持多摄像头之间的精确同步，也可支持对于摄像头进行校正，内置的高性能ISP，可以进行高效能的图像处理，得到清晰、高质量画质，再加上高性能低带宽的特性，旭日3系列能够支持智能NVR、DVR在车载里面的环视，以及各种常见的视觉应用。

智能驾驶芯片方面，地平线产品也是由视觉处理向多传感器数据融合方向发展。征程5芯片可实现传感器融合，算力/功耗达到96TOPS/20W。

AI催生了新的视觉应用，也颠覆了传统的视觉设备。

由于AI的出现，处理器架构已经发生了翻天覆地的变化，把算法和处理器进行联合优化已经成为重要趋势。跨界阵营的扩大，也将继续延伸AI视觉应用的多样化功能，创造出更多更为贴近用户需求的产品。

据Counterpoint数据，2023 年由 SoC 驱动的具有专用AI核心的智能手机的比例预计将超过75%，而 2020 年时这个数字仅约为 35%。未来 1-2 年，独立的 AI 核心不仅会运用在旗舰机、高端机上，还会在主流机、入门机中得到大量普及。

智能家居方面也值得期待。视觉和传感交互的应用有望成为语音之后智能家居新的增长点，智能家居设备将向多模态交互发展，进一步催生可移动性产品的发展。更多的智能家居细分场景以及单品点位将持续爆发，尤其是围绕安全需求的单品与系统，将会更加具有前瞻性与突破性。

在工业领域，AI视觉已被誉为工业之“眼”，正逐步代替人眼，深度赋能智能制造。同时，在汽车智能化的趋势下，AI视觉也已经围绕舱内智能、ADAS等应用展开竞争。

我们已经进入了海量数据爆发的时代，端边云协同的AI视觉产业正在形成，这对算力、算法、数据、模型等又提出了新的要求。AI视觉已经在工业、消费、泛安防等领域逐步实现商用价值，未来也将继续在更多领域步入规模化落地应用，国产AI芯片也将迎来新的发展机遇。

渐成主流的三大AI视觉方案

五类AI视觉芯片大PK

新老国产芯片厂商猛攻AI视觉赛道

Recommend

单飞一年后 PICO 的爱与怕

清库存！SSD要狂降价零售商喊话给钱就“卖”：2TB仅700元搞定？

科技股暴跌，又一场来自“旧经济的复仇”

2400流明+120Hz高刷！优派Q30投影仪开卖 7499元

Grey Skies in Cloud Earnings

Louis Armstong’s Black & Blues takes a bold look at a jazz legend [Apple TV+...

2022 年旧手机回收哪家比较靠谱

Rode launches new gamer oriented products | TechSpot

快充终于质变到量变了， 210 瓦， 9 分钟， 0%-100%

AMD fixes infamous black screen issue on Windows 11 22H2 with latest driver

About Joyk