3

100%自研指令集 国产CPU龙芯支持NCNN框架:性能轻松翻倍

 1 year ago
source link: http://news.pconline.com.cn/broadcasting/2211/15648844.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

100%自研指令集 国产CPU龙芯支持NCNN框架:性能轻松翻倍

2022-11-25 17:02 出处/作者:快科技 整合编辑:佚名 0

作为国产CPU的代表之一,龙芯这两年已经将架构转向自研的LoongArch指令集,号称100%自主,现在还在不断扩展LoongArch的应用领域,今天龙芯宣布支持了NCNN神经网络计算框架,各项性能比通用实现普遍提升一倍以上。

据龙芯介绍,近期经过龙芯中科与NCNN社区的共同努力,在NCNM中使用龙架构(LoongArch)向量优化实现了大部分算子,

得益于龙架构向量的高效实现,优化后NCNN在平台上各项性能测试比通用实现普遍提升一倍以上。

基于龙架构向量优化开启前后的NCNN各项性能对比

(竖轴为耗时高度,越高耗时越久,性能越低)

artBtm_banner.png

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK