网站首页 > 技术文章 正文
对神经网络(主要是CNN)进行剪枝,使模型运行速度变快,大小变小,且准确率与原来相近。这或许成为了众多神经网络实现者的共识,也催生了很多的创业公司,然而,UPC的Reza Yazdani等人却提出了不同的意见。一味地的剪枝压缩,可能会带来副作用。
Reza Yazdani等人针对自动语音识别(Automatic Speech Recognition)系统,说明,尽管在top-1的准确度方面,经过剪枝后的系统与base系统相比并未有明显的差别,但是在确信度方面,却大打折扣。
而这对DNN后续的操作提出了更高的要求和计算复杂度,即beam search算法,特别是viterbi译码器的使用频次显著增加。也就是说,经过剪枝后的DNN输出,其确定度降低,使得寻找最优路径的问题变得较为棘手,而且整个系统的执行时间也显著增加,需要迭代多次才能够得出较为满意的WER性能。
Reza Yazdani等人针对这一问题,提出了DNN ACC+Viterbi ACC联合设计的方案,为了降低由于DNN剪枝带来的Viterbi计算量,每次只搜索概率最高的N条路径,同时采用了组相连的hash表。相比较于当下的ASR系统,能够获取9倍的能效比,4.5倍的性能提升,和2倍的面积削减。
通过ISCA2018这篇论文也可以看出一个变化,从开始一味地追求CNN加速器性能的最大化,到通过剪枝压缩或者低精度来实现高能效比,再到如今的系统级协同设计,神经网络加速器的设计也在逐渐演变和改进之中。
猜你喜欢
- 2024-10-01 机器学习与深度学习常见面试题(下)
- 2024-10-01 青颖飞帆(青书)大模型算法工程师面试题6道|含解析
- 2024-10-01 解放生产力!这个AI想帮你写python,还能任你调教 | 开源
- 2024-10-01 基于深度语义学习的测试补全 深度语义模型
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)