• 《工程索引》(EI)刊源期刊
  • 中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

信息专辑+深度神经网络模型量化方法综述

杨春 张睿尧 林金辉 黄泷 遆书童 董志伟 陈松路 刘艳 殷绪成(通讯作者)

杨春, 张睿尧, 林金辉, 黄泷, 遆书童, 董志伟, 陈松路, 刘艳, 殷绪成(通讯作者). 信息专辑+深度神经网络模型量化方法综述[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2022.12.27.004
引用本文: 杨春, 张睿尧, 林金辉, 黄泷, 遆书童, 董志伟, 陈松路, 刘艳, 殷绪成(通讯作者). 信息专辑+深度神经网络模型量化方法综述[J]. 工程科学学报. doi: 10.13374/j.issn2095-9389.2022.12.27.004
A Survey of Quantization Methods for Deep Neural Networks[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2022.12.27.004
Citation: A Survey of Quantization Methods for Deep Neural Networks[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2022.12.27.004

信息专辑+深度神经网络模型量化方法综述

doi: 10.13374/j.issn2095-9389.2022.12.27.004
详细信息
  • 中图分类号: TP183

A Survey of Quantization Methods for Deep Neural Networks

  • 摘要: 近年来,利用大规模预训练深度神经网络模型来提高具体任务下的泛化能力和性能,逐渐成为基于深度学习的人工智能技术与应用发展的一大趋势。虽然这些深度神经网络模型表现优异,但是复杂的模型结构、庞大的模型参数量以及惊人的运算量使得它们难以被部署在边缘及端侧硬件平台上。为了解决这个问题,模型压缩与加速技术应运而生。在多种模型压缩与加速方案中,模型量化是其中主要技术,是大规模商业化应用推广的核心问题。模型量化技术可以通过减少网络参数的位宽和中间过程特征图的位宽来达到压缩加速深度神经网络的目的,从而使量化后的网络能够部署在资源有限的边缘设备上。本文较全面地调研了不同角度下模型量化相关技术,深入地总结归纳了不同方法的优缺点,并探究了量化技术目前仍然存在的问题以及未来可能的发展方向。

     

  • 加载中
计量
  • 文章访问数:  116
  • HTML全文浏览量:  4
  • PDF下载量:  27
  • 被引次数: 0
出版历程
  • 网络出版日期:  2023-03-24

目录

    /

    返回文章
    返回