必威体育-国外新闻热点-时事新闻爆料

分类

【必威体育】清华湃方团队两篇论文入选ISSCC 2020:AI芯片领域发展趋势“从通用到专用智能架构的转变”

2020年2月16日-20日,第67届IEEE 国际固态电路峰会(ISSCC 2020)于美国旧金山召开,中国共23篇论文获收录,包括中国内地15篇,其中,清华大学5篇,澳门6篇,香港2篇,创造了历年来的新高,全球仅次于美国、韩国位列第三。

ISSCC代表着芯片领域的国际最高学术水平,是国际上规模最大、最权威、水平最高的固态电路国际会议,被称为集成电路行业的芯片奥林匹克大会。国际上最先进的固态集成电路技术通常会在该峰会上首次发布。ISSCC 2020共收录了210篇论文,全部都来自全球的一流大学、研究机构以及AMD、Intel、IBM、TI等顶尖企业。继2019年实现中国首篇人工智能芯片ISSCC论文突破后,清华刘勇攀教授带领的智能传感团队和湃方科技再次贡献2篇人工智能芯片ISSCC论文。

· 引领低功耗AI领域:从通用到专用架构

ISSCC 2020以"Integrated Circuits Powering the AI ERA"为主题。此外,本届峰会在技术组委会筹建方面新增了一个亮点,"机器学习及人工智能"成立了独立的技术小组分会。新设"High-Performance Machine Learning"和"Low-Power Machine Learning"两个机器学习分会,且六个论坛中有两个与人工智能相关,足以见得该领域的重要性。

随着物联网、大数据、人工智能等技术的迅猛发展,全球数据量呈井喷式增长,相当一部分的运算将在本地终端进行而不是借助云端资源。与此同时,解决这些集成了传感和智能计算的无线终端面临的功耗问题就变成了一大挑战。而"Low-Power Machine Learning"分会正是针对智能无线终端等对功耗有极致要求的领域。该分会全部3篇论文均来自中国内地,分别是针对语音、视频以及稀疏网络等专用智能架构的研究与探索,其中2篇为该团队研究成果。

【必威体育】清华湃方团队两篇论文入选ISSCC 2020:AI芯片领域发展趋势“从通用到专用智能架构的转变”

图1 Program-Session 14

又见低功耗的天际

· 基于帧间数据计算复用的视频应用AI处理器

在智能汽车自动驾驶、智能无人机目标追踪、智能摄像机主动监测等场景中均使用了机器学习技术,传统AI处理器主攻静态图像处理,难以满足多帧视频图像处理的需求。团队袁哲博士在论文"A 65nm 24.7μJ/Frame 12.3mW Activation-Similarity-Aware Convolutional Neural Network Video Processor Using Hybrid Precision, Inter-Frame Data Reuse and Mixed-Bit Width Difference-Frame Data Codec"(14.2)中,提出了一款面向视频应用的神经网络处理器Sticker-V,包含以下关键技术点:(1)利用视频数据中帧间相似性,在传统帧内数据复用基础上新增了帧间复用维度,实现了在不损失网络精度的前提下提高计算速度的效果;(2)根据神经网络计算的数据复用与稀疏模式,设计了可配置三种卷积模式的计算单元和带累加功能的存储单元,提高了网络层内数据利用效率和帧间数据复用;(3)针对帧间数据复用模式,设计了两通路变比特长度片上片下数据压缩模块,有效降低数据传输量。该芯片在TSMC 65nm工艺上成功流片,最高可节省76%的单帧处理能量,将MobileNet-16网络模型的单帧处理能量降低至24.7μJ/Frame。

【必威体育】清华湃方团队两篇论文入选ISSCC 2020:AI芯片领域发展趋势“从通用到专用智能架构的转变”

图2 Sticker-V Chip Micrograph and Summary Table

· 自适应稀疏存内计算芯片——新兴电路架构

存内计算是一种新兴的电路架构,具有高并行度、高能量效率的特点。目前的存内计算电路架构面临的一个重要问题是规则存内计算电路无法支持不规则的稀疏神经网络,造成计算资源的大量浪费。团队岳金山博士在论文"A 65nm Computing-in-Memory-Based CNN Processor with 2.9-to-35.8TOPS/W System Energy Efficiency Using Dynamic-Sparsity Performance-Scaling Architecture and Energy-Efficient Inter/Intra-Macro Data Reuse"(14.3)提出了首款基于存内计算核心的系统级神经网络处理器Sticker-IM,包含以下关键技术点:(1)在规则的存内计算阵列上实现了不规则稀疏网络的优化,利用稀疏网络权重和输入数据的动态优化,提高芯片能效并加速计算;(2)实现了基于存内计算核心的片上系统芯片,支持不同bit的整体神经网络模型的动态映射和执行,通过灵活的网络映射和数据复用方法提升了系统资源利用率和数据访问效率;(3)设计了可动态关断的存内计算核心处理单元,实现了存内计算单元对运行稀疏网络的功耗优化。该芯片在TSMC 65nm工艺上成功流片,在MNIST和CIFAR-10数据集的不同神经网络模型中,实现了最高158TOPS/W的核心能量效率和最高35.8TOPS/W的系统能量效率。

【必威体育】清华湃方团队两篇论文入选ISSCC 2020:AI芯片领域发展趋势“从通用到专用智能架构的转变”

图3 Sticker-IM Chip Micrograph and Summary Table

· 厚积薄发▪连续创新

——智能传感团队的"芯"路历程