只需 28nm 工艺 国产芯片能效提升 10 倍



仅仅在五、六年前,人工智能还只存在于人们的想象。

短短几年间 AI 快速扩张,AI 算力和运算数据量每年都在以指数级增加,对算力的需求空前,但摩尔定律却已接近极限。

在能耗墙和存储墙的阻挡下,半导体愈来愈蹒跚的算力提升已经追不上狂奔的 AI。

存算一体架构有机会让 AI 面临的问题迎刃而解。时代的浪潮下,一批探索存算一体的企业相继成立。

在这个领域中,国内外研究几乎站在同一起跑线上。

其中亿铸科技是将新型存储器 ReRAM 用于存算一体赛道的 " 先行者 "。成立仅仅两年,亿铸科技就已能够设计出能效比超过主流计算卡十倍的基于 ReRAM 的存算一体 AI 大算力芯片。

在即将到来的存算一体爆发期,国产厂商们将要迎来的,是一场与国外巨头们堂堂正正的对决。

【名为 GPU 的马,拉不动 AI 的车】

自 1956 年约翰 . 麦卡锡在达特茅斯会议上提出人工智能的概念,AI 已经发展了 70 年。

70 年间,AI 曾经爆发过三次浪潮。

在前两次浪潮中,AI 由于种种原因,最终未能普及。

直到第三次浪潮中,深度学习技术的兴起,解决了 AI 普适性与可维护性的问题,这一赛道才真正迎来曙光,造就了现代意义上的基于深度学习的 " 人工智能 "。

随着深度学习的广泛应用,对算力的需求日益增加,这让能够提供大规模算力的 GPU 在 AI 领域变得越来越重要。

然而 GPU 毕竟不是专为人工智能而生,随着人工智能发展走入深水区,GPU 的问题逐渐浮现,尤其是 AI 发展中的 " 存储墙 "、" 能耗墙 " 问题,GPU 无法突破。

无论是 CPU 还是 GPU,采用的都是存算分离的冯诺依曼架构。

在冯诺依曼架构下,80%-90% 的功耗发生在数据传输上,99% 的时间消耗在存储器读写过程中,导致了 " 存储墙 " 和 " 功耗墙 " 问题。

冯诺依曼架构的芯片在工作时,计算单元要先从内存中读取数据,计算完成后再存回内存,才能最终输出。

但在过去几十年中,存储器与处理器的发展严重失衡,自上世纪八十年代以来,存储器读取速率的提升远远跟不上处理器性能的增长。

这导致了计算畸形的漏斗结构:无论处理器所在的漏斗 " 入口 " 一端处理了多少数据,也只能通过存储器狭窄的 " 出口 " 输出,严重影响了数据处理的效率。

曾在 AI 芯片公司 Wave Computing 工作过的熊大鹏博士对此深有感悟。

2014 年左右,熊大鹏正在从事 GPGPU 领域的研究,在工作中他深感能耗墙与功耗墙的限制下,人工智能难以持续发展。

熊大鹏认为,打破内存与计算隔阂的存算一体架构是人工智能未来的一个可能解。

不同于冯诺依曼架构,存储单元与计算单元一体的结构让数据不必在两者之间反复 " 搬运 ",从而让 " 能耗墙 " 与 " 功耗墙 " 问题迎刃而解。

谈起对存算一体技术的初印象,熊大鹏说到:"2017 年我第一次接触到存算一体技术,当时就震惊于怎么会有这么好的东西能够恰好解决 AI 芯片面临的问题。"

在初识存算一体后,熊大鹏兴趣盎然,立刻开始了着手从产业界到学界学习和调研,对存算一体建立了系统的认识。

当时,把存算一体运用到 AI 中还只是一种理论,熊大鹏还没有找到将他在存算一体领域的雄心落实的机会。

熊大鹏得以实现抱负的契机是与 ReRAM 的偶遇,这也是他在 2020 年创立存算一体 AI 芯片公司亿铸科技的关键。

【存算一体的 " 天时 "、" 地利 " 与 " 人和 "】

2018 年,熊大鹏在工作中接触到了 ReRAM 的领军企业 Crossbar。当时正在苦苦寻找存算一体技术在 AI 芯片领域落地方案的他,刚一接触 ReRAM,就近乎直觉地认为 ReRAM 有解决存算一体落地问题的能力。

存算一体的存储介质选择一般有三种方案:Flash 等传统存储介质;相对成熟的易失性存储器 SRAM;以及 ReRAM 等新型存储器。

熊大鹏说,不同的存储介质有不同的特点,也有各自最适配的应用领域,而在他看好的 AI 大算力芯片场景下,ReRAM 则是最合适的选择。

在他看来,NAND Flash 读写延时较大,性能相对落后,并且工艺节点在 40nm 左右,难以随先进工艺继续迭代,无法满足 AI 大算力芯片的计算需求。

SRAM 存储器在大算力场景下则存在单位密度受限、漏电流和工程落地难度和成本较高等问题。

而 ReRAM 虽然在应用于模拟存算一体时也存在着精度和数模转换等难题,但在熊大鹏看来,亿铸科技选择的基于 ReRAM 的全数字化存算一体技术,能较好解决精度和数模转换等难题,无疑更适合应用在 AI 大算力芯片的场景中。

ReRAM 是一种新型非易失存储器,其基本存储单元被称为忆阻器,是一种可编程电阻,其特点是在断电之后电阻值依然能够长期保持。




上一篇:POCO F4 GT DXOMARK 音频测试结果正式出炉:总分128,
下一篇:1000km 续航不是梦!电池巨头联合极氪推新电池