在最近的一份报告中,中国阿里巴巴表示,其研究中心达摩院已通过突破性的内存处理 (PIM) 芯片打破了冯诺依曼瓶颈,该芯片在 3D 中堆叠内存和逻辑。
这其实不是大公司第一次转向垂直结构以缩短内存和计算之间的距离。几年前,IBM 发表了关于3D 堆栈存储器和字节可寻址电阻非易失性存储器 (NVM) 如何为 EE 解决 PIM 的新方法的研究。

PIM 如何重新思考冯诺依曼架构
要执行操作,必须通过向内存控制器发送内存请求,将数据从 DRAM 存储移动到 CPU,通过窄内存通道进行通信。但是这种从 DRAM 到 CPU 的转移可能会给系统带来主要的瓶颈问题——增加能源消耗,同时减慢多个内存请求的交换速度。这就是系统一直工作的方式,至少自从数字二进制模型被广泛采用以来。

一些研究小组和公司正在创建 PIM 架构,以使内存处理更接近现实。去年,All About Circuits 讨论了有多少公司发现 内存计算可以在速度、容量和处理方面解决 AI 内存平衡问题。这是因为,与数字芯片不同,PIM AI 芯片在模拟领域执行——Imec 和 Globalfoundries在最近的 AI 芯片中将其称为“模拟内存计算(AiMC)”。
PIM 研究使模拟计算远离数字计算
PIM 电路不是使用晶体管来打开和关闭栅极并控制电流流动或不流动(创建 1 和 0 的序列),而是通过连接两个电流并通过调整电阻值进行乘法来执行加法。

然而,该团队发现,引入神经逼近器可以提高多个方向上单独转换的电阻列的处理效率:向下、横向或任何其他最大效率方向。
Zhang 的团队做出的最重要的发现是,可以使用单个 ADC 将 RRAM crossbar 列创建的部分和转换为数字格式,无论它们的数量是 18、64 还是 128,从而减少了外边缘的转换次数尽可能。
三星支持内存处理
三星正试图通过将高带宽内存 (HBM) 和内存处理与加速器系统集成来弥合内存和逻辑之间的差距。结果是 HBM-PIM 架构适用于移动和其他商业 DRAM 模块,包括数据中心和超级计算机。

三星已经看到这款 PCU 在图像分类、语音识别和翻译方面取得了可喜的成果。SAP HANA 还与三星合作改进内存数据库管理系统 (IMDBMS)。
PIM 是否有助于减轻边缘 AI 处理的负担?
尽管如此,程序员仍面临着定义与编程模型通信的方式的挑战性任务。这些工程师和系统架构师还必须找到数据分配问题和 PIM 运行时调度的解决方案。
来源:半导体行业观察

赵工
13488683602
zhaojh@kw.beijing.gov.cn
欢迎各公众号,媒体转载,申请加白名单秒通过
投稿/推广/合作/入群/赞助/转发 请加微信13488683602