每日更新

新芯片的计算能力可能是最好 GPU 的 1,000 倍

所有版权归中国经济网所有。
中国经济网新媒体矩阵
网络广播视听节目许可证(0107190)(京ICP040090)
科技日报北京10月14日电(记者张格莲)近日,北京大学人工智能研究院孙忠研究员带领的团队与集成电路学院研究团队成功研制出基于阻变存储器的可扩展高精度模拟矩阵计算芯片。首次实现了精度可与数字计算相媲美的模拟计算系统。在解决大规模 MIMO 信号检测等重要科学问题时,该芯片的计算性能和功效比当前领先的数字处理器 (GPU) 高出数百或数千倍。 10月13日《自然电子》杂志上发表了相关文章。我们熟悉处理com通信基站信号并优化大规模人工智能模型的训练参数,这本质上涉及求解复杂的矩阵方程。使用数字方法实现高精度矩阵求逆的计算成本非常高,并且消耗大量的时间和精力。于是,曾经被认为是古老技术的模拟计算重新进入了研究领域。它直接利用物理定律来实现低延迟、低功耗的并行计算。这在算力瓶颈的背景下具有独特的优势。然而,如何使模拟计算具有高度精确性和可扩展性,使其在现代计算任务中发挥其固有的优势,是一个困扰全球科学界的百年难题。孙忠团队选择了集成创新之路。通过共同设计新颖的信息器件、独特的电路和经典算法,我们构建了高精度、可扩展的全模拟矩阵基于电阻开关存储矩阵的方程求解器。这首次将模拟计算的精度提高到24位定点精度。孙忠先生,研究员。我们提出,团队基于迭代算法将模拟低精度矩阵求逆运算和模拟高精度矩阵向量乘法运算相结合,开发出基于完全模拟矩阵运算的高精度矩阵方程解。首先,我们快速计算矩阵方程的“近似解”,然后使用“位切片”技术来实现迭代细化。在计算精度方面,该团队能够成功地以 24 位点精度对 16×16 矩阵进行实验求逆。求解矩阵方程10次迭代后,相对误差低至10-7。在计算性能方面,其计算能力超过了高端GPU单核的性能。n 求解 32×32 矩阵求逆问题。当问题扩展到 128×128 时,计算性能达到最佳数字处理器的 1,000 倍以上。这款芯片可以在一分钟内完成传统GPU一天的工作。同时,该方案的能效比同精度的传统数字处理器高出100倍以上,为节能计算中心提供重要的技术支撑。研究团队将此应用于“MIMO(多输入多输出)信号的大规模检测”。仅经过3次迭代,恢复的图像与原始图像高度一致,并且误码率可与32位数字计算相媲美,凸显了其在实时信号处理方面的潜力。 “我们已经证明,模拟计算可以以极高的效率和精度解决现代科学和工程中的核心计算问题。”孙忠表示,这一突破gh具有广泛的应用潜力。 ,可以为多种计算场景提供支持,并有望重塑计算能力格局。该团队的研究探索了提高计算能力的有前景的途径,有望打破数字计算的长期垄断,标志着无所不在、绿色高效的计算能力新时代的开始。

你可能也会喜欢...

发表评论

邮箱地址不会被公开。 必填项已用*标注