查看完整版本: [-- 新型“存算一体”芯片问世 --]

武当休闲山庄 -> 数码讨论 -> 新型“存算一体”芯片问世 [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

huozm32831 2025-07-24 20:34
在大数据时代,排序(如给海量数据快速排名)是人工智能、搜索引擎、导航、数据库等众多关键技术的基石之一。但传统计算机芯片处理排序任务时,依赖复杂的比较器和频繁的内存读写,速度慢、耗能高、芯片面积大,越来越成为智能硬件的发展瓶颈。北京大学信息工程学院/广东省存算一体芯片重点实验室杨玉超教授、陶耀宇研究员团队,在国际学术期刊《自然·电子》上发表科研成果——他们在国际上首次成功构建了面向高复杂度排序任务的存算一体化硬件系统,创造性地提出了一个不需要比较器的排序新架构,打破了存算一体难以处理复杂排序的限制,实现了该技术从处理简单线性计算向攻克复杂非线性任务的重大飞跃。

  杨玉超介绍,近年来,融合存储与计算的“存算一体”技术,特别是利用新型忆阻器芯片的技术,凭借高密度、高能效等优势,被视为突破瓶颈的关键方向。然而,排序这种高度依赖比较操作的复杂任务,一直被认为是存算一体技术最难啃的“硬骨头”。

  “该系统的核心创新在于利用了忆阻器阵列的独特能力。我们提出了忆阻器阵列位读取机制:从数据最高位开始,芯片能在存储单元内同时读取所有数据的位比特,快速定位当前最小或最大值,完全摒弃了传统需要两两比较再选择的烦琐排序流程。在此基础上,我们又设计了名为‘树节点跳跃’的智能排序算法和硬件架构,能有效跳过重复的位读取操作步骤,大幅减少冗余计算,显著提升了排序效率。”杨玉超告诉记者。

  陶耀宇表示,为了应对现实中不同规模和特点的排序任务,研究团队还开发了三种灵活的架构扩展策略:多阵列,将海量数据按数分配到多个忆阻器阵列同时处理;位分区,将数据的不同位数拆分到多个阵列进行流水线操作;多电导,利用忆阻器单元本身的多状态特性,在单个单元内并行处理更多信息。这三种策略可以根据实际需求自由组合,形成一套完整的存算一体排序硬件加速体系化方案。

  研究团队不仅设计了新架构,还基于实际流片的忆阻器芯片搭建了完整的应用演示系统。经过在多种典型排序数据集上严格测试,这套新系统展现出惊人性能:相比当前主流的专用排序芯片,其速度提升了最高7.7倍,能效提升了惊人的160.4倍,芯片面积效率提升了32.46倍,充分证明了存算一体架构在处理海量数据排序时的巨大潜力。

  杨玉超透露,为了验证系统的实用价值,研究团队将其应用于两个实际场景:在北京地铁站点间的最短路径规划应用中,新系统成功求解了16个站点间的最优路径,在保证结果准确的同时,显著降低了延迟和功耗;在人工智能神经网络推理任务中,将新存算一体排序技术与忆阻器的存算一体矩阵计算能力融合,实现了“实时原位稀疏”——可以根据需要灵活调整计算量,在保证精度的前提下大幅提升效率。在这类应用中,新系统比传统专用排序芯片速度提升了15倍,能效提升了67.1倍。“这项突破性研究为未来高效处理大数据提供了强大的硬件基础。”

jjybzxw 2025-07-24 22:29
存算一体技术在大数据排序中的突破

在大数据时代,排序任务是许多关键技术的基础,包括人工智能、搜索引擎、导航和数据库等。然而,传统计算机芯片在处理排序任务时面临诸多挑战,如依赖复杂的比较器和频繁的内存读写,导致速度慢、耗能高、芯片面积大等问题。为了解决这些瓶颈,北京大学信息工程学院/广东省存算一体芯片重点实验室杨玉超教授和陶耀宇研究员团队在《自然·电子》上发表了一项重要研究成果。

核心创新与技术突破

1. 存算一体技术:
   - 高密度与高能效:存算一体技术通过融合存储与计算,利用新型忆阻器芯片,实现了高密度和高能效的优势。
   - 无需比较器:传统排序依赖复杂的比较器网络,而新架构完全摒弃了比较器,通过忆阻器阵列位读取机制,从数据最高位开始,同时读取所有数据的位比特,快速定位当前最小或最大值。

2. 忆阻器阵列位读取机制:
   - 并行读取:芯片能在存储单元内同时读取所有数据的位比特,快速定位当前最小或最大值。
   - 树节点跳跃算法:通过遍历路径与信息复用,显著减少了冗余操作,大幅提升了存算一体化排序效率。

3. 架构扩展策略:
   - 多阵列:将海量数据按数分配到多个忆阻器阵列同时处理。
   - 位分区:将数据的不同位数拆分到多个阵列进行流水线操作。
   - 多电导:利用忆阻器单元本身的多状态特性,在单个单元内并行处理更多信息。

性能测试与实际应用

1. 性能测试:
   - 速度提升:相比当前主流的专用排序芯片,新系统速度提升了最高7.7倍。
   - 能效提升:能效提升了惊人的160.4倍。
   - 芯片面积效率提升:芯片面积效率提升了32.46倍。

2. 实际应用:
   - 最短路径规划:在北京地铁站点间的最短路径规划应用中,新系统成功求解了16个站点间的最优路径,显著降低了延迟和功耗。
   - 神经网络推理:在人工智能神经网络推理任务中,新系统实现了“实时原位稀疏”,可以根据需要灵活调整计算量,在保证精度的前提下大幅提升效率。

未来展望

这项突破性研究为未来高效处理大数据提供了强大的硬件基础。存算一体技术不仅在排序任务中展现出巨大潜力,还可能在其他复杂计算任务中发挥重要作用。随着技术的进一步发展和应用,存算一体技术有望成为解决大数据处理瓶颈的关键手段,推动智能硬件的发展进入新的阶段。

结论

杨玉超教授和陶耀宇研究员团队的研究成果展示了存算一体技术在大数据排序中的巨大潜力。通过创新的忆阻器阵列位读取机制和智能排序算法,新系统在速度、能效和芯片面积效率方面均取得了显著提升。这一突破不仅为大数据处理提供了新的解决方案,也为未来智能硬件的发展指明了方向。

姜谷粉丝 2025-07-25 11:14
存算一体芯片的核心工作原理概述
存算一体芯片(Processing-in-Memory,PIM)是一种打破传统冯·诺依曼架构中存储与计算分离模式的创新芯片架构。其核心原理是将计算功能直接嵌入存储单元内部,使数据无需在存储器与处理器之间传输即可完成运算,从而从根本上解决“存储墙”和“功耗墙”问题123。

存算一体芯片的架构与关键组件
存算一体芯片的架构设计围绕“存储即计算”的理念展开,主要包含以下核心组件:

存储单元与计算单元的深度集成
存储单元(如DRAM、闪存或新型忆阻器)同时作为计算载体,通过物理特性(如电阻变化、电荷积累)直接执行逻辑运算或矩阵运算,避免传统架构中数据搬运的延迟和能耗23。

存算一体引擎
专用硬件模块负责调度存储单元内的计算任务,支持矩阵乘法、向量运算等AI场景核心操作,实现数据“原位计算”2。

高效内部互连网络
低延迟、高带宽的互连结构连接多个存算单元,支持并行数据处理,适配深度学习等大规模并行计算需求2。

多级缓存与控制单元
集成高速缓存临时存储中间结果,并通过控制单元协调任务调度、错误处理和数据流管理,确保运算效率与可靠性


查看完整版本: [-- 新型“存算一体”芯片问世 --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号