在人工智能领域,处理连续时间信息一直是个棘手问题。以语音助手为例,当用户要求将闹钟从早上6点改为7点半时,传统AI系统往往因无法记忆上下文而陷入困境——它可能只捕捉到"改成7点半"的指令,却遗忘了前文提到的"闹钟"这一关键信息。这种短视性源于现有架构的局限性:要么依赖大量算力强行记忆上下文导致能耗激增,要么仅处理当前输入而丢失历史信息。该问题在语音、视频等时序数据处理中尤为突出,成为制约AI发展的关键瓶颈。
帝国理工学院与苏黎世联邦理工的联合研究团队从人类大脑机制中找到了突破口。通过分析大脑皮层的工作模式,研究人员发现不同区域存在显著的时间处理差异:初级感官皮层以毫秒级速度快速响应外界刺激,而前额叶皮层则通过较慢的处理节奏整合数秒甚至更长时间的信息。这种快慢结合的分工模式,使人类既能即时反应环境变化,又能保持对上下文的连续感知。基于这一发现,团队构建了"双重记忆路径"类脑网络架构,通过在神经网络各层嵌入共享的低维记忆模块,实现了对历史信息的高效压缩与传递。
该架构的创新之处在于将记忆与计算功能解耦。记忆模块采用低维度状态向量存储上下文信息,其体积仅占网络参数的5%-10%,却能通过内部连接为所有神经元提供历史背景。这种设计使计算模块可专注于处理当前输入,避免传统循环网络中记忆与计算相互干扰的问题。实验数据显示,在长时程信息处理任务中,新架构的准确率从10%跃升至90%以上,在顺序MNIST数据集上更达到99%的精度,较同类模型提升近30%。
硬件实现层面,研究团队与芯片设计专家深度协作,开发出配套的异构计算架构。通过将记忆模块集成于片上存储器,减少外部内存访问;采用四条并行计算路径分别处理脉冲积分、记忆读写和输出,实现各模块独立优化。22纳米工艺的后布局仿真表明,该芯片在语音识别任务中的能效比现有最佳方案提升5倍,吞吐量提高4倍,面积效率较循环网络架构翻倍。这种设计特别适用于智能手表、AR眼镜等续航敏感设备,能效提升可直接转化为数倍的电池寿命延长。
这项研究更深远的意义在于建立了算法与硬件的协同设计范式。传统AI开发中,算法创新与硬件实现往往脱节,导致许多精巧设计因能耗或面积限制无法落地。本研究从项目初期就采用软硬件联合优化策略,记忆模块的数据流设计、计算路径的并行架构等关键创新均围绕硬件可行性展开。这种跨学科协作模式为类脑计算领域提供了新思路:通过模拟生物系统的约束驱动机制,或许能开发出更接近人脑能效的智能系统。
目前,该研究的全部代码与硬件设计已开源,这在类脑计算领域尚属罕见。此前多数研究仅公开算法部分,硬件实现细节通常保留在实验室内部。开放源代码将加速技术迭代,使其他团队既能在此基础上优化算法,也可将其集成至更大规模的系统中。研究团队表示,这种开放态度源于对技术普惠性的追求——只有打破研究壁垒,才能推动整个领域向实用化迈进。
