物理系统的动态演化过程可以作为一种高效的计算资源应用于信息处理。在输入的驱动下,物理系统遵循内在规律进行演化,演化的结果实现了对输入信息的变换,并作为达成特定计算功能的重要基础。基于此构建的硬件神经网络具有比数字系统更高的能效和更快的速度。储备池计算(Reservoir Computing)是其中备受关注的一种计算范式,具有易于训练、硬件开销低等优点,并且可以使用各种电学和光学硬件实现。储备池计算硬件所需的关键特性是非线性和短时记忆,前者可以将输入信息非线性地映射到高维空间,而后者意味着系统的状态由当前输入和最近的输入共同决定。满足上述要求的动态忆阻器件被用于硬件实现储备池计算,并展现出广阔的应用前景,在语音数字识别、混沌系统预测、解决二阶非线性任务和实时神经活动分析等方面取得了显著的进展。
然而,当前的忆阻器件多为单一物理机制,缺少跨模态的突触可塑性,缺乏弛豫时间的可调性,这导致基于忆阻器的储备池仍然面临非线性映射模式固定、无法处理多模态信号、缺乏多尺度特征提取能力等问题,因而限制了储备池的信息处理能力,难以实现多模态、多尺度的储备池计算系统。
图1. α-In2Se3光电忆阻器与多模态、多尺度储备池计算
针对以上关键问题,纳光电子前沿科学中心黄如院士-杨玉超教授课题组构建了基于α-In2Se3的多功能光电忆阻器件,利用其光电耦合的动力学特性,实现了多模态融合、多时间尺度的储备池计算。其中,范德华半导体α-In2Se3同时具有铁电、光电特性,以此为基础构造的忆阻器件在电、光脉冲的激励下体现出丰富的突触特性,包括PPF、PPD、EPSC、IPSC、LTP/LTD等长、短时程可塑性。
图2. 具有丰富突触特性的α-In2Se3光电忆阻
更重要的是,光电混合的物理机制使器件具有跨模态的突触可塑性,为储备池计算提供了多种非线性映射模式。基于此,研究团队提出了多模态融合的技术方案,构建了多模态融合的储备池计算系统,成功实现了多模态的手写数字识别和二维码识别任务,分别达到了86.1%和98.6%的准确率,并且在低涨落(C2C σ/μ=0.1)下精度基本保持不变。此外,背栅电压/光照作为第三端可以进一步实现异源突触可塑性,从而有效地调控器件的直流和脉冲特性,尤其是器件的弛豫时间可被缩短超过一个量级。该器件解决了已有忆阻器弛豫时间相对固定的问题,并进一步实现了多尺度的储备池计算,通过将器件置于不同的弛豫时间能够捕捉MSO5时间序列在不同尺度上的特征,从而成功实现了对该序列的准确预测(NRMSE=0.105)。
图3. 多模态手写数字识别和MSO5时间序列预测
本研究利用α-In2Se3忆阻器中的多种物理机制,实现了跨模态的突触可塑性和弛豫时间的可调性,提供了多种非线性映射的模式、多模态融合的创新方案、多尺度特征提取的能力,为储备池计算应用于更复杂的任务和更广阔的场景奠定了坚实的基础。
2022年10月13日,相关成果以“An optoelectronic synapse based onα-In2Se3 with controllable temporal dynamics for multimode and multiscale reservoir computing”为题,发表在《自然-电子学》(Nature Electronics)上。北京大学集成电路学院2018级博士生刘柯钦为第一作者,黄如院士、杨玉超教授为通讯作者。
论文原文链接:https://www.nature.com/articles/s41928-022-00847-2