《NATURE》
1. 基于下一个词元预测的多模态学习用于大型多模态模型
Multimodal learning with next-token prediction for large multimodal models
出版时间:2026年1月
摘要:开发一种能够跨文本、图像和视频等多种模态进行学习和生成的统一算法,一直是人工智能领域的一项根本性挑战。尽管下一个词元预测推动了大型语言模型的重大进展,但其向多模态领域的扩展仍然有限,而用于图像和视频合成的扩散模型以及将视觉编码器与语言模型集成的组合框架仍然占据主导地位。Emu3,这是一个仅使用下一个词元预测训练的多模态模型系列。Emu3在感知和生成方面的性能均与成熟的任务专用模型相当,在无需扩散或组合架构的情况下,即可媲美旗舰系统。它进一步展示了连贯、高保真的视频生成、交错式视觉—语言生成以及用于机器人操作的视觉—语言—动作建模。通过将多模态学习简化为统一的词元预测,Emu3为大规模多模态建模奠定了坚实基础,并为实现统一的多模态智能提供了一条有前景的路径。
图1 Emu3框架
Emu3首先把图像、文本、视频以及动作等多模态数据分词化为离散词元,接着按顺序将这些词元进行序列化处理,随后运用Transformer解码器开展大规模统一的下一词元预测工作。此外,该框架把视觉、语言和动作都看作统一的词元序列,进而能够无缝地将其推广应用于机器人操作领域。
2. 集成光子学实现超宽带光纤无线通信
Integrated photonics enabling ultra-wideband fibre–wireless communication
出版时间:2026年2月
摘要:电信系统正朝着超宽带和低延迟的方向演进,支持有线与无线链路及其无阻塞互连。然而,光纤通信与其无线对应物之间长期存在的带宽不匹配问题,这一问题的根源在于信号架构的根本差异和硬件限制,进而阻碍了跨域的高速兼容传输。这一挑战使得统一系统设计变得更加复杂,同时也阻碍了在宽带接入场景下实现高吞吐密度、无拥塞的光纤-无线链路。本文提出一种超宽带集成光子学方案,该方案在共享带宽基础设施上促进了光纤—无线通信。系统基于电光转换和光电转换构建,其3-dB工作带宽超过250GHz,并具有跨架构适应性,在有线和无线链路上均展示了前所未有的数据传输能力。使用同一套设备,并借助所提出的复杂双向门控循环单元算法,实现了短距离光纤512Gbps的超高单通道数据速率,以及据作者所知首次实现的400Gbps高速无线传输。此外,通过全光辅助的超宽带无线方案实现了高密度接入。成功演示了跨86个信道、无缝使用138至223GHz频谱范围的实时多信道8K视频传输。这些在统一电信发展领域取得的发现,展示了开发高速、高密度和低延迟通信网络的潜力。
图2 集成UWB全光通信系统
全光超宽带电信连接(光纤—无线无拥塞传输、高速光纤互连及高密度光纤—无线接入)的概念图,由集成光子学系统驱动。凭借UWB集成设备和光纤无线系统的无缝集成,可望实现高通量、低延迟的全光通信。OBPF,光学带通滤波器。
《SCIENCE》
1. 金属θ相氮化钽的热导率是铜的三倍。
Metallic θ-phase tantalum nitride has a thermal conductivity triple that of copper
出版时间:2026年2月
摘要:高效散热从根本上受到本征散射机制的限制,这些机制将铜等金属材料的热导率上限限制在约400瓦每米开尔文。本文报告了单晶θ相氮化钽(θ-TaN)的实验实现,这是一种被预测能突破此限制的亚稳态过渡金属氮化物。测量到其室温热导率约为1100瓦每米开尔文,几乎是铜的三倍。基于同步辐射的非弹性X射线散射揭示了一种独特的声子能带结构,具有大的声学—光学带隙和声子聚束现象,从而抑制了声子—声子散射。超快光学光谱学证实了其异常弱的电子—声子耦合,并验证了第一性原理计算。这些发现重新定义了金属材料的热传输极限,并为推进电子和电力系统中的热管理开辟了新机遇。
2. 晶圆级超薄均匀范德华铁电氧化物
Wafer-scale ultrathin and uniform van der Waals ferroelectric oxide
出版时间:2026年1月
摘要:铁电材料在非易失性存储器和下一代电子器件中具有巨大潜力,但传统的铁电氧化物薄膜通常存在结构不均匀、界面去极化以及性能下降等问题,尤其是在按先进技术节点进行微缩时。本研究展示了超薄范德华(vdW)高介电常数铁电氧化物Bi₂SeO₅的均匀晶圆级合成及其与后端制程(BEOL)兼容的集成工艺,该材料在单层厚度下仍保持最佳矫顽场和稳定的铁电性。超薄范德华(vdW)铁电氧化物与二维半导体形成了原子级均匀的界面,并由此制备出性能优异的铁电场效应晶体管(FeFET)阵列。该阵列具备以下特性:工作电压低至0.8伏,循环耐久性超过1.5×10¹²次,写入速度快至20纳秒,开关比高达10⁶,数据保持时间可达10年,单位能耗极低(每比特每平方微米仅2.8飞焦),且器件间性能差异小于5%。基于这些铁电场效应晶体管构建的可重构存内逻辑电路可在<1伏的电源电压下工作。