出品|搜狐科技
作者|常博硕
正在进行的2026年GTC大会,让Token(模元)再次成为了新的AI关键词。
英伟达CEO黄仁勋指出,Token(模元)是大语言模型处理信息的基本单位,可以粗略理解为AI处理或生成的文字片段。它不仅是技术概念,更是驱动AI思考、推理和行动的“燃料”,AI的每一次运作,如思考、推理、行动、生成内容都离不开Token(模元)的消耗。
随着AI从训练模型转向推理,Token(模元)的消耗量将急剧增长。黄仁勋将Token(模元)类比为新时代的“硬通货”或“大宗商品”,其生产与消耗直接对应着数据中心的收入与成本。因此,衡量AI基础设施效能的关键指标,从单纯的算力变成了每瓦电力所能生产的Token(模元)数量。
黄仁勋预言,未来的数据中心将不再是存储数据和运行软件的机房,而是“生产Token(模元)的工厂”,因为AI推理服务需求过去一年就增长了约100倍。
在大模型的语境里,token(模元)是文本或其它模态数据被分割后的最小可处理单元。它可能是一个字、一个词的一部分,或者一个标点。模型的“思考”和“工作”被拆解成无数token(模元)的生成与组合:一次推理,就是大量token从输入到输出的流动与变换。
但直到今天,Token一词其实并没有一个统一的中文译名。
清华大学清华大学校务委员会副主任可持续社会价值研究院院长杨斌主张,将Token译为“模元”最为合适, 在他看来,当一个核心且被高频使用的技术名词成为万亿级产业的核心标尺,其中文定名便不再是无关紧要的细节,而是关乎产业共识形成、技术普惠落地、公众认知普及的刚需。
杨斌表示,从词源脉络来看,token源自古英语tāc(e)n,本义为“标志、符号、证明”,核心是“可被识别、承载特定信息或功能的基本单元”。历经中世纪商业代币、网络安全令牌、语言学“词例”的演变,进入AI大模型时代,token完成了决定性跃迁——从语言学碎片化单元,升级为AI模型可计算、可处理的最小通用单元,正式取代计算机、互联网时代的“字节”,成为AI时代的基础度量衡。
在杨斌看来,当前 AI大模型领域的token存在的中文译名并无法匹配AI大模型、智能体时代的核心内涵,也难以打破大众的认知壁垒。比如,“词元”被“词”字锁死在文本场景,无法适配多模态、物理AI的应用形态;“语元”囿于语言范畴,窄化了token作为模型通用处理单元的本质;“义节”过度聚焦语义,忽略了token纯特征、结构化处理的属性;而“托肯”“屯”等单纯音译,徒有其音、缺乏实义,普遍接受度低,还会加重非专业人群的理解负担。这些译名要么局限于单一领域,要么缺乏度量衡的严谨性,无法承载token作为AI产业核心锚点的价值。
“模元”这个译法,在杨斌看来是专为AI时代量身定制的意译。“模”直指大模型、多模态,锚定AI场景的核心属性;“元”则代表最小基本单元,承续“字节”这类中文经典度量单位的命名逻辑。
当前,模元作为一种商品,已经形成了清晰的分层定价体系。黄仁勋给出了未来可能出现的五档服务价格:免费层模元产出量大但响应速度慢;中级层约每百万模元 3美元;高级层约每百万模元6美元;高速层约每百万模元45美元,顶级层则约每百万模元150美元,定价依据取决于模型的规模、上下文长度以及响应速度。
在固定的电力和土地限制下,未来谁能用每瓦电力生产更多模元,谁就拥有最低的生产成本和最高的潜在收入。
同时,黄仁勋预测传统的软件授权模式将向 “模元租赁”模式演进。未来的软件公司将转型为“智能体即服务”企业,其核心营收方式将变为出租能完成具体任务的智能体,并按消耗的模元收费。这意味着软件的价值交付将从“购买工具”变为“购买结果”或“购买模元调用量”。