近日,在GTC2025全球大会上,“杭州六小龙”之一群核科技的创始人兼董事长黄晓煌发布并开源了自主研发的空间理解模型SpatialLM,这与其空间智能解决方案SpatialVerse一起,联手让机器人完成从认知理解到行动交互的完整闭环训练。
同时,在与老东家英伟达创始人兼首席执行官黄仁勋见面后, 黄晓煌在社交媒体平台称,“总被调侃如果不卖英伟达股票用来创业,和群核科技的回报,哪个值钱?我觉得,从GPU高性能计算到今天具身智能训练,创业一路受到NVIDIA和老黄的思想的影响是毕生财富。谈钱就没意思了。”
空间理解模型SpatialLM开源
降低具身智能训练门槛
在本次大会上,群核科技宣布开源空间理解模型SpatialLM。据介绍,这是一个基于大语言模型的3D场景语义生成框架,突破了传统大语言模型对物理世界几何与空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。
“这相当于为具身智能领域提供了一个基础的空间理解训练框架,企业可以针对特定场景对SpatialLM模型进行微调,降低具身智能训练门槛。”群核科技称。“此次开源仅是开始,接下来SpatialLM模型将继续迭代如自然语言和场景交互等功能。”
据悉,该模型仅通过一段视频即可生成物理正确的3D场景布局。基于从视频中提取的点云数据,SpatialLM模型能够准确认知和理解其中的结构化场景信息。目前,SpatialLM已在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源。
黄晓煌介绍,“我相信全球很快会迎来具身智能机器人的爆发性发展,在具身智能背后,是算力、算法、工程和训练数据四个板块的协同进化,这需要全行业合力推动。群核科技希望通过空间模型和数据开源一起推动技术基座建设,为这个技术奇点的来临贡献一份力量。”
加速打通数字仿真与物理现实
实际上,黄晓煌与英伟达渊源颇深。此前,黄晓煌从浙江大学竺可桢学院毕业后,获得英伟达全额奖学金,并赴美国伊利诺伊大学香槟分校(UIUC)深造,研究方向就是用GPU做高性能计算。毕业后,黄晓煌则加入英伟达任软件工程师。
其中,群核科技创业的资金也是来自英伟达股票和浙江省杭州市的启动资金。2010年,在参加浙江省某次“美国硅谷高层次人才恳谈会”后,黄晓煌萌生了回国创业的想法,卖了英伟达股票,回国创立群核科技。
同时,群核科技创立之初,黄晓煌便选择了用GPU高性能计算提升渲染效率,渲染出一张图的时间从几十分钟缩短为十秒。
目前,群核科技正加速布局打通数字仿真与物理现实。据介绍,群核科技此前发布的空间智能平台SpatialVerse与SpatialLM模型之间“协同合作”,打通了“现实-虚拟-现实”的闭环路径,共同为具身智能架起一座数字仿真与物理现实之间的桥梁。
例如,SpatialLM模型通过从视频到结构化场景的转化,将现实世界的数据转化为虚拟环境中的丰富场景,而基于SpatialVerse的合成数据引擎,一个结构化场景又可泛化生成亿万级新场景。这也意味着,现实世界将成为SpatialVerse“数字道场”的原料来源。
记者获悉,在空间和具身智能训练上,目前群核科技已与硅谷头部科技企业等在内的一批国内外具身智能企业达成合作。
作者:谭镕