记者 钱玉娟
一款薄如卡片,可以磁吸在手机背面的AI录音夹,面市四个月,卖出了3万台。这是AI企业出门问问自研的、AI软硬件结合的产品TicNote。
与其他AI硬件动辄百万的销量相比,TicNote的出货量不算大,但产品在亚马逊评分4.8分、京东录音同品类热卖榜排名第一的成绩,让出门问问创始人兼CEO李志飞感到踏实。
“以前做硬件的研发投入太大,任何一个产品发出去,卖不到100万台,基本上就很难坚持了。”李志飞说,现在出门问问的模式变了,70%的精力在软件研发上,硬件则与合作伙伴一起做。
李志飞曾是谷歌机器翻译重点实验室的科学家,痴迷语音交互技术的他,萌生了开发一款“语音助手”的想法。他在2012年放弃百万美元的年薪,成为硅谷第一批回国创业的人之一。
真格基金创始合伙人兼CEO方爱之在硅谷的一场活动中认识了李志飞,“他是最早关注并介绍NLP(自然语言处理)的创业者之一。”方爱之对李志飞深耕行业的科学家气质印象深刻,在李志飞开发的出门问问还只是一个Demo App时,决定投资他。李志飞是真格基金投资的第一位来自谷歌的创业者。
2014年,李志飞曾作为创业者,走访大疆、比亚迪等深圳硬件企业,彼时,同行的人里有美团创始人王兴和今日头条创始人张一鸣。
此行前,李志飞研究过眼镜、车载、机器人和智能手表,这一次的硬件之旅让他明确了语音交互的硬件载体——智能手表。
第二年,出门问问的首款TicWatch面市,之后智能耳机、智能音箱、智能车载后视镜等硬件产品逐个立项、开发、面市。
那时的出门问问因拿下谷歌的投资蜚声全球,它还定位为以AI为核心的软硬结合的中国科技企业,在2017年将团队规模从三百多人扩张至千人,同步迈向国际化。
科学家创业,全身心投入在技术创新侧,往往会忽略钱袋子。一年烧走数亿元人民币,智能音箱还面临谷歌、亚马逊、阿里巴巴、百度等海内外巨头的市场争夺。2018年末,李志飞直接砍掉了智能音箱产品线。
翌年三月,出门问问系统性裁员,李志飞决定不再做新硬件项目开发,团队聚焦在软件创新上。
在语音交互技术领域创业8年后,李志飞在2020年初的公司年会上首次提出了“生成式AI(AIGC)是未来”。彼时ChatGPT还没火进中国,AI大模型也只是OpenAI这样的海外潜行者在钻研,那时的李志飞带着团队开发出了一款叫“魔音工坊”的AIGC产品,从2021年日入几万块发展到2023年的每天几十万的收入水平。
自研AIGC产品在2023年已经能为出门问问贡献超亿元的年收入,那一年初,国内有不少受新一波AI技术影响,计划投身其中创业的人,李志飞也不例外,他决定“All in大模型”,出门问问也推出了自研大模型“序列猴子”。
因为拥有许多大模型能力可落地应用的软件、硬件产品,出门问问面向B、C两端提供AIGC相关解决方案和产品服务,这也让出门问问在2024年成为港股“AIGC第一股”。
2025年8月末,出门问问中报显示,其已接近盈亏平衡。
从AI语音到智能手表,从大模型到AI Agent,出门问问经历13年长跑,数次转型。
2024年,出门问问放弃了“序列猴子”的迭代,还砍掉了To B业务中不赚钱的项目,专注AI软硬件结合的商业化模式,锚定了“录音背夹”TicNote这个AI硬件。
TicNote不只是一个转录设备,李志飞将它视为一个随身的AI思考伙伴,是出门问问面向AI Agent(智能体)打造的入口级产品。在确定这一产品形态前期,李志飞和众多企业CEO、高管交流,发现这类会议较多的人群渴望能随身带个实习生,帮自己做记录和总结。
投资界的分析师是这款产品的重度用户之一,有用户反馈,以往参加美股发布会需要耗费大量时间整理和翻译,现在使用TicNote既可以转录、总结,还能通过内嵌的Shadow AI单独入口进行聊天、提问,AI可以基于多方信息给出全年指引,标注资料来源,同时还包括思维导图、顿悟和深度研究功能。
8月25日,阿里巴巴旗下的钉钉推出了AI录音硬件DingTalk A1,同样的卡片形态,还打出了“AI助理”的标签。
谈及大厂布局同类AI硬件,李志飞说,谁也挡不住。早在去年带队调研、确定硬件形态时,他就得知不少巨头玩家有此尝试的打算。
外界一度质疑出门问问的战略定力,而李志飞找到了一个与不确定性共处的方式:抛下历史包袱,不停适应新环境去创新。这或许是一名技术极客向一位成熟CEO的蜕变。
以下为经济观察报与李志飞的对话:
理性的战略转型
经济观察报:百模大战时,你All in大模型自研“序列猴子”,之后又停止了模型迭代。这个决策使你遭遇外界质疑,当时没有顾虑吗?
李志飞: 2023年(大模型)刚出来时,大家都看不清楚,都想在最前沿的地方尝试。把模型做好了,自身就具备了这方面的能力。毕竟那时没有一个直接能用得好的模型,没有谁愿意坐等。
这也决定了我们早期会去做模型自研这件事。但做着做着,巨头都进来了,竞争非常激烈,市场上也慢慢出现了比我们做得更好的模型。调用一个第三方模型,技术成熟且成本比自研便宜。我们再坚持去做模型,价值不大,出门问问主要还是去做产品和商业化。
放弃模型迭代,这肯定是一个比较沮丧的过程。不少人说我们没有战略定力,我觉得这些都很正常。背后主要还是因为AI发展太快了,谁也看不清楚。但别人看是一回事,我作为公司的负责人,是要对这件事情最终负责的。
今天哪怕你投1亿人民币去做大模型,别人会为此投入100亿,这时候你投进去的钱一定是打水漂的,可这笔钱对公司来说是很大的一笔支出。在这种情况下,放弃才是理性的决定。
经济观察报:出门问问也考虑过产模结合,在模型迭代节奏上不追求速度,同时投入做模型应用。但这个路线最终也放弃了。
李志飞: 2023年我们是坚决要自己做模型的,投入了算力和人力资源等,那时候我们就没怎么做应用。当年底决定产模结合,基于自研模型去做产品,一年后发现再去纠结模型本身的话,公司已经支撑不住了,硬要用自己的模型,产品也不一定能做出好效果,这让我们开始转向去做应用产品。
这是从模型到产模结合,再到完全的产品驱动的过程。这个过程也符合行业变化,2023年所有人都在关注模型,包括投资侧也在看模型公司,后来才转投具有模型能力的产品公司,但现在基本上只投纯应用公司了。
所以我们做这些事情是非常理性的,比较早地看透技术演进的本质,不再坚持纯投入模型,基本方向自然就改变了。
经济观察报:2025年中报显示,出门问问接近盈亏平衡,除了软件和硬件的收入增长,运营管理上大幅降本,这是通过哪些举措实现的?
李志飞: 主要是两方面,首先是砍项目,砍掉未来很难有竞争力且很难做出好的增长的项目或团队。像那些To B需要定制的项目,需要很多人力成本,周期还长,基本上做到最后都是亏钱,团队规模还要被动做大。
其次是降低公司的复杂度,提升人效。组织会因研发项目聚焦而变化,当我们不需要那么多产品线、项目和人后,人与人的协作摩擦减少,团队也不停简化。
我们现在的研发极度简单,核心就是做Agent,上面有纯软件或硬件的应用,这才是承载商业化以及跟用户交互的关键。最后就是内部一个更直观的变化,人效上升。
经济观察报:内部提效涉及组织的转型,这背后经历了怎样的过程?
李志飞: 业务太复杂,所谓的AI很难应用得起来。砍项目并降低组织复杂度,然后引入AI工作流,才是比较适合当下的。这些动作是关联且互有帮助的。
其实内部调整并不是最近才开始的,一直都在做,财报体现的也是过去几个月的效果。从去年四五月份开始,我们就一直在想:到底应该做什么样的核心业务?
出门问问的历史比较长,过去做了很多业务,智能硬件、 To B、 To C都做,一直在寻找商业化的落地。但AI变化很快,从去年下半年开始,我们意识到如果像过去那么搞下去会很累,公司既赚不着钱,又很难建立核心竞争力。我们在思考怎么降低组织复杂度,怎样在组织工作中更多引入AI。
经济观察报:你如何让团队利用AI原生工作流协作?
李志飞: 刚开始是我自己用Cursor编代码,觉得效果很好,就去跟研发说,让他们必须都用起来。很多人都反馈在用,但我感到奇怪,怎么用了效率还是这么低?我用Cursor半小时就能做完的事,几个工程师一周了还做不出来。
直到我坐在同事旁边,看他打开电脑演示使用过程,才突然意识到,他用了Cursor却还是亲自敲或改写代码,这相当于,明明一个L4级别的自动驾驶,结果被搞成了L2,效率被主动降低了。
像我们这样的AI公司都会遇到如此大的阻力,不难想象其他公司在AI转型上的遭遇。相对而言,推动工程师们用Coding Agent解决问题,要比我自己去做难多了。我一个人再加上公司的几十个工程师,效率反而大打折扣。
开发虚拟组织协作就是要解决这些问题。2个我可以抵10个人的产能,5个我能抵得上25个人的产能,相当于把我自己复制了5份,“我”就更容易规模化。现在内部的效率跟两三个月前比,量化的话,我觉得能有4倍差距。同一个功能开发,以前团队可能要五六个人一周才能搞完,现在只要两个人参与就能快速搞定。
经济观察报:团队接下来的重点是什么?你期待复制多个“AI化的李志飞”,是有哪些亟待解决的问题吗?
李志飞: 现在是一个智能大变革的时代,我亲身体会到了AI带来的变量,光编程就发生了巨变。我花大量时间做这个工作流,你可以认为是“Cursor+飞书”,简单讲就是一个可以协作的Coding Agent,它会是我们这类公司的一个基石。目前这个产品直接促进出门问问内部的研发或者协作模式转型,让人逐渐变成“超级个体”。
不只是我需要这个协作工具,有了这种AI原生工作流以后,TicNote基于这种 Coding Agent的方式去做,会有不一样的体验,否则就会面临各种各样的竞争,最后都是同质化的竞争。
AI硬件要做人的“影子”
经济观察报:国内已有很多语音转录相关的厂商,既有硬件也有免费的软件服务,出门问问做TicNote这样一个纸片录音设备,经历了怎样的过程?
李志飞: 在录音产品方向上,出门问问此前做过两次尝试,2019年时做会议的录音音箱,当时还考虑过做录音工牌,出过一些原型设计,有的甚至上线了,但后来发现,在当时那个情景下,语音转写的自然语言总结并没有达到用户想要的体验。当时我们有十几个NLP的工程师,只做这一件事情,也做不好,压根没有大模型的能力支持。
选择TicNote这个产品形态,除了我们在语音交互上的能力,我觉得最基础的还是兴趣使然。我总结过自己,如果开发一个我不感兴趣的东西,就算产品能打市场,我也不想去做。创业已经很难了,不要硬做折磨自己的事情。
经济观察报:TicNote主要的应用场景是?
李志飞: 2020年到2021年的技术,很难支持做出一个好的录音转写和总结的产品,但大模型之后,我们明显感觉到这件事可以做好。很多人没有意识到这个核心点:并不是语音识别技术比以前好了,而是大模型的脑补能力或幻觉能力比较强,它大概听一下人类说了什么,就能总结出大概,并没有什么新鲜事。
我在去年就发现了这个技术变量的出现,其次才是需求。大模型要用起来,需要用户给大模型提供上下文。传统意义上的录音笔,给某一类垂直人群用,它帮你记录上下文,甚至24小时一直录的那种设备,这类厂商的产品并不是TicNote的竞争者。
我们规划TicNote这个产品线时,叫它“随身思考伙伴”,希望用户录音以后,除了做一些简单的转写总结,还能随时随地获得一些决策指引。这款产品内有一个Shadow AI系统,类似亚马逊CEO贝索斯提出的“影子”管理理念,企业CEO能有个Shadow,就像一个VP或任何一个CXO ,能在未来做出和CEO本人一致的决策。换句话说,未来这个“影子”完全可以代替人。
经济观察报:你判断TicNote能成为AI Agent的入口,但使用这个产品,仍难以脱离手机这个终端设备。
李志飞: 过去我们做的所有的智能设备,最大的竞争对手都是手机。手机在中国一年有接近两亿的出货量,如果做一个设备能做200万,已经是非常好的起点。换句话说,未来两年里,没有哪个设备能有希望取代手机,但是十年之后呢?手机的使用时间是有可能下降的,那时再去寻找能取代它的产品,对很多人来说,就没机会了。
出门问问在国内率先推出这一背夹形态的AI录音硬件产品,已经迭代起来,就不建议纠结它是不是会跟手机形成绝对的替代关系,毕竟今天市场上还没有哪个设备能与手机在同等数量级。
经济观察报:你曾提出2024年—2025年的AI 应用市场将迎来淘汰阶段,如今行业的整体情况如何?应对竞争或巨头随时可能展开的抢食,你准备了怎样的武器?
李志飞: 不存在巨头抢食,它们本来就一直在里边。
我觉得AI应用或者Agent,真正能用也就是今年才开始的事情。2023年—2024年,大家更关注大模型本身,而Coding变得好用,是近半年的事情。整个行业相对来说还处于较早期,这要求每家公司选择一个擅长也有兴趣的产品去开发,即便有竞争,也尽量在未来避开与巨头的血拼。
出门问问选择去做的产品,面临用户需求、技术成熟度以及竞争的多重偶然性。如果明知道技术是不确定的,就尽量不要去折腾;用户若没需求,你想去教育用户也是很难的;至于竞争,很多时候你也挡不住(巨头),只能说拥抱偶然性。
技术人创业的特质
经济观察报:你回国基于语音智能技术创业至今,见证了AI行业企业的兴衰交替。出门问问在2024年IPO,支持它抵挡产业风浪的关键因素是什么?
李志飞: 我们公司曾经总结了两个关键词:理性与创新。首先要清楚自身的业务靠什么支撑,既要理性看待自己,还要理性取舍。如果别人的看法是活下去的理由,那我们早就倒下无数次了。
十几年踩坑无数,最后我们才知道,能支撑团队活下去的就是认识自己,认识公司,包括想想今天AI技术到底能给自身带来什么样的杠杆。
能够理性地、求真地去做一些选择,不要硬扛,才是出门问问活得久的原因。还能有一些成绩,则是因为我们在不停地适应新环境去创新。
经济观察报:生活中的你也是一个极理性的人?你有做过MBTI测试吗?
李志飞: 我可能是理性的吧。我不太相信这类测试,因为那些问题有很多歧义,我答的时候也有歧义。
经济观察报:技术人创业总被认为会走很多弯路,你有哪些时刻会辗转难眠?
李志飞: 首先焦虑是常态,毕竟我选择了科技行业,而且是比较To C的方向,完全是我自己的能力、兴趣在这里,别的我也做不好。
在科技领域创业,没有人不焦虑,主要还是因为竞争激烈、技术发展快以及不确定性极高。人焦虑的本质就是没有确定性,顾虑这个,担忧那个。
即便如此,对我们来说也只有面向未来,尽量避免过去的坑,做未来有机会的技术开发、创新产品,不要管别人怎么看待这件事情。如果都要别人来告诉你哪里是对是错,凭什么你能成功?如果是大家都达成了共识的方向,所有人都会去做,哪有你的机会?
经济观察报:你觉得是AI技术创新冲关还是某些转折点上的灵活决策,让出门问问能数次转舵成功?
李志飞: 所有的公司都有历史包袱,即便成立只有两年的公司也会有很重的包袱,比如2023年成立的大模型公司,因为发展问题不得不转型成一个完全偏应用的公司,创业者往往面临当初讲的故事、人才梯队都要切换,这都很难。
别看出门问问是一家成立了13年的公司,我的包袱却越来越轻,基本上随时做好准备能成立一个独立个体公司。
对未来我有这样一个判断:AI的执行力是完全过剩的,过去我们所有的经验,都是能让人类具备跟AI一起做选择的能力,像我就有很多想法却做不出来,或者做得慢,主要问题在组织能力上。而今AI解决了长期困扰我的团队执行力等痛点,让我甩掉包袱,带领团队面向未来去做一个巨大的变化。
虽然出门问问不是近来成立的AI native(AI原生)企业,但我们也做到了这类公司的灵活性,又有以前与行业共振十几年的经验,能将这两者结合起来,才让我们呈现出一个好的发展状态。