原创蔡建军

律新社编者按

长期以来，法律人深陷海量案卷检索、重复文书撰写、繁琐流程跟进等事务性工作，难以将核心精力聚焦于法律分析、策略制定等高阶价值创造。从大模型的语义理解、文本生成，到智能体的流程自动化、多任务协同，AI的迭代升级已突破“工具辅助”的浅层定位。如何推动智能体与法律实务深度融合，实现案件研判智能化、法律服务精准化，让法律人从机械劳动中解放，更高效地发挥专业优势？这一命题不仅关乎法律服务模式的迭代，更影响法律行业的未来发展格局。

2025年12月28日，在“法商聚力·驭势致远——律新社2025企业商事法律服务发展论坛”上，华宇元典CEO蔡建军作《从大模型到智能体：让法律人从AI的发展中受益》主题分享，围绕华宇元典在法律人工智能领域的探索和实践，带大家领略了技术革新为行业带来的新机遇。蔡建军的分享内容如下：

在2025年探讨商业法律服务，有一个话题无法回避：大模型当前究竟能做什么？它的优势与短板分别是什么？人与模型应如何协同？未来发展趋势又将如何？希望我基于实践的分享，能为大家带来一些启发。

华宇元典是上市公司华宇软件旗下专注于法律人工智能的企业，可用三句话概括我们的核心情况：第一，我们深耕法律人工智能领域已达九年；第二，我们具备从数据、模型到应用的完整研发闭环能力，也是国内首批通过国家网信办备案的法律垂直模型供应商；第三，自2023年起，我们已为国内各地法院、国家部委、央国企、大型企业集团及头部律所提供服务，落地了百余个大模型在法律领域的具体项目。

众所周知，大模型领域的发展日新月异。从2022年11月ChatGPT发布至今，大模型已历经多个发展阶段。进入2025年，有两个标志性事件值得关注。一是DeepSeek的发布，让模型具备了超强的推理与思考能力，在面对复杂法律问题时，其逻辑分析能力已逐渐接近人类水平；二是2025年下半年，行业焦点从“模型本身性能”转向“模型与世界的互动”，例如模型如何验证结果可信度、如何调用工具完成任务，这使得大模型的应用场景发生了诸多新变化。

如上图所示，法律工作的核心范式可概括为从事实发现到知识获取，再到逻辑推理，最终产出文书或解决方案。而大模型的逻辑则是通过压缩海量数据，具备类人的语言处理能力。

法律工作的信息与知识获取阶段

以早期的ChatGPT为例，其训练数据中，维基百科的数据占比仅为3%，这意味着它相当于压缩了33个维基百科的知识体量。基于如此庞大的知识库，我们首先思考，在法律工作的信息与知识获取阶段，大模型能提供怎样的帮助？这也是所有人应用大模型时的首要需求，即希望通过模型获取各类信息与知识。但遗憾的是，大模型存在明显的“幻觉”问题。纽约州最早发现大模型幻觉对法律工作的负面影响，如今国内各地也陆续出现因模型幻觉导致的法律实务问题。模型幻觉的产生，源于其本身的概率性特征。

为解决这一问题，我们转换了思路，当询问“《民法典》第100条是什么”这类简单问题时，不再让模型直接回答，而是先让其从法规库中检索准确条文，再将问题与检索结果一同提交给模型，由模型整合后给出答案，这种方式能显著提升回答的准确性。

看似简单的逻辑，实际落地面临两个核心挑战：一是无法预判用户的提问形式，问题千奇百怪，要求模型具备极广的知识覆盖；二是需在海量知识中，于1秒钟内完成精准检索。2024年，我们成功攻克这两大难题，推出了基于自然语言的法律检索工具。过去的法律检索需输入关键词，再从结果中反复筛选，而新的检索工具支持自然语言输入，模型会在1秒钟内快速读取海量法规、案例、文书、论文及网络资料，最终输出整合后的答案。

从评测数据来看，2024年5月Stanford对国外模型的幻觉率评测显示，OpenAI模型的幻觉率约为43%，而经过优化的法律专业工具模型，最优表现的幻觉率仅为17%。国内学者2025年上半年的评测结果显示，通用模型应用于法律领域的幻觉率约为40%，与OpenAI接近，华宇元典的模型幻觉率维持在17%，其他国内法律科技产品也有各自表现。

尽管已处于国内领先水平，但我们认为仍有巨大提升空间，因此2025年下半年进一步优化了模型性能。首先，我们构建了规模庞大的法律数据库，涵盖558万部法律法规、1.7亿份裁判文书、1.1亿条企业工商数据，同时将人民法院官网资料、权威判例、知名法律书籍等全部进行向量化处理，打造了专属模型的高质量知识库，大幅提升回答的专业性与准确性。其次，我们补充了大量中文法律领域的观点，并帮助客户搭建内部专属知识库，供律师与客户共同使用，进一步强化模型的针对性。

法律人的文书处理工作

法律人的日常工作中，需撰写各类文书、处理大量案头工作。我们思考能否让模型承担部分相对简单、明确的工作？根据认知理论，人类认知活动分为六个层次，记忆、理解、应用属于相对简单的层次，分析、评价、创造则更为复杂。我们借鉴知识管理中的做法，将人类的隐性知识与专家知识外化为团队显性知识，实现组织内传播，具体通过“社会化、外在化、组合、内在化”四个环节，让知识成为团队共享资产。

我们尝试让人与模型共享知识，将法律工作拆解为详细工作流，要求模型按预设顺序逐步执行。以物业公司起诉业主的案件为例，此类案件的特点是被告众多、个案事实存在差异，需填写最高人民法院要求的要素式起诉书。我们将这一工作拆解为四个步骤，告知模型具体执行逻辑：第一步，识别当事人信息（原告为法人或自然人、被告自然信息、企业注册地址等）；第二步，明确诉讼请求；第三步，确定管辖与保全事宜；第四步，提取事实与理由。通过这样的拆解，模型可在几秒钟内完成人类需花费大量时间的工作。从最终结果来看，当事人信息、诉讼请求、注册地址、事实与理由等均被完整、准确地填写到要素式起诉书中。对于此类标准化、可复制的工作，未来模型有望承担更多任务。目前，我们已设计了数百个类似工作流，帮助法律工作者完成可重复执行的事务性工作。

但我们发现，用户常提出更复杂的工作流需求，而由于人工编排的工作流存在局限性，诉讼场景的工作流尚可列举，非诉及公司法务场景的工作流则无穷无尽。因此，我们转换思路，不再为模型规划具体步骤，而是为其配备丰富的工具库。例如，当被问及“借款100万，利息应如何约定”时，模型需完成三件事：检索法律法规相关规定、查询中国人民银行官网当前LPR数据、整合结果并存储，以便后续模型遇到同类问题可以快速回应。

再以起草上市公司公告为例（此类工作通常需法务部、证券部花费1-2天完成），我们为模型配备了四类核心工具：一是工商信息检索工具，可调取法律主体的真实工商数据；二是证监会官网公告检索工具，可查找同类公司相关公告；三是公告拆解分析工具，快速确定适用模板；四是段落自检工具，对文书的段落逐一核查质量。通过工具调用，模型能够独立完成这一复杂任务。

法律智能体Amicus

2025年，我们为模型构建了庞大的工具箱，涵盖检索类、计算类、文档处理类、日期类、审限确定及开庭时间安排等各类工具。如今，模型的应用能力不仅取决于其自身性能，更取决于知识库与工具库的完善程度。在此基础上，我们进一步优化了三个关键环节：一是帮助用户优化提示词（prompt）撰写；二是提供模型选择建议；三是强化使用安全保障。

将这些方面整合后，我们推出了真正意义上的“法律智能体”，命名为“Amicus”（源于拉丁文，意为“朋友与伙伴”）。我们相信，这款产品的推出，将推动行业真正进入人机协同的智能时代。

大模型与法律行业的关联发展

法律行业的AI应用，可借鉴其他知识密集型行业的发展经验，例如医疗、金融领域；而编程行业的AI应用走在前列，其发展路径亦可为法律行业提供重要参考。电脑的诞生让编程人员从“走路”升级为“骑自行车”，而AI工具的应用则让开发者从“骑自行车”升级为“开汽车”。这一飞跃尚未在法律行业实现，核心原因有二：一是法律领域的信息与语料高度碎片化，分散于Word文档、网站、微信等各类载体，缺乏编程行业那样统一的数字化环境进行整合；二是法律工作的质量缺乏客观、可自动化识别的评价标准。若能突破这两大难题，法律行业的自动化水平将实现质的飞跃。

展望未来，我认为大模型与法律行业的关联将分为四个阶段：

第一阶段（当前阶段），模型帮助个体大幅提升工作效率；第二阶段，模型能力进一步提升，个体生产率显著增长，原本占据50%工作时间的事务性工作将压缩至5%，法律人可将更多精力投入高附加值工作；第三阶段，个体工作流程的变革将引发组织形态变化，层级化的金字塔式分工将被打破；第四阶段，组织形态的变革将推动行业生态发生变化。与此同时，需求侧也在发生转变，越来越多当事人遇到法律问题时，会先通过AI工具咨询，即便有律师推荐，也会通过AI了解律师资质。供给侧与需求侧的双重变化，将共同塑造法律服务的未来图景。

我认为，人类的智慧源于经验、直觉、情感与想象力的判断；AI的智能，基于海量数据与高速计算的能力，二者将交相辉映，共同勾勒出法律服务的未来图景。因此，我们将当前时代定义为“人机协同的法律智能时代”。最后我想强调的是，无论模型与技术如何发展，我们的初心始终不变——让法律变得更美好。

END

上一篇：原创英伟达Rubin平台量产：整合6款全新芯片，推理Token成本降低10倍

下一篇：被AI支配与反抗的一年

蔡建军：从大模型到智能体让法律人从AI的发展中受益丨律新社2025企业商事论坛经典演讲

原创蔡建军

相关内容

热门资讯

蔡建军：从大模型到智能体 让法律人从AI的发展中受益丨律新社2025企业商事论坛经典演讲

原创 蔡建军

相关内容

热门资讯

蔡建军：从大模型到智能体让法律人从AI的发展中受益丨律新社2025企业商事论坛经典演讲

原创蔡建军