律新社编者按
长期以来,法律人深陷海量案卷检索、重复文书撰写、繁琐流程跟进等事务性工作,难以将核心精力聚焦于法律分析、策略制定等高阶价值创造。从大模型的语义理解、文本生成,到智能体的流程自动化、多任务协同,AI的迭代升级已突破“工具辅助”的浅层定位。如何推动智能体与法律实务深度融合,实现案件研判智能化、法律服务精准化,让法律人从机械劳动中解放,更高效地发挥专业优势?这一命题不仅关乎法律服务模式的迭代,更影响法律行业的未来发展格局。
2025年12月28日,在“法商聚力·驭势致远——律新社2025企业商事法律服务发展论坛”上,华宇元典CEO蔡建军作《从大模型到智能体:让法律人从AI的发展中受益》主题分享,围绕华宇元典在法律人工智能领域的探索和实践,带大家领略了技术革新为行业带来的新机遇。蔡建军的分享内容如下:
在2025年探讨商业法律服务,有一个话题无法回避:大模型当前究竟能做什么?它的优势与短板分别是什么?人与模型应如何协同?未来发展趋势又将如何?希望我基于实践的分享,能为大家带来一些启发。
华宇元典是上市公司华宇软件旗下专注于法律人工智能的企业,可用三句话概括我们的核心情况:第一,我们深耕法律人工智能领域已达九年;第二,我们具备从数据、模型到应用的完整研发闭环能力,也是国内首批通过国家网信办备案的法律垂直模型供应商;第三,自2023年起,我们已为国内各地法院、国家部委、央国企、大型企业集团及头部律所提供服务,落地了百余个大模型在法律领域的具体项目。
众所周知,大模型领域的发展日新月异。从2022年11月ChatGPT发布至今,大模型已历经多个发展阶段。进入2025年,有两个标志性事件值得关注。一是DeepSeek的发布,让模型具备了超强的推理与思考能力,在面对复杂法律问题时,其逻辑分析能力已逐渐接近人类水平;二是2025年下半年,行业焦点从“模型本身性能”转向“模型与世界的互动”,例如模型如何验证结果可信度、如何调用工具完成任务,这使得大模型的应用场景发生了诸多新变化。
如上图所示,法律工作的核心范式可概括为从事实发现到知识获取,再到逻辑推理,最终产出文书或解决方案。而大模型的逻辑则是通过压缩海量数据,具备类人的语言处理能力。
1
法律工作的信息与知识获取阶段
以早期的ChatGPT为例,其训练数据中,维基百科的数据占比仅为3%,这意味着它相当于压缩了33个维基百科的知识体量。基于如此庞大的知识库,我们首先思考,在法律工作的信息与知识获取阶段,大模型能提供怎样的帮助?这也是所有人应用大模型时的首要需求,即希望通过模型获取各类信息与知识。但遗憾的是,大模型存在明显的“幻觉”问题。纽约州最早发现大模型幻觉对法律工作的负面影响,如今国内各地也陆续出现因模型幻觉导致的法律实务问题。模型幻觉的产生,源于其本身的概率性特征。
为解决这一问题,我们转换了思路,当询问“《民法典》第100条是什么”这类简单问题时,不再让模型直接回答,而是先让其从法规库中检索准确条文,再将问题与检索结果一同提交给模型,由模型整合后给出答案,这种方式能显著提升回答的准确性。
看似简单的逻辑,实际落地面临两个核心挑战:一是无法预判用户的提问形式,问题千奇百怪,要求模型具备极广的知识覆盖;二是需在海量知识中,于1秒钟内完成精准检索。2024年,我们成功攻克这两大难题,推出了基于自然语言的法律检索工具。过去的法律检索需输入关键词,再从结果中反复筛选,而新的检索工具支持自然语言输入,模型会在1秒钟内快速读取海量法规、案例、文书、论文及网络资料,最终输出整合后的答案。
从评测数据来看,2024年5月Stanford对国外模型的幻觉率评测显示,OpenAI模型的幻觉率约为43%,而经过优化的法律专业工具模型,最优表现的幻觉率仅为17%。国内学者2025年上半年的评测结果显示,通用模型应用于法律领域的幻觉率约为40%,与OpenAI接近,华宇元典的模型幻觉率维持在17%,其他国内法律科技产品也有各自表现。
尽管已处于国内领先水平,但我们认为仍有巨大提升空间,因此2025年下半年进一步优化了模型性能。首先,我们构建了规模庞大的法律数据库,涵盖558万部法律法规、1.7亿份裁判文书、1.1亿条企业工商数据,同时将人民法院官网资料、权威判例、知名法律书籍等全部进行向量化处理,打造了专属模型的高质量知识库,大幅提升回答的专业性与准确性。其次,我们补充了大量中文法律领域的观点,并帮助客户搭建内部专属知识库,供律师与客户共同使用,进一步强化模型的针对性。
2
法律人的文书处理工作
法律人的日常工作中,需撰写各类文书、处理大量案头工作。我们思考能否让模型承担部分相对简单、明确的工作?根据认知理论,人类认知活动分为六个层次,记忆、理解、应用属于相对简单的层次,分析、评价、创造则更为复杂。我们借鉴知识管理中的做法,将人类的隐性知识与专家知识外化为团队显性知识,实现组织内传播,具体通过“社会化、外在化、组合、内在化”四个环节,让知识成为团队共享资产。
我们尝试让人与模型共享知识,将法律工作拆解为详细工作流,要求模型按预设顺序逐步执行。以物业公司起诉业主的案件为例,此类案件的特点是被告众多、个案事实存在差异,需填写最高人民法院要求的要素式起诉书。我们将这一工作拆解为四个步骤,告知模型具体执行逻辑:第一步,识别当事人信息(原告为法人或自然人、被告自然信息、企业注册地址等);第二步,明确诉讼请求;第三步,确定管辖与保全事宜;第四步,提取事实与理由。通过这样的拆解,模型可在几秒钟内完成人类需花费大量时间的工作。从最终结果来看,当事人信息、诉讼请求、注册地址、事实与理由等均被完整、准确地填写到要素式起诉书中。对于此类标准化、可复制的工作,未来模型有望承担更多任务。目前,我们已设计了数百个类似工作流,帮助法律工作者完成可重复执行的事务性工作。
但我们发现,用户常提出更复杂的工作流需求,而由于人工编排的工作流存在局限性,诉讼场景的工作流尚可列举,非诉及公司法务场景的工作流则无穷无尽。因此,我们转换思路,不再为模型规划具体步骤,而是为其配备丰富的工具库。例如,当被问及“借款100万,利息应如何约定”时,模型需完成三件事:检索法律法规相关规定、查询中国人民银行官网当前LPR数据、整合结果并存储,以便后续模型遇到同类问题可以快速回应。
再以起草上市公司公告为例(此类工作通常需法务部、证券部花费1-2天完成),我们为模型配备了四类核心工具:一是工商信息检索工具,可调取法律主体的真实工商数据;二是证监会官网公告检索工具,可查找同类公司相关公告;三是公告拆解分析工具,快速确定适用模板;四是段落自检工具,对文书的段落逐一核查质量。通过工具调用,模型能够独立完成这一复杂任务。
3
法律智能体Amicus
2025年,我们为模型构建了庞大的工具箱,涵盖检索类、计算类、文档处理类、日期类、审限确定及开庭时间安排等各类工具。如今,模型的应用能力不仅取决于其自身性能,更取决于知识库与工具库的完善程度。在此基础上,我们进一步优化了三个关键环节:一是帮助用户优化提示词(prompt)撰写;二是提供模型选择建议;三是强化使用安全保障。
将这些方面整合后,我们推出了真正意义上的“法律智能体”,命名为“Amicus”(源于拉丁文,意为“朋友与伙伴”)。我们相信,这款产品的推出,将推动行业真正进入人机协同的智能时代。
4
大模型与法律行业的关联发展
法律行业的AI应用,可借鉴其他知识密集型行业的发展经验,例如医疗、金融领域;而编程行业的AI应用走在前列,其发展路径亦可为法律行业提供重要参考。电脑的诞生让编程人员从“走路”升级为“骑自行车”,而AI工具的应用则让开发者从“骑自行车”升级为“开汽车”。这一飞跃尚未在法律行业实现,核心原因有二:一是法律领域的信息与语料高度碎片化,分散于Word文档、网站、微信等各类载体,缺乏编程行业那样统一的数字化环境进行整合;二是法律工作的质量缺乏客观、可自动化识别的评价标准。若能突破这两大难题,法律行业的自动化水平将实现质的飞跃。
展望未来,我认为大模型与法律行业的关联将分为四个阶段:
第一阶段(当前阶段),模型帮助个体大幅提升工作效率;第二阶段,模型能力进一步提升,个体生产率显著增长,原本占据50%工作时间的事务性工作将压缩至5%,法律人可将更多精力投入高附加值工作;第三阶段,个体工作流程的变革将引发组织形态变化,层级化的金字塔式分工将被打破;第四阶段,组织形态的变革将推动行业生态发生变化。与此同时,需求侧也在发生转变,越来越多当事人遇到法律问题时,会先通过AI工具咨询,即便有律师推荐,也会通过AI了解律师资质。供给侧与需求侧的双重变化,将共同塑造法律服务的未来图景。
我认为,人类的智慧源于经验、直觉、情感与想象力的判断;AI的智能,基于海量数据与高速计算的能力,二者将交相辉映,共同勾勒出法律服务的未来图景。因此,我们将当前时代定义为“人机协同的法律智能时代”。最后我想强调的是,无论模型与技术如何发展,我们的初心始终不变——让法律变得更美好。
END