蔡建军:从大模型到智能体 让法律人从AI的发展中受益丨律新社2025企业商事论坛经典演讲
创始人
2026-01-06 11:41:14
0

原创 蔡建军

律新社编者按

长期以来,法律人深陷海量案卷检索、重复文书撰写、繁琐流程跟进等事务性工作,难以将核心精力聚焦于法律分析、策略制定等高阶价值创造。从大模型的语义理解、文本生成,到智能体的流程自动化、多任务协同,AI的迭代升级已突破“工具辅助”的浅层定位。如何推动智能体与法律实务深度融合,实现案件研判智能化、法律服务精准化,让法律人从机械劳动中解放,更高效地发挥专业优势?这一命题不仅关乎法律服务模式的迭代,更影响法律行业的未来发展格局。

2025年12月28日,在“法商聚力·驭势致远——律新社2025企业商事法律服务发展论坛”上,华宇元典CEO蔡建军作《从大模型到智能体:让法律人从AI的发展中受益》主题分享,围绕华宇元典在法律人工智能领域的探索和实践,带大家领略了技术革新为行业带来的新机遇。蔡建军的分享内容如下:

在2025年探讨商业法律服务,有一个话题无法回避:大模型当前究竟能做什么?它的优势与短板分别是什么?人与模型应如何协同?未来发展趋势又将如何?希望我基于实践的分享,能为大家带来一些启发。

华宇元典是上市公司华宇软件旗下专注于法律人工智能的企业,可用三句话概括我们的核心情况:第一,我们深耕法律人工智能领域已达九年;第二,我们具备从数据、模型到应用的完整研发闭环能力,也是国内首批通过国家网信办备案的法律垂直模型供应商;第三,自2023年起,我们已为国内各地法院、国家部委、央国企、大型企业集团及头部律所提供服务,落地了百余个大模型在法律领域的具体项目。

众所周知,大模型领域的发展日新月异。从2022年11月ChatGPT发布至今,大模型已历经多个发展阶段。进入2025年,有两个标志性事件值得关注。一是DeepSeek的发布,让模型具备了超强的推理与思考能力,在面对复杂法律问题时,其逻辑分析能力已逐渐接近人类水平;二是2025年下半年,行业焦点从“模型本身性能”转向“模型与世界的互动”,例如模型如何验证结果可信度、如何调用工具完成任务,这使得大模型的应用场景发生了诸多新变化。

如上图所示,法律工作的核心范式可概括为从事实发现到知识获取,再到逻辑推理,最终产出文书或解决方案。而大模型的逻辑则是通过压缩海量数据,具备类人的语言处理能力。

1

法律工作的信息与知识获取阶段

以早期的ChatGPT为例,其训练数据中,维基百科的数据占比仅为3%,这意味着它相当于压缩了33个维基百科的知识体量。基于如此庞大的知识库,我们首先思考,在法律工作的信息与知识获取阶段,大模型能提供怎样的帮助?这也是所有人应用大模型时的首要需求,即希望通过模型获取各类信息与知识。但遗憾的是,大模型存在明显的“幻觉”问题。纽约州最早发现大模型幻觉对法律工作的负面影响,如今国内各地也陆续出现因模型幻觉导致的法律实务问题。模型幻觉的产生,源于其本身的概率性特征。

为解决这一问题,我们转换了思路,当询问“《民法典》第100条是什么”这类简单问题时,不再让模型直接回答,而是先让其从法规库中检索准确条文,再将问题与检索结果一同提交给模型,由模型整合后给出答案,这种方式能显著提升回答的准确性。

看似简单的逻辑,实际落地面临两个核心挑战:一是无法预判用户的提问形式,问题千奇百怪,要求模型具备极广的知识覆盖;二是需在海量知识中,于1秒钟内完成精准检索。2024年,我们成功攻克这两大难题,推出了基于自然语言的法律检索工具。过去的法律检索需输入关键词,再从结果中反复筛选,而新的检索工具支持自然语言输入,模型会在1秒钟内快速读取海量法规、案例、文书、论文及网络资料,最终输出整合后的答案。

从评测数据来看,2024年5月Stanford对国外模型的幻觉率评测显示,OpenAI模型的幻觉率约为43%,而经过优化的法律专业工具模型,最优表现的幻觉率仅为17%。国内学者2025年上半年的评测结果显示,通用模型应用于法律领域的幻觉率约为40%,与OpenAI接近,华宇元典的模型幻觉率维持在17%,其他国内法律科技产品也有各自表现。

尽管已处于国内领先水平,但我们认为仍有巨大提升空间,因此2025年下半年进一步优化了模型性能。首先,我们构建了规模庞大的法律数据库,涵盖558万部法律法规、1.7亿份裁判文书、1.1亿条企业工商数据,同时将人民法院官网资料、权威判例、知名法律书籍等全部进行向量化处理,打造了专属模型的高质量知识库,大幅提升回答的专业性与准确性。其次,我们补充了大量中文法律领域的观点,并帮助客户搭建内部专属知识库,供律师与客户共同使用,进一步强化模型的针对性。

2

法律人的文书处理工作

法律人的日常工作中,需撰写各类文书、处理大量案头工作。我们思考能否让模型承担部分相对简单、明确的工作?根据认知理论,人类认知活动分为六个层次,记忆、理解、应用属于相对简单的层次,分析、评价、创造则更为复杂。我们借鉴知识管理中的做法,将人类的隐性知识与专家知识外化为团队显性知识,实现组织内传播,具体通过“社会化、外在化、组合、内在化”四个环节,让知识成为团队共享资产。

我们尝试让人与模型共享知识,将法律工作拆解为详细工作流,要求模型按预设顺序逐步执行。以物业公司起诉业主的案件为例,此类案件的特点是被告众多、个案事实存在差异,需填写最高人民法院要求的要素式起诉书。我们将这一工作拆解为四个步骤,告知模型具体执行逻辑:第一步,识别当事人信息(原告为法人或自然人、被告自然信息、企业注册地址等);第二步,明确诉讼请求;第三步,确定管辖与保全事宜;第四步,提取事实与理由。通过这样的拆解,模型可在几秒钟内完成人类需花费大量时间的工作。从最终结果来看,当事人信息、诉讼请求、注册地址、事实与理由等均被完整、准确地填写到要素式起诉书中。对于此类标准化、可复制的工作,未来模型有望承担更多任务。目前,我们已设计了数百个类似工作流,帮助法律工作者完成可重复执行的事务性工作。

但我们发现,用户常提出更复杂的工作流需求,而由于人工编排的工作流存在局限性,诉讼场景的工作流尚可列举,非诉及公司法务场景的工作流则无穷无尽。因此,我们转换思路,不再为模型规划具体步骤,而是为其配备丰富的工具库。例如,当被问及“借款100万,利息应如何约定”时,模型需完成三件事:检索法律法规相关规定、查询中国人民银行官网当前LPR数据、整合结果并存储,以便后续模型遇到同类问题可以快速回应。

再以起草上市公司公告为例(此类工作通常需法务部、证券部花费1-2天完成),我们为模型配备了四类核心工具:一是工商信息检索工具,可调取法律主体的真实工商数据;二是证监会官网公告检索工具,可查找同类公司相关公告;三是公告拆解分析工具,快速确定适用模板;四是段落自检工具,对文书的段落逐一核查质量。通过工具调用,模型能够独立完成这一复杂任务。

3

法律智能体Amicus

2025年,我们为模型构建了庞大的工具箱,涵盖检索类、计算类、文档处理类、日期类、审限确定及开庭时间安排等各类工具。如今,模型的应用能力不仅取决于其自身性能,更取决于知识库与工具库的完善程度。在此基础上,我们进一步优化了三个关键环节:一是帮助用户优化提示词(prompt)撰写;二是提供模型选择建议;三是强化使用安全保障。

将这些方面整合后,我们推出了真正意义上的“法律智能体”,命名为“Amicus”(源于拉丁文,意为“朋友与伙伴”)。我们相信,这款产品的推出,将推动行业真正进入人机协同的智能时代。

4

大模型与法律行业的关联发展

法律行业的AI应用,可借鉴其他知识密集型行业的发展经验,例如医疗、金融领域;而编程行业的AI应用走在前列,其发展路径亦可为法律行业提供重要参考。电脑的诞生让编程人员从“走路”升级为“骑自行车”,而AI工具的应用则让开发者从“骑自行车”升级为“开汽车”。这一飞跃尚未在法律行业实现,核心原因有二:一是法律领域的信息与语料高度碎片化,分散于Word文档、网站、微信等各类载体,缺乏编程行业那样统一的数字化环境进行整合;二是法律工作的质量缺乏客观、可自动化识别的评价标准。若能突破这两大难题,法律行业的自动化水平将实现质的飞跃。

展望未来,我认为大模型与法律行业的关联将分为四个阶段:

第一阶段(当前阶段),模型帮助个体大幅提升工作效率;第二阶段,模型能力进一步提升,个体生产率显著增长,原本占据50%工作时间的事务性工作将压缩至5%,法律人可将更多精力投入高附加值工作;第三阶段,个体工作流程的变革将引发组织形态变化,层级化的金字塔式分工将被打破;第四阶段,组织形态的变革将推动行业生态发生变化。与此同时,需求侧也在发生转变,越来越多当事人遇到法律问题时,会先通过AI工具咨询,即便有律师推荐,也会通过AI了解律师资质。供给侧与需求侧的双重变化,将共同塑造法律服务的未来图景。

我认为,人类的智慧源于经验、直觉、情感与想象力的判断;AI的智能,基于海量数据与高速计算的能力,二者将交相辉映,共同勾勒出法律服务的未来图景。因此,我们将当前时代定义为“人机协同的法律智能时代”。最后我想强调的是,无论模型与技术如何发展,我们的初心始终不变——让法律变得更美好。

END

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...