秘密教学10话我需要灭火一周打完秘密教学10话我需要灭火1000场官司,中科院发布首个AI法庭AgentCourt_ZAKER新闻
一周打完秘密教学10话我需要灭火1000场官司,中科院发布首个AI法庭AgentCourt_ZAKER新闻
共铸精彩的你我
在人工智能重塑各个行业的今天 , 法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战,而 AI 技术的出现为解决这些问题提供了新的可能。从最初斯坦福小镇火遍全网,25 个由大语言模型(LLMs)驱动的智能体生活交友,打开了多 Agent 新视角。而现在,AI 法庭也来了!最近,来自中科院深圳先进研究院的研究团队开发了一个名为 AgentCourt 的模拟智能法庭,它是一个基于大语言模型 ( LLMs ) 的法庭模拟系统 , 旨在通过 AI 驱动的虚拟法庭来革新法律教育、案例分析和法律研究。论文地址:https://doi.org/10.48550/arXiv.2408.08089代码:https://github.com/relic-yuexi/AgentCourtAgentCourt 实战演示:https://b23.tv/e6eQMfM该系统能够模拟完整的法庭程序。法官、原告律师、辩护律师以及其他参与者均由大型语言模型驱动的自主代理扮演。他们的主要目标是通过模拟法庭流程来帮助律师代理学习如何有效辩论案件,并提高其整体法律专业技能。该篇文章的主要贡献有:1. 全面模拟,真实再现AgentCourt 不仅仅是一个模拟工具,它是一个高度复杂的系统,能够精确模拟民事法庭的设置,实现多方互动和复杂的法律推理。这是首次将 AI 技术应用于法庭环境模拟中,为法律教育和实践提供了前所未有的可能性。2. 对抗性交互,强化法律推理在 AgentCourt 的模拟过程中,大型语言模型(LLMs)的法律推理能力通过智能体之间的对抗性交互得到了显著增强。这种利用对抗性多智能体交互的方法,不仅超越了简单的信息传递,更为未来的相关研究提供了新的视角和思路。3. 高效模拟,真实案例验证该工作成功模拟了 1,000 个中国真实的民事案例,这些案例在 AgentCourt 中仅用数天时间完成,而在现实世界中,这可能需要律师们花费十年时间。通过自动和人工评估方法,验证了智能体进化的有效性。为了尽量真实的模拟法庭,研究人员设置了以下的人物:1. 原告与被告代理模拟开始于案件发生之前,两名由 ERNIE-Speed-128K 驱动的代理分别扮演潜在的原告和被告。一旦涉及案件,他们将自动寻求律师事务所的法律援助,这是法律纠纷中的典型行为。系统配置使得原告或被告在与律师的互动中可以直接获得诉状或答辩状,无需从头起草。2. 律师代理设计了两名律师代理,同样由 ERNIE-Speed-128K 驱动。当原告和被告在律师事务所寻求帮助时,这些律师代理将被随机分配为原告律师和被告律师。他们与各自的客户沟通,收集案件相关信息,并利用丰富的法律经验、案例先例和法定代码,按照规定程序进行法庭辩论,维护各自客户的利益。3. 法官代理在法庭中,法官负责监督整个过程,听取双方律师的论点,并在适当时候提问。最终,法官总结并评估律师的每一轮论点,然后作出最终判决。4. 法庭书记员代理为了创造更真实的法庭环境并促进代理的进化,他们设计了法庭书记员代理,负责宣布审判的开始和记录审判的全过程。这些由大模型驱动的 Agent,可以根据初始数据,自发地进行法庭的模拟,而无需任何人工的监督。数据集研究人员利用中国裁判文书网的数据,编译了一个包含 10,000 个民事判决的数据集。预处理的重点是提高数据集质量,精心清洗并选择了 1,389 个高质量案例,这些案例同时包含原告的诉求和被告的辩护。为了解决潜在的重复问题,他们采用了 BERT 进行「案件介绍」部分的语义向量化,并使用 K-Means 聚类对相似文档进行分组。这产生了 1,000 个代表性文档,用于模拟法庭训练和测试。数据生成与匿名化利用 ERNIE-Speed-128K API(百度智能云文档 2024)生成并匿名化高保真模拟文本,这些文本专门针对民事判决。这产生了一个精选的数据集,包含 1,000 个训练样本和 50 个测试样本,旨在支持模拟法庭环境中强大的法律论证和判决预测,从而推进法律分析技术。通过这些严格的数据处理步骤,AgentCourt 确保了模拟环境的真实性和数据的可靠性,为法律 AI 的发展奠定了坚实的基础。在得到数据后,各个 Agent 各司其职,根据一定的流程展开法庭的辩论。该论文的模拟过程如下:在模拟完 1000 个民事案例后,原告律师和被告律师的能力都得到了很大的提升,文章中的自动评估和人工评估展示了实验结果:实验基于 1,000 个真实世界的民事案件,通过自动评估和人工评估两种方式,全面检验了 AgentCourt 系统的效能。自动评估采用了 LawBench 评估标准,涵盖了法律知识的记忆、理解和应用三个层面。人工评估则由经验丰富的法律专家进行,评估了智能体的思维敏捷性、专业知识性和逻辑严谨性。实验结果显示,在 AgentCourt 中经历了数千次对抗性法律案件模拟(相当于现实世界律师十年的工作经验),律师代理在处理法律任务的能力上有了显著提升。无论是在自动评估还是人工评估中,进化后的代理都展现出了更快的响应速度、更深的法律知识和更强的逻辑推理能力,在复杂案件分析、法律推理和辩论策略上 , 部分 AI 律师甚至超越了人类专家的表现。就像自动评估中的 Article Recitation 任务,经过进化后的律师 Agent 可以较好的背诵出指定法律的内容。而未经进化的律师就只能「阿巴阿巴」了。AgentCourt 的出现在未来可能对法律行业产生深远影响 :1. 法律教育革新 : 为法律院校提供高度仿真的实践平台 , 学生可与顶级 AI 律师对战 , 快速积累经验。2. 提高司法效率 : AI 辅助可以加速案件预审、证据分析等流程 , 减轻法官和律师的工作负担。3. 降低法律服务成本 : AI 律师助手可以处理大量初级工作 , 使优质法律服务更加平价可及。4. 推动法律研究 : 海量案例模拟为法学研究提供了前所未有的数据支持 , 助力发现新的法律模式和理论。5. 伦理挑战 : AI 在法律领域的应用也带来了一系列伦理问题 , 如决策过程的透明度、AI 偏见的控制等 , 需要社会各界共同探讨。参考资料https://github.com/relic-yuexi/AgentCourt本文来自微信公众号" 新智元 ",作者:LRST ,36 氪经授权发布。koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:林莽
TOP1热点:充电器在不充电时插在插座上会耗电吗
一次李韵晗当更时。
TOP2热点:31省份人均收入账单出炉
8月2日播出第三集
TOP3热点:幻云自曝网恋两个月被骗 20 万人与各种动ZZZ0O0OXXX
第一次来中国时,梅洛就感叹于在一个人口如此众多的国家,一切安排得井井有条。他说,对于人口2000多万的成都来说,组织举办大运会的难度自然会远超欧洲一些人口规模小得多的城市,比如他的故乡意大利米兰。但成都大运会的组织工作非常精细,受到与会运动员和体育官员的交口称赞。
TOP4热点:知乎创作收益开襟旗袍做双人运动
她在电话里跟对方解释:我们这里有个“小鹿灯儿童重疾救助公益项目”,可以分担你家孩子的治疗费用。“好几百个病种,起步3000元”。家属们不相信:“不可能有这么好的事”。
TOP5热点:老板因在岗时间长不给涨工资你会如何上边一面亲下边一面膜的程序
身处伟大时代
病房里的“抗癌明星”方女士今年38岁,十年前,她刚生下女儿5天,被确诊为肺癌晚期。
TOP6热点:男子醉酒身亡家属起诉同桌索赔被驳回片多多免费观看高清
编辑:刘宁、卢星吉、黄绪国
TOP7热点:北方小年45岁沈阳老阿姨叫的没谁了
来源:为伞形科植物川芎的根茎,采收和储藏:栽后第2年5月下旬至6月上旬,挖出根茎,抖掉泥土,除去茎叶,炕干。
TOP8热点:人体哪个器官或者部位最委屈开襟旗袍做双人运动
百度与文化和旅游部签订战略合作加速文旅产业智能化升级近日,文化和旅游部(以下简称“文旅部”)与百度签订战略合作协议,以共同推动中国文化和旅游产业的智能化发展。双方将在文旅大数据服务、智慧文旅建设、非物质文化遗产传播等多个领域展开深度合作,以提升中国文化旅游业的科技含量和国际影响力。
TOP9热点:为什么中国农村房子那么丑亚洲一线产区二线产区区别
从跟跑、并跑直至领跑
TOP10热点:为什么很多家庭一到过年就吵架45岁沈阳老阿姨叫的没谁了
当患者确诊恶性肿瘤,经历放疗、化疗、靶向治疗、免疫治疗等一系列标准治疗后面临“无药可用”,临床试验犹如一束光,为他们打开新的生命之窗,照亮抗癌荆棘之路。