新京报讯(记者行海洋)为推动大数据、人工智能等科技创新成果与司法工作深度融合,11月15日,最高人民法院召开新闻发布会,对外发布“法信法律基座大模型”。该模型已完成在网信部门的生成式人工智能服务备案,是国家级法律人工智能基础设施,也是法律行业的基座大模型。
大模型是一种利用大量数据和算力,通过深度学习技术训练出来的人工智能模型,它具有理解、生成、处理与规划各种类型数据的能力,它的规模和能力目前已经达到了千亿乃至万亿参数的级别,是一种典型的新质生产力,可以应用于各个领域,为人类提供智能化的服务和解决方案。
法律行业的专业性、精准性,需要高度标准且及时更新的各种专业法律数据作为训练语料,以提升大模型对法律理解的准确性和适用性。法律文本及各种法律文书在应用时有规范性和严肃性的要求,因此对大模型生成内容的专业合规、安全可信提出了更高的要求。
高质量的法律数据预训练是构建法律大模型能力的关键。“法信法律基座大模型”使用最高人民法院“法信”等多个法律大数据平台的全量数据资源,种类全、规模大、来源可信、权威度高,能够为大模型预训练和机器深度学习提供充足的法律数据语料。
据介绍,“法信法律基座大模型”经过海量、权威和高质量法律大数据预训练和增强训练之后,能够形成很强的法律语言理解能力、法律文本信息抽取能力、法律逻辑推理能力以及根据提示的文本生成能力。在大模型这一底层能力之上,可以在智能辅助审判和库网融合检索方面发挥积极作用,辅助法官从大篇幅的电子卷宗中快速进行信息分析比对,抓取要点、提炼梗概,提高立案审查和阅卷效率。
以往由于法律的高度专业性,公众在法律咨询时,通过自然口语所表述的纠纷案情和争议诉求,如果不经过法律工作者的理解转化,很难获得精准、专业的解答。经过专业大数据预训练的法律大模型,不但可以理解公众非专业化的表述,而且本身的回答也能具备相当的专业水平,可以根据具体案情为公众提供和解、调解、应诉等不同策略和建议,大大降低公共法律服务的门槛,为公众提供更为便捷、普惠的法律咨询服务。
编辑 樊一婧
校对 李立军