北大开源法律大模型革新法律服务

简介：北京大学团队推出Lawyer LLaMA和ChatLaw法律大模型，通过大规模法律语料训练，实现法律知识精准应用。模型数据与源码全部开源，为公众提供普惠法律服务，革新传统法律咨询方式。

在人工智能领域，大模型的应用正不断拓展其边界，向垂直行业领域深入发展。近日，北京大学的研究团队在法律领域取得了显著突破，推出了两款法律大模型——Lawyer LLaMA和ChatLaw，这两款模型不仅数据与模型全部开源，而且通过在大规模法律语料中的训练，实现了对中国法律知识体系的系统学习，能够精准应用于中国的法律实务，为公众提供普惠的法律服务。

Lawyer LLaMA：专业法律知识的精准应用

Lawyer LLaMA是北京大学王选计算机研究所团队基于开源的LLaMA模型，通过注入法律相关知识、习得特定领域技能以及引入信息检索模块等步骤精心构建而成的。这款模型在解释法律概念、区分相似法律术语以及提供法律实务咨询等方面，均展现出了卓越的性能。

在对比测试中，Lawyer LLaMA相较于其他大模型，如BELLE和 ChatGLM，能够更准确地回答法律问题，提供有理有据且颇具专业性的回答。例如，在解释“什么是夫妻共同财产”时，Lawyer LLaMA能够简明准确地回答，而BELLE和ChatGLM则出现了错误。此外，在区分“离婚”与“无效婚姻”这两个相似法律概念时，也只有Lawyer LLaMA给出了一个看起来更加专业、可信度更高的回复。

ChatLaw：支持多样化法律服务的智能平台

ChatLaw是北京大学团队推出的另一款法律大模型，它提供了更加多样化的法律服务。ChatLaw支持用户上传文件、录音等法律材料，帮助用户归纳和分析，生成可视化导图、图表等。此外，ChatLaw还可以基于事实生成法律建议、法律文书，为用户提供一站式的法律服务体验。

ChatLaw的数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成，经过清洗、数据增强等来构造对话数据。同时，通过与北大国际法学院、行业知名律师事务所进行合作，ChatLaw团队能够确保知识库能及时更新，同时保证数据的专业性和可靠性。在模型层面，ChatLaw引入了self-suggestion角色来缓解模型产生幻觉问题，并在多个A100 GPU上进行训练，借助deepspeed进一步降低了训练成本。

开源共享：推动法律服务普惠化

北京大学团队将Lawyer LLaMA和ChatLaw的数据与模型全部开源，这一举措无疑将推动法律服务的普惠化。通过开源，更多的开发者、法律从业者以及公众可以接触到这些先进的法律大模型，进而将其应用于实际生活中，解决法律问题，维护自身权益。

此外，开源还有助于促进法律大模型的持续优化和改进。开发者可以根据自己的需求和场景，对模型进行微调和优化，使其更加适应特定的法律环境和任务。这种开放式的合作模式将加速法律大模型的发展和应用。

千帆大模型开发与服务平台：助力法律大模型落地

在推动法律大模型落地的过程中，千帆大模型开发与服务平台无疑将发挥重要作用。千帆大模型开发与服务平台提供了丰富的工具和资源，支持开发者进行模型训练、调优和部署。通过该平台，开发者可以更加高效地利用Lawyer LLaMA和ChatLaw等法律大模型，将其应用于实际的法律服务场景中。

例如，开发者可以利用千帆大模型开发与服务平台，将Lawyer LLaMA或ChatLaw集成到智能法律咨询系统中，为用户提供便捷、高效的法律咨询服务。同时，开发者还可以根据用户需求，对模型进行定制化开发，提供更加个性化的法律服务。

结语

北京大学团队推出的Lawyer LLaMA和ChatLaw法律大模型，为公众提供了普惠的法律服务。通过开源共享和千帆大模型开发与服务平台的支持，这些模型将加速在法律领域的应用和发展。未来，随着技术的不断进步和应用场景的不断拓展，法律大模型将成为推动法律服务创新和发展的重要力量。

北大开源法律大模型革新法律服务

Lawyer LLaMA：专业法律知识的精准应用

ChatLaw：支持多样化法律服务的智能平台

开源共享：推动法律服务普惠化

千帆大模型开发与服务平台：助力法律大模型落地

结语

最热文章