mmlu
更新时间:2025-09-26
MMLU是一项大规模多任务测试,由来自各个知识分支的多项选择题组成。测试涵盖人文、社会科学、自然科学和其他对某些人来说很重要的领域的科目。它涵盖了 57 项任务,包括初等数学、美国历史、计算机科学、法律等。为了在这项测试中获得高精度,模型必须具备广泛的世界知识和解决问题的能力。
如果您使用该数据集,请查看并遵守发布方声明的开源协议,查看详情 ModelScope
MMLU是一项大规模多任务测试,由来自各个知识分支的多项选择题组成。测试涵盖人文、社会科学、自然科学和其他对某些人来说很重要的领域的科目。它涵盖了 57 项任务,包括初等数学、美国历史、计算机科学、法律等。为了在这项测试中获得高精度,模型必须具备广泛的世界知识和解决问题的能力。
如果您使用该数据集,请查看并遵守发布方声明的开源协议,查看详情 ModelScope