C-Eval是一个针对基础模型的综合性中文评估数据集。它由13948道多选题组成,涉及52个不同学科和四个难度等级。
如果您使用该数据集,请查看并遵守发布方声明的开源协议,查看详情 ModelScope