TruthfulQA
更新时间:2025-09-26
TruthfulQA 是一个用于评估语言模型在生成回答时是否真实可靠的基准数据集。该数据集包含817个问题,涵盖健康、法律、金融和政治等38个类别。这些问题设计巧妙,一些问题可能因为人们的
如果您使用该数据集,请查看并遵守发布方声明的开源协议,查看详情 ModelScope





TruthfulQA 是一个用于评估语言模型在生成回答时是否真实可靠的基准数据集。该数据集包含817个问题,涵盖健康、法律、金融和政治等38个类别。这些问题设计巧妙,一些问题可能因为人们的
如果您使用该数据集,请查看并遵守发布方声明的开源协议,查看详情 ModelScope