大模型能力评测平台

全面评估大型语言模型在各个领域的能力表现

评测数据集