研究团队使用Azure Translate将MMLU基准 (一套涵盖57个主题的 13122223631程漫漫 17302201672合规声明报告节选自已公开发
MMLU、C-Eval、AGIEval和GAOKAO-Bench,这也基本上是大模 出于面子问题,不能公开测评.前路漫漫,上下求索.—— End
M M L U 、 C - E v a l 、 A G I E v a l he G A O K A O - B e n c h , zhe ye ji ben shang shi da mo . . . chu yu mian zi wen ti , bu neng gong kai ce ping . qian lu man man , shang xia qiu suo . — — E n d . . .
MMLU、C-Eval、AGIEval和GAOKAO-Bench,这也基本上是大模 出于面子问题,不能公开测评.前路漫漫,上下求索.—— End
发表评论