https://cevalbenchmark.com/index_zh.html
排行榜: https://cevalbenchmark.com/static/leaderboard_zh.html
Github: https://github.com/hkust-nlp/ceval
网站涵盖了 52 个不同学科的 13948 个多项选择题,分为四个难度级别,并且网站根据这些评估套件对模型做了个排行榜
毫无意外的 GPT-4 获得了最高分!
排行榜由上海交通大学和清华大学的学生提供支持
ppt.cc/fVjECx ppt.cc/fEnHsx ppt.cc/fRZTnx ppt.cc/fSZ3cx ppt.cc/fLOuCx ppt.cc/fE9Nux ppt.cc/fL5Kyx ppt.cc/fIr1ax ppt.cc/f71Yqx tecmint.com linuxcool.com linux.die.net linux.it.net.cn ostechnix.com unix.com ubuntugeek.com runoob.com man.linuxde.net ppt.cc/fwpCex ppt.cc/fxcLIx ppt.cc/foX6Ux linuxprobe.com linuxtechi.com howtoforge.com linuxstory.org systutorials.com ghacks.net linuxopsys.com ppt.cc/ffAGfx ppt.cc/fJbezx ppt.cc/fNIQDx ppt.cc/fCSllx ppt.cc/fybDVx ppt.cc/fIMQxx ppt.cc/fKlBax
https://cevalbenchmark.com/index_zh.html
排行榜: https://cevalbenchmark.com/static/leaderboard_zh.html
Github: https://github.com/hkust-nlp/ceval
网站涵盖了 52 个不同学科的 13948 个多项选择题,分为四个难度级别,并且网站根据这些评估套件对模型做了个排行榜
毫无意外的 GPT-4 获得了最高分!
排行榜由上海交通大学和清华大学的学生提供支持
No comments:
Post a Comment