https://cevalbenchmark.com/index_zh.html
排行榜: https://cevalbenchmark.com/static/leaderboard_zh.html
Github: https://github.com/hkust-nlp/ceval
网站涵盖了 52 个不同学科的 13948 个多项选择题,分为四个难度级别,并且网站根据这些评估套件对模型做了个排行榜
毫无意外的 GPT-4 获得了最高分!
排行榜由上海交通大学和清华大学的学生提供支持
ppt.cc/fVjECx ppt.cc/fEnHsx ppt.cc/fRZTnx ppt.cc/fSZ3cx ppt.cc/fLOuCx ppt.cc/fE9Nux ppt.cc/fL5Kyx ppt.cc/fIr1ax ppt.cc/f71Yqx tecmint.com linuxcool.com linux.die.net linux.it.net.cn ostechnix.com unix.com ubuntugeek.com runoob.com man.linuxde.net v.gd/4A2G5b v.gd/VBg0IE v.gd/kVkm7n v.gd/jCKP1G linuxprobe.com linuxtechi.com howtoforge.com linuxstory.org systutorials.com ghacks.net linuxopsys.com v.gd/2P9wTx v.gd/FtfpqE v.gd/eMfHsm v.gd/Ub7mqv v.gd/RReVk0 v.gd/vS3uTI v.gd/4Zxmba v.gd/1BnFph
https://cevalbenchmark.com/index_zh.html
排行榜: https://cevalbenchmark.com/static/leaderboard_zh.html
Github: https://github.com/hkust-nlp/ceval
网站涵盖了 52 个不同学科的 13948 个多项选择题,分为四个难度级别,并且网站根据这些评估套件对模型做了个排行榜
毫无意外的 GPT-4 获得了最高分!
排行榜由上海交通大学和清华大学的学生提供支持
No comments:
Post a Comment