次级导航
blog
收录投稿
blog
收录投稿
首页
•
AI评测平台
•
MLPerf Inference
MLPerf Inference
4小时前更新
3
0
0
收藏
0
机器学习推理性能的行业标准基准。
收录时间:
2026-04-24
打开网站
手机查看
AI评测平台
MLPerf Inference
打开网站
机器学习推理性能的行业标准基准。
数据统计
相关导航
Aider Leaderboard
专注代码编辑能力的 LLM 排行榜,评估模型在实际编程任务中的表现。
OpenCompass (司南)
国内领先的开源大模型评测体系。
LiveSWEBench
实时软件工程基准测试,评估 AI 在真实代码库中解决问题的能力。
AIME 2025
2025 美国数学竞赛邀请赛,专门测试大模型的高级数学推理能力。
MMLU 排行榜
大规模多任务语言理解基准测试,衡量多学科问题性能。
Artificial Analysis
对比 100+ AI 模型的智能、价格、性能、速度和上下文窗口等关键指标。
SEAL Leaderboard
Scale AI 的专家驱动评测平台,专注编程和推理能力排名。
FRAMES
Google 推出的 RAG 系统评测基准,824 道多跳问题,测试检索准确性和推理能力。
暂无评论
暂无评论...
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍