🤖 AI 模型能力评测中心

基于四层评测体系的模型能力横向对比

📊 评测概览

评测时间

2026-03-17

评测模型

11个 (已验证可用)

评测维度

4层16项

评分标准

总分100分

🏆 模型排行榜

总分排序
排名 模型名称 供应商 总分 L1基础 L2架构 L3本体 L4审计 状态
🥇 1 GPT-5.3 Codex vpsairobot.com 95.7 96 95 94 98
🥈 2 GPT-5.4 vpsairobot.com 95.2 94 96 93 97
🥉 3 Claude Opus 4.6 vip.aipro.love 91.05 90 88 92 95
4 Gemini 3.1 Pro High vip.aipro.love 90.6 88 90 91 93
5 Kimi K2.5 dashscope.aliyuncs.com 88.1 88 85 90 92
6 DeepSeek V3.2 volces.com 87.5 89 85 92 90
7 Doubao Seed 2.0 Code volces.com 86.7 92 75 88 95
8 Qwen3 Coder Plus dashscope.aliyuncs.com 84.0 87 82 86 88
9 Doubao Seed Code Preview 251028 volces.com 81.75 85 80 75 88
10 Doubao Seed 2-0 Code Preview 260215 volces.com 80.0 85 80 70 85