aa Coding Index

92 models evaluated

#	Model	Provider	Type	Score
1	Claude Opus 5	Anthropic	Closed	claude-opus-5
2	GPT-5.6 Sol	OpenAI	Closed	gpt-5-6-sol
3	GPT-5.6 Terra	OpenAI	Closed	gpt-5-6-terra
4	Claude Fable 5	Anthropic · Closed	76.5%
5	Kimi K3	Moonshot AI · Closed	76.2%
6	GPT-5.5	OpenAI · Closed	74.9%
7	Claude Opus 4.8	Anthropic · Closed	74.3%
8	Claude Opus 4.7 (Adaptive)	Anthropic · Closed	73.6%
9	Grok 4.5	xAI · Closed	72.5%
10	Claude Sonnet 5	Anthropic · Closed	71.5%
11	GPT-5.6 Luna	OpenAI · Closed	71.5%
12	Muse Spark 1.1	Meta · Closed	71.3%
13	GPT-5.4	OpenAI · Closed	71.0%
14	Gemini 3.5 Flash	Google · Closed	70.1%
15	Gemini 3.6 Flash	Google · Closed	69.2%
16	Gemini 3.1 Pro	Google · Closed	68.8%
17	GLM-5.2	Z.AI · Open weight	68.8%
18	Qwen3.7 Max	Alibaba · Closed	66.0%
19	Kimi K2.6	Moonshot AI · Open weight	61.8%
20	Kimi K2.7 Code	Moonshot AI · Open weight	60.8%
21	MiMo-V2.5-Pro	Xiaomi · Closed	60.2%
22	DeepSeek V4 Pro (Max)	DeepSeek · Open weight	59.4%
23	Hy3 Preview	Tencent · Open weight	58.8%
24	Hy3	Tencent · Open weight	58.8%
25	DeepSeek V4 Pro (High)	DeepSeek · Open weight	58.7%
26	Muse Spark	Meta · Closed	58.6%
27	MiniMax M3	MiniMax · Open weight	58.6%
28	DeepSeek V4 Flash (Max)	DeepSeek · Open weight	56.2%
29	GPT-5.4 mini	OpenAI · Closed	56.1%
30	GPT-5.4 nano	OpenAI · Closed	56.1%
31	Qwen3.7 Plus	Alibaba · Closed	55.9%
32	GLM-5.1	Z.AI · Open weight	55.8%
33	Qwen3.6 Plus	Alibaba · Closed	54.5%
34	Qwen3.6-27B	Alibaba · Open weight	53.7%
35	MiniMax M2.7	MiniMax · Open weight	52.6%
36	Inkling	Thinking Machines Lab · Open weight	52.1%
37	DeepSeek V4 Flash (High)	DeepSeek · Open weight	52.0%
38	MiMo-V2-Flash	Xiaomi · Open weight	49.8%
39	GPT-5.1	OpenAI · Closed	49.4%
40	Gemini 3.5 Flash-Lite	Google · Closed	49.3%
41	Nemotron 3 Ultra	NVIDIA · Open weight	49.3%
42	Qwen3.5 397B	Alibaba · Open weight	48.2%
43	Qwen3.5 397B (Reasoning)	Alibaba · Open weight	48.2%
44	Mistral Medium 3.5 128B	Mistral · Open weight	46.9%
45	Kimi K2.5	Moonshot AI · Open weight	46.8%
46	Kimi K2.5 (Reasoning)	Moonshot AI · Closed	46.8%
47	Qwen3.5-122B-A10B	Alibaba · Open weight	45.7%
48	GLM-4.7	Z.AI · Open weight	45.3%
49	Gemma 4 31B	Google · Open weight	43.4%
50	Grok 4.3	xAI · Closed	42.3%
51	Qwen3.6-35B-A3B	Alibaba · Open weight	41.9%
52	o1	OpenAI · Closed	39.7%
53	Step 3.7 Flash	StepFun · Open weight	39.6%
54	Gemma 4 26B A4B	Google · Open weight	39.3%
55	GPT-5 (high)	OpenAI · Closed	37.8%
56	Nemotron 3 Super 120B A12B	NVIDIA · Open weight	37.7%
57	Gemini 3.1 Flash-Lite	Google · Closed	34.7%
58	o1-preview	OpenAI · Closed	34.0%
59	Gemini 2.5 Pro	Google · Closed	33.3%
60	K-Exaone	LG AI Research · Closed	32.1%
61	Mercury 2	Inception · Closed	31.1%
62	Gemma 4 12B	Google · Open weight	31.0%
63	GPT-OSS 120B	OpenAI · Open weight	30.4%
64	Command A+	Cohere · Open weight	27.9%
65	Mistral Small 4	Mistral · Open weight	26.6%
66	Mistral Small 4 (Reasoning)	Mistral · Open weight	26.6%
67	Trinity-Large-Preview	Arcee AI · Open weight	25.8%
68	Trinity-Large-Thinking	Arcee AI · Open weight	25.8%
69	Ling 2.6 Flash	InclusionAI · Open weight	25.3%
70	Gemini 1.5 Pro	Google · Closed	23.6%
71	DeepSeek V3	DeepSeek · Open weight	23.0%
72	GPT-4 Turbo	OpenAI · Closed	21.5%
73	GPT-OSS 20B	OpenAI · Open weight	20.7%
74	GPT-4.1 mini	OpenAI · Closed	20.2%
75	Mistral Large 3	Mistral · Closed	20.1%
76	Claude 3 Opus	Anthropic · Closed	19.5%
77	Llama 4 Maverick	Meta · Open weight	16.3%
78	GPT-5 mini	OpenAI · Closed	15.6%
79	Nemotron 3 Nano 30B	NVIDIA · Open weight	14.4%
80	Ministral 3 14B (Reasoning)	Mistral · Open weight	14.4%
81	Ministral 3 14B	Mistral · Open weight	14.4%
82	Nemotron 3 Nano Omni 30B A3B	NVIDIA · Open weight	13.8%
83	GPT-4o mini	OpenAI · Closed	11.4%
84	GPT-4.1 nano	OpenAI · Closed	11.1%
85	Gemma 3 27B	Google · Open weight	10.1%
86	Ministral 3 8B (Reasoning)	Mistral · Open weight	9.7%
87	Ministral 3 8B	Mistral · Open weight	9.7%
88	Gemma 4 E4B	Google · Open weight	9.4%
89	Llama 4 Scout	Meta · Open weight	8.2%
90	Gemma 4 E2B	Google · Open weight	7.2%
91	Ministral 3 3B (Reasoning)	Mistral · Open weight	4.8%
92	Ministral 3 3B	Mistral · Open weight	4.8%