aa Omniscience Index

154 models evaluated

#	Model	Provider	Type	Score
1	Claude Fable 5	Anthropic	Closed	claude-fable-5
2	Gemini 3.1 Pro	Google	Closed	gemini-3-1-pro
3	Claude Opus 5	Anthropic	Closed	claude-opus-5
4	Claude Opus 4.8	Anthropic · Closed	27.4%
5	Grok 4.5	xAI · Closed	26.4%
6	Claude Opus 4.7 (Adaptive)	Anthropic · Closed	26.2%
7	Gemini 3.6 Flash	Google · Closed	23.5%
8	Gemini 3.5 Flash	Google · Closed	22.7%
9	GPT-5.6 Sol	OpenAI · Closed	21.7%
10	GPT-5.5	OpenAI · Closed	20.1%
11	Kimi K3	Moonshot AI · Closed	18.4%
12	Grok 4.3	xAI · Closed	18.3%
13	Muse Spark 1.1	Meta · Closed	18.0%
14	Gemini 3 Pro	Google · Closed	15.8%
15	Claude Sonnet 5	Anthropic · Closed	15.3%
16	Claude Opus 4.7	Anthropic · Closed	14.2%
17	Qwen3.7 Max	Alibaba · Closed	14.1%
18	Claude Opus 4.6 (Adaptive)	Anthropic · Closed	13.5%
19	Claude Opus 4.5 Thinking	Anthropic · Closed	13.3%
20	Qwen 3.6 Max (preview)	Alibaba · Closed	10.2%
21	GPT-5.3 Codex	OpenAI · Closed	9.9%
22	GPT-5.3-Codex-Spark	OpenAI · Closed	9.9%
23	Gemini 3.5 Flash-Lite	Google · Closed	6.9%
24	Kimi K2.6	Moonshot AI · Open weight	6.4%
25	GPT-5.4	OpenAI · Closed	5.7%
26	GPT-5.1	OpenAI · Closed	5.6%
27	MiMo-V2-Pro	Xiaomi · Closed	4.9%
28	Muse Spark	Meta · Closed	4.1%
29	GLM-5.2	Z.AI · Open weight	4.0%
30	Grok 4	xAI · Closed	3.8%
31	MiMo-V2.5-Pro	Xiaomi · Closed	3.6%
32	Claude Opus 4.6	Anthropic · Closed	3.5%
33	Qwen3.6 Plus	Alibaba · Closed	2.7%
34	Qwen3.7 Plus	Alibaba · Closed	2.4%
35	Inkling	Thinking Machines Lab · Open weight	2.1%
36	GLM-5	Z.AI · Open weight	2.0%
37	GLM-5.1	Z.AI · Open weight	1.9%
38	MiniMax M3	MiniMax · Open weight	1.4%
39	MiniMax M2.7	MiniMax · Open weight	0.7%
40	GPT-5.6 Terra	OpenAI · Closed	-0.2%
41	Nemotron 3 Ultra	NVIDIA · Open weight	-0.8%
42	GPT-5.2	OpenAI · Closed	-1.0%
43	GPT-5.2-Codex	OpenAI · Closed	-2.5%
44	Claude Sonnet 4.6	Anthropic · Closed	-2.9%
45	Gemini 3 Flash	Google · Closed	-3.6%
46	Claude Opus 4.5	Anthropic · Closed	-3.9%
47	Command A+	Cohere · Open weight	-4.0%
48	GPT-5.1-Codex-Max	OpenAI · Closed	-6.0%
49	GPT-5.1-Codex	OpenAI · Closed	-6.0%
50	Kimi K2.5	Moonshot AI · Open weight	-8.1%
51	Kimi K2.5 (Reasoning)	Moonshot AI · Closed	-8.1%
52	GPT-5 (high)	OpenAI · Closed	-8.1%
53	Claude 4 Sonnet	Anthropic · Closed	-9.2%
54	DeepSeek V4 Pro (High)	DeepSeek · Open weight	-9.7%
55	DeepSeek V4 Pro (Max)	DeepSeek · Open weight	-10.0%
56	GPT-5 (medium)	OpenAI · Closed	-10.1%
57	o1	OpenAI · Closed	-10.5%
58	GPT-4o	OpenAI · Closed	-10.7%
59	Kimi K2.7 Code	Moonshot AI · Open weight	-10.7%
60	GPT-5.6 Luna	OpenAI · Closed	-11.2%
61	Gemini 2.5 Pro	Google · Closed	-14.3%
62	GLM-5-Turbo	Z.AI · Closed	-15.1%
63	o3	OpenAI · Closed	-15.3%
64	Gemini 3.1 Flash-Lite	Google · Closed	-15.5%
65	GPT-5 mini	OpenAI · Closed	-17.2%
66	Llama 3.1 405B	Meta · Open weight	-17.3%
67	MiMo-V2-Omni	Xiaomi · Closed	-17.4%
68	Hy3 Preview	Tencent · Open weight	-18.5%
69	Hy3	Tencent · Open weight	-18.5%
70	GPT-5.4 mini	OpenAI · Closed	-18.7%
71	GLM-5V-Turbo	Z.AI · Closed	-19.0%
72	Qwen3.6-27B	Alibaba · Open weight	-19.8%
73	Gemma 4 E4B	Google · Open weight	-20.0%
74	Qwen3.6-35B-A3B	Alibaba · Open weight	-21.4%
75	DeepSeek V4 Flash (High)	DeepSeek · Open weight	-22.3%
76	DeepSeek V4 Flash (Max)	DeepSeek · Open weight	-22.9%
77	Gemma 4 E2B	Google · Open weight	-24.0%
78	DeepSeek-R1	DeepSeek · Open weight	-27.1%
79	Kimi K2	Moonshot AI · Closed	-27.5%
80	GPT-5 nano	OpenAI · Closed	-27.7%
81	DeepSeek V3.1 (Reasoning)	DeepSeek · Open weight	-28.4%
82	Grok 4 Fast (Reasoning)	xAI · Closed	-28.4%
83	Grok 4.1 Fast (Reasoning)	xAI · Closed	-28.7%
84	GPT-5.4 nano	OpenAI · Closed	-29.5%
85	Qwen3.5 397B	Alibaba · Open weight	-29.8%
86	Qwen3.5 397B (Reasoning)	Alibaba · Open weight	-29.8%
87	Mistral Small 4	Mistral · Open weight	-29.9%
88	Mistral Small 4 (Reasoning)	Mistral · Open weight	-29.9%
89	Mistral Medium 3	Mistral · Closed	-31.5%
90	GLM-4.6	Z.AI · Open weight	-31.6%
91	LFM2.5-8B-A1B	LiquidAI · Open weight	-33.3%
92	Mistral Large 2	Mistral · Closed	-34.0%
93	GLM-4.7	Z.AI · Open weight	-34.6%
94	Grok Code Fast 1	xAI · Closed	-36.0%
95	GPT-4.1	OpenAI · Closed	-36.2%
96	Mistral Medium 3.5 128B	Mistral · Open weight	-36.3%
97	Step 3.7 Flash	StepFun · Open weight	-37.5%
98	Mistral Large 3	Mistral · Closed	-39.4%
99	Qwen3.5-122B-A10B	Alibaba · Open weight	-39.6%
100	MiniMax M2.5	MiniMax · Closed	-39.7%
101	DeepSeek V3.1	DeepSeek · Open weight	-41.1%
102	DeepSeek V3	DeepSeek · Open weight	-41.3%
103	Llama 4 Maverick	Meta · Open weight	-41.8%
104	Qwen3.5-27B	Alibaba · Open weight	-42.0%
105	Gemini 2.5 Flash	Google · Closed	-42.0%
106	Nemotron 3 Super 120B A12B	NVIDIA · Open weight	-42.1%
107	Qwen3 Max	Alibaba · Closed	-43.1%
108	Step 3.5 Flash	StepFun · Open weight	-43.7%
109	Trinity-Large-Preview	Arcee AI · Open weight	-44.2%
110	Trinity-Large-Thinking	Arcee AI · Open weight	-44.2%
111	Gemma 4 31B	Google · Open weight	-45.4%
112	Nemotron Ultra 253B	NVIDIA · Open weight	-45.5%
113	Qwen3.5-35B-A3B	Alibaba · Open weight	-46.4%
114	DeepSeek V3.2	DeepSeek · Open weight	-46.7%
115	MiniMax M1 80k	MiniMax · Closed	-47.4%
116	Claude 3 Haiku	Anthropic · Closed	-47.6%
117	Nova Pro	Amazon · Closed	-47.6%
118	Gemma 4 26B A4B	Google · Open weight	-48.1%
119	MiMo-V2-Flash	Xiaomi · Open weight	-48.5%
120	GPT-OSS 120B	OpenAI · Open weight	-50.0%
121	GPT-4.1 mini	OpenAI · Closed	-50.1%
122	Grok 4.1 Fast	xAI · Closed	-50.9%
123	Nemotron 3 Nano 30B	NVIDIA · Open weight	-51.6%
124	Gemma 4 12B	Google · Open weight	-51.9%
125	Mercury 2	Inception · Closed	-52.3%
126	Llama 4 Scout	Meta · Open weight	-52.4%
127	Nemotron 3 Nano Omni 30B A3B	NVIDIA · Open weight	-56.0%
128	GPT-4.1 nano	OpenAI · Closed	-56.4%
129	Phi-4	Microsoft · Open weight	-56.7%
130	K-Exaone	LG AI Research · Closed	-57.9%
131	LFM2-24B-A2B	LiquidAI · Closed	-59.1%
132	GLM-4.7-Flash	Z.AI · Open weight	-59.3%
133	Sarvam 105B	Sarvam · Open weight	-59.5%
134	Solar Pro 2	Upstage · Closed	-61.7%
135	Exaone 4.0 32B	LG AI Research · Open weight	-62.3%
136	GLM-4.5-Air	Z.AI · Closed	-62.5%
137	GPT-OSS 20B	OpenAI · Open weight	-63.9%
138	Ministral 3 3B (Reasoning)	Mistral · Open weight	-64.1%
139	Ministral 3 3B	Mistral · Open weight	-64.1%
140	Ling 2.6 Flash	InclusionAI · Open weight	-65.7%
141	Gemma 3 27B	Google · Open weight	-65.9%
142	Ministral 3 14B (Reasoning)	Mistral · Open weight	-66.8%
143	Ministral 3 14B	Mistral · Open weight	-66.8%
144	Ministral 3 8B (Reasoning)	Mistral · Open weight	-67.8%
145	Ministral 3 8B	Mistral · Open weight	-67.8%
146	Sarvam 30B	Sarvam · Open weight	-72.0%
147	Granite-4.0-350M	IBM · Open weight	-72.1%
148	Granite-4.0-H-1B	IBM · Open weight	-73.6%
149	LFM2.5-1.2B-Instruct	LiquidAI · Closed	-73.8%
150	Granite-4.0-1B	IBM · Open weight	-81.8%
151	Exaone 4.0 1.2B	LG AI Research · Open weight	-82.6%
152	LFM2.5-VL-1.6B-Extract	LiquidAI · Open weight	-83.9%
153	LFM2.5-1.2B-Thinking	LiquidAI · Closed	-83.9%
154	Granite-4.0-H-350M	IBM · Open weight	-87.2%