omniscience Accuracy

154 models evaluated

#	Model	Provider	Type	Score
1	Claude Fable 5	Anthropic	Closed	claude-fable-5
2	GPT-5.6 Sol	OpenAI	Closed	gpt-5-6-sol
3	GPT-5.5	OpenAI	Closed	gpt-5-5
4	Gemini 3 Pro	Google · Closed	55.9%
5	Gemini 3.1 Pro	Google · Closed	55.3%
6	Claude Opus 5	Anthropic · Closed	54.2%
7	Grok 4.5	xAI · Closed	52.1%
8	Gemini 3.5 Flash	Google · Closed	51.9%
9	GPT-5.3 Codex	OpenAI · Closed	51.8%
10	GPT-5.3-Codex-Spark	OpenAI · Closed	51.8%
11	Gemini 3.6 Flash	Google · Closed	50.2%
12	GPT-5.4	OpenAI · Closed	50.0%
13	Claude Opus 4.8	Anthropic · Closed	46.6%
14	Claude Opus 4.6 (Adaptive)	Anthropic · Closed	46.4%
15	Kimi K3	Moonshot AI · Closed	46.0%
16	GPT-5.6 Terra	OpenAI · Closed	45.9%
17	Claude Opus 4.7 (Adaptive)	Anthropic · Closed	45.8%
18	Claude Opus 4.5 Thinking	Anthropic · Closed	45.7%
19	Gemini 3 Flash	Google · Closed	45.5%
20	Claude Opus 4.6	Anthropic · Closed	45.2%
21	Muse Spark	Meta · Closed	44.6%
22	GPT-5.2	OpenAI · Closed	43.8%
23	Claude Opus 4.7	Anthropic · Closed	43.5%
24	DeepSeek V4 Pro (Max)	DeepSeek · Open weight	43.3%
25	DeepSeek V4 Pro (High)	DeepSeek · Open weight	41.8%
26	GPT-5.6 Luna	OpenAI · Closed	41.5%
27	Grok 4	xAI · Closed	41.4%
28	Claude Opus 4.5	Anthropic · Closed	40.7%
29	GPT-5 (high)	OpenAI · Closed	40.7%
30	GPT-5.2-Codex	OpenAI · Closed	40.7%
31	Muse Spark 1.1	Meta · Closed	40.6%
32	Inkling	Thinking Machines Lab · Open weight	40.0%
33	GPT-5.1-Codex-Max	OpenAI · Closed	39.2%
34	GPT-5.1-Codex	OpenAI · Closed	39.2%
35	Gemini 2.5 Pro	Google · Closed	39.0%
36	GPT-5 (medium)	OpenAI · Closed	38.9%
37	Kimi K2.7 Code	Moonshot AI · Open weight	38.6%
38	o3	OpenAI · Closed	38.4%
39	Claude Sonnet 5	Anthropic · Closed	38.3%
40	Claude Sonnet 4.6	Anthropic · Closed	38.0%
41	Qwen 3.6 Max (preview)	Alibaba · Closed	37.7%
42	GPT-5.1	OpenAI · Closed	37.6%
43	GPT-5.4 mini	OpenAI · Closed	37.5%
44	DeepSeek V4 Flash (Max)	DeepSeek · Open weight	37.2%
45	Gemini 3.1 Flash-Lite	Google · Closed	36.4%
46	DeepSeek V4 Flash (High)	DeepSeek · Open weight	35.5%
47	o1	OpenAI · Closed	34.7%
48	Grok 4.3	xAI · Closed	34.6%
49	Kimi K2.5	Moonshot AI · Open weight	34.3%
50	Kimi K2.5 (Reasoning)	Moonshot AI · Closed	34.3%
51	Kimi K2.6	Moonshot AI · Open weight	32.8%
52	Hy3 Preview	Tencent · Open weight	31.5%
53	Hy3	Tencent · Open weight	31.5%
54	Qwen3.5 397B	Alibaba · Open weight	31.4%
55	Qwen3.5 397B (Reasoning)	Alibaba · Open weight	31.4%
56	DeepSeek-R1	DeepSeek · Open weight	31.0%
57	Gemini 3.5 Flash-Lite	Google · Closed	30.3%
58	Qwen3.7 Max	Alibaba · Closed	30.1%
59	GLM-4.7	Z.AI · Open weight	29.3%
60	GLM-5V-Turbo	Z.AI · Closed	29.1%
61	GLM-5-Turbo	Z.AI · Closed	29.0%
62	DeepSeek V3.1 (Reasoning)	DeepSeek · Open weight	28.8%
63	GLM-5	Z.AI · Open weight	26.9%
64	Kimi K2	Moonshot AI · Closed	26.8%
65	MiMo-V2-Pro	Xiaomi · Closed	26.8%
66	Gemini 2.5 Flash	Google · Closed	26.5%
67	Qwen3.6 Plus	Alibaba · Closed	26.2%
68	MiniMax M2.5	MiniMax · Closed	26.2%
69	MiniMax M2.7	MiniMax · Open weight	26.1%
70	GPT-5.4 nano	OpenAI · Closed	25.4%
71	Step 3.7 Flash	StepFun · Open weight	25.4%
72	DeepSeek V3	DeepSeek · Open weight	25.4%
73	Grok 4.1 Fast (Reasoning)	xAI · Closed	25.3%
74	GLM-5.2	Z.AI · Open weight	25.1%
75	Mistral Medium 3.5 128B	Mistral · Open weight	25.1%
76	Step 3.5 Flash	StepFun · Open weight	25.0%
77	Qwen3.5-122B-A10B	Alibaba · Open weight	24.7%
78	Qwen3 Max	Alibaba · Closed	24.4%
79	Llama 4 Maverick	Meta · Open weight	24.3%
80	GLM-5.1	Z.AI · Open weight	24.2%
81	DeepSeek V3.2	DeepSeek · Open weight	24.2%
82	GPT-4.1	OpenAI · Closed	24.2%
83	Mistral Large 3	Mistral · Closed	24.1%
84	GPT-5 mini	OpenAI · Closed	24.0%
85	Nemotron 3 Super 120B A12B	NVIDIA · Open weight	24.0%
86	Grok Code Fast 1	xAI · Closed	23.8%
87	DeepSeek V3.1	DeepSeek · Open weight	23.1%
88	Trinity-Large-Preview	Arcee AI · Open weight	22.8%
89	Trinity-Large-Thinking	Arcee AI · Open weight	22.8%
90	MiMo-V2.5-Pro	Xiaomi · Closed	22.6%
91	Grok 4 Fast (Reasoning)	xAI · Closed	22.6%
92	Claude 4 Sonnet	Anthropic · Closed	22.4%
93	Llama 3.1 405B	Meta · Open weight	22.3%
94	Qwen3.7 Plus	Alibaba · Closed	22.2%
95	Mistral Small 4	Mistral · Open weight	22.1%
96	Mistral Small 4 (Reasoning)	Mistral · Open weight	22.1%
97	Nemotron 3 Ultra	NVIDIA · Open weight	21.6%
98	GPT-OSS 120B	OpenAI · Open weight	21.5%
99	MiniMax M1 80k	MiniMax · Closed	21.1%
100	Qwen3.5-27B	Alibaba · Open weight	21.0%
101	GLM-4.6	Z.AI · Open weight	20.8%
102	Qwen3.5-35B-A3B	Alibaba · Open weight	20.5%
103	Mercury 2	Inception · Closed	20.5%
104	Mistral Large 2	Mistral · Closed	20.1%
105	Gemma 4 31B	Google · Open weight	19.9%
106	Nemotron Ultra 253B	NVIDIA · Open weight	19.9%
107	GPT-4o	OpenAI · Closed	19.7%
108	Qwen3.6-27B	Alibaba · Open weight	19.2%
109	Qwen3.6-35B-A3B	Alibaba · Open weight	18.9%
110	MiMo-V2-Omni	Xiaomi · Closed	18.7%
111	Mistral Medium 3	Mistral · Closed	18.3%
112	GPT-5 nano	OpenAI · Closed	18.3%
113	Gemma 4 26B A4B	Google · Open weight	18.2%
114	Sarvam 105B	Sarvam · Open weight	17.6%
115	GPT-4.1 mini	OpenAI · Closed	17.5%
116	Claude 3 Haiku	Anthropic · Closed	17.2%
117	Nemotron 3 Nano 30B	NVIDIA · Open weight	17.1%
118	Grok 4.1 Fast	xAI · Closed	17.0%
119	Nova Pro	Amazon · Closed	17.0%
120	K-Exaone	LG AI Research · Closed	16.5%
121	Gemma 4 12B	Google · Open weight	16.0%
122	GLM-4.7-Flash	Z.AI · Open weight	15.9%
123	Solar Pro 2	Upstage · Closed	15.6%
124	GLM-4.5-Air	Z.AI · Closed	15.5%
125	GPT-OSS 20B	OpenAI · Open weight	15.5%
126	Ling 2.6 Flash	InclusionAI · Open weight	15.4%
127	MiMo-V2-Flash	Xiaomi · Open weight	15.2%
128	MiniMax M3	MiniMax · Open weight	15.0%
129	Nemotron 3 Nano Omni 30B A3B	NVIDIA · Open weight	14.8%
130	Llama 4 Scout	Meta · Open weight	14.6%
131	GPT-4.1 nano	OpenAI · Closed	13.3%
132	Phi-4	Microsoft · Open weight	13.2%
133	Sarvam 30B	Sarvam · Open weight	12.7%
134	Gemma 3 27B	Google · Open weight	12.5%
135	Ministral 3 14B (Reasoning)	Mistral · Open weight	12.3%
136	Ministral 3 14B	Mistral · Open weight	12.3%
137	Ministral 3 8B (Reasoning)	Mistral · Open weight	11.2%
138	Ministral 3 8B	Mistral · Open weight	11.2%
139	Exaone 4.0 32B	LG AI Research · Open weight	10.4%
140	LFM2.5-8B-A1B	LiquidAI · Open weight	9.4%
141	Command A+	Cohere · Open weight	8.9%
142	Gemma 4 E4B	Google · Open weight	8.6%
143	Ministral 3 3B (Reasoning)	Mistral · Open weight	7.6%
144	Ministral 3 3B	Mistral · Open weight	7.6%
145	Gemma 4 E2B	Google · Open weight	6.7%
146	LFM2.5-1.2B-Thinking	LiquidAI · Closed	6.6%
147	LFM2-24B-A2B	LiquidAI · Closed	6.4%
148	Granite-4.0-1B	IBM · Open weight	6.1%
149	LFM2.5-1.2B-Instruct	LiquidAI · Closed	6.0%
150	Granite-4.0-H-1B	IBM · Open weight	5.3%
151	LFM2.5-VL-1.6B-Extract	LiquidAI · Open weight	5.2%
152	Exaone 4.0 1.2B	LG AI Research · Open weight	4.7%
153	Granite-4.0-H-350M	IBM · Open weight	3.7%
154	Granite-4.0-350M	IBM · Open weight	3.2%