lcr

156 models evaluated

#	Model	Provider	Type	Score
1	GPT-5.2-Codex	OpenAI	Closed	gpt-5-2-codex
2	GPT-5 (high)	OpenAI	Closed	gpt-5-high
3	GPT-5.1	OpenAI	Closed	gpt-5-1
4	Kimi K3	Moonshot AI · Closed	74.7%
5	GPT-5.5	OpenAI · Closed	74.3%
6	GPT-5.6 Terra	OpenAI · Closed	74.0%
7	GPT-5.6 Luna	OpenAI · Closed	74.0%
8	GPT-5.4	OpenAI · Closed	74.0%
9	MiniMax M3	MiniMax · Open weight	74.0%
10	GPT-5.3 Codex	OpenAI · Closed	74.0%
11	Claude Opus 4.5 Thinking	Anthropic · Closed	74.0%
12	GPT-5.3-Codex-Spark	OpenAI · Closed	74.0%
13	GPT-5.6 Sol	OpenAI · Closed	73.7%
14	MiMo-V2.5-Pro	Xiaomi · Closed	73.3%
15	GPT-5 (medium)	OpenAI · Closed	72.8%
16	Gemini 3.1 Pro	Google · Closed	72.7%
17	GPT-5.2	OpenAI · Closed	72.7%
18	GLM-5.2	Z.AI · Open weight	71.3%
19	Claude Sonnet 5	Anthropic · Closed	70.7%
20	Gemini 3 Pro	Google · Closed	70.7%
21	Claude Opus 4.6 (Adaptive)	Anthropic · Closed	70.7%
22	Claude Opus 4.7 (Adaptive)	Anthropic · Closed	70.3%
23	Claude Opus 5	Anthropic · Closed	70.0%
24	Claude Fable 5	Anthropic · Closed	70.0%
25	Kimi K2.6	Moonshot AI · Open weight	69.7%
26	Qwen3.6 Plus	Alibaba · Closed	69.7%
27	Gemini 3.6 Flash	Google · Closed	69.7%
28	Qwen 3.6 Max (preview)	Alibaba · Closed	69.7%
29	Muse Spark	Meta · Closed	69.7%
30	Gemini 3.5 Flash	Google · Closed	69.3%
31	GPT-5.4 mini	OpenAI · Closed	69.3%
32	o3	OpenAI · Closed	69.3%
33	Qwen3.7 Max	Alibaba · Closed	69.0%
34	Qwen3.6-27B	Alibaba · Open weight	68.7%
35	MiniMax M2.7	MiniMax · Open weight	68.7%
36	Grok 4	xAI · Closed	68.0%
37	Grok 4.1 Fast (Reasoning)	xAI · Closed	68.0%
38	GPT-5 mini	OpenAI · Closed	68.0%
39	Claude Opus 4.8	Anthropic · Closed	67.7%
40	Grok 4.5	xAI · Closed	67.7%
41	Qwen3.5-27B	Alibaba · Open weight	67.3%
42	GPT-5.1-Codex-Max	OpenAI · Closed	67.3%
43	GPT-5.1-Codex	OpenAI · Closed	67.3%
44	Nemotron 3 Ultra	NVIDIA · Open weight	67.0%
45	Claude Opus 4.7	Anthropic · Closed	67.0%
46	Qwen3.5-122B-A10B	Alibaba · Open weight	66.7%
47	Hy3 Preview	Tencent · Open weight	66.7%
48	MiMo-V2-Omni	Xiaomi · Closed	66.7%
49	Hy3	Tencent · Open weight	66.7%
50	DeepSeek V4 Pro (Max)	DeepSeek · Open weight	66.3%
51	Claude 4.1 Opus Thinking	Anthropic · Closed	66.3%
52	Kimi K2.7 Code	Moonshot AI · Open weight	66.3%
53	GPT-5.4 nano	OpenAI · Closed	66.0%
54	Gemini 2.5 Pro	Google · Closed	66.0%
55	MiniMax M2.5	MiniMax · Closed	66.0%
56	Qwen3.5 397B	Alibaba · Open weight	65.7%
57	Qwen3.5 397B (Reasoning)	Alibaba · Open weight	65.7%
58	Claude Opus 4.5	Anthropic · Closed	65.3%
59	Kimi K2.5	Moonshot AI · Open weight	65.3%
60	Kimi K2.5 (Reasoning)	Moonshot AI · Closed	65.3%
61	Gemini 3.1 Flash-Lite	Google · Closed	65.3%
62	Qwen3.7 Plus	Alibaba · Closed	65.0%
63	DeepSeek V4 Pro (High)	DeepSeek · Open weight	65.0%
64	Grok 4 Fast (Reasoning)	xAI · Closed	64.7%
65	Grok 4.3	xAI · Closed	64.3%
66	GLM-4.7	Z.AI · Open weight	64.0%
67	Qwen3.6-35B-A3B	Alibaba · Open weight	63.7%
68	Step 3.7 Flash	StepFun · Open weight	63.7%
69	Muse Spark 1.1	Meta · Closed	63.3%
70	GLM-5	Z.AI · Open weight	63.3%
71	Inkling	Thinking Machines Lab · Open weight	63.3%
72	DeepSeek V4 Flash (Max)	DeepSeek · Open weight	63.0%
73	DeepSeek V4 Flash (High)	DeepSeek · Open weight	62.7%
74	Qwen3.5-35B-A3B	Alibaba · Open weight	62.7%
75	GLM-5.1	Z.AI · Open weight	62.3%
76	Gemini 3.5 Flash-Lite	Google · Closed	62.0%
77	Gemma 4 31B	Google · Open weight	62.0%
78	Mistral Medium 3.5 128B	Mistral · Open weight	61.0%
79	GPT-4.1	OpenAI · Closed	61.0%
80	GLM-5V-Turbo	Z.AI · Closed	61.0%
81	GLM-5-Turbo	Z.AI · Closed	60.7%
82	MiMo-V2-Pro	Xiaomi · Closed	60.7%
83	Nemotron 3 Super 120B A12B	NVIDIA · Open weight	60.0%
84	o1	OpenAI · Closed	59.3%
85	Claude Opus 4.6	Anthropic · Closed	58.3%
86	Claude Sonnet 4.6	Anthropic · Closed	57.7%
87	Gemma 4 26B A4B	Google · Open weight	55.7%
88	K-Exaone	LG AI Research · Closed	55.7%
89	Gemma 4 12B	Google · Open weight	55.3%
90	DeepSeek-R1	DeepSeek · Open weight	54.7%
91	Step 3.5 Flash	StepFun · Open weight	54.3%
92	MiniMax M1 80k	MiniMax · Closed	54.3%
93	DeepSeek V3.1 (Reasoning)	DeepSeek · Open weight	53.3%
94	Kimi K2	Moonshot AI · Closed	51.0%
95	GPT-OSS 120B	OpenAI · Open weight	50.7%
96	Grok Code Fast 1	xAI · Closed	48.3%
97	Gemini 3 Flash	Google · Closed	48.0%
98	Qwen3 Max	Alibaba · Closed	46.7%
99	Llama 4 Maverick	Meta · Open weight	46.0%
100	Command A+	Cohere · Open weight	46.0%
101	Gemini 2.5 Flash	Google · Closed	45.9%
102	DeepSeek V3.1	DeepSeek · Open weight	45.0%
103	Mistral Small 4	Mistral · Open weight	44.7%
104	Mistral Small 4 (Reasoning)	Mistral · Open weight	44.7%
105	Claude 4 Sonnet	Anthropic · Closed	44.3%
106	GLM-4.5-Air	Z.AI · Closed	43.7%
107	GPT-4.1 mini	OpenAI · Closed	42.3%
108	GPT-5 nano	OpenAI · Closed	41.7%
109	DeepSeek V3.2	DeepSeek · Open weight	39.0%
110	Mercury 2	Inception · Closed	36.3%
111	Nemotron 3 Nano Omni 30B A3B	NVIDIA · Open weight	35.7%
112	GLM-4.7-Flash	Z.AI · Open weight	35.0%
113	Mistral Large 3	Mistral · Closed	34.7%
114	Nemotron 3 Nano 30B	NVIDIA · Open weight	33.7%
115	Trinity-Large-Preview	Arcee AI · Open weight	33.0%
116	Trinity-Large-Thinking	Arcee AI · Open weight	33.0%
117	MiMo-V2-Flash	Xiaomi · Open weight	31.3%
118	GPT-OSS 20B	OpenAI · Open weight	30.7%
119	Gemma 4 E4B	Google · Open weight	30.7%
120	DeepSeek V3	DeepSeek · Open weight	29.0%
121	Mistral Medium 3	Mistral · Closed	28.0%
122	GLM-4.6	Z.AI · Open weight	26.3%
123	Llama 4 Scout	Meta · Open weight	25.8%
124	Ling 2.6 Flash	InclusionAI · Open weight	25.0%
125	Llama 3.1 405B	Meta · Open weight	24.3%
126	Ministral 3 8B (Reasoning)	Mistral · Open weight	24.0%
127	Ministral 3 8B	Mistral · Open weight	24.0%
128	Grok 4.1 Fast	xAI · Closed	22.0%
129	Ministral 3 14B (Reasoning)	Mistral · Open weight	22.0%
130	Ministral 3 14B	Mistral · Open weight	22.0%
131	Claude 3 Haiku	Anthropic · Closed	21.0%
132	Nova Pro	Amazon · Closed	19.0%
133	GPT-4.1 nano	OpenAI · Closed	17.0%
134	Gemma 4 E2B	Google · Open weight	15.0%
135	Ministral 3 3B (Reasoning)	Mistral · Open weight	11.7%
136	Ministral 3 3B	Mistral · Open weight	11.7%
137	DeepSeek R1 Distill Qwen 32B	DeepSeek · Open weight	9.7%
138	Exaone 4.0 32B	LG AI Research · Open weight	8.0%
139	Nemotron Ultra 253B	NVIDIA · Open weight	7.3%
140	Granite-4.0-H-1B	IBM · Open weight	6.3%
141	Gemma 3 27B	Google · Open weight	5.7%
142	Mistral Large 2	Mistral · Closed	5.3%
143	Granite-4.0-1B	IBM · Open weight	4.0%
144	LFM2.5-8B-A1B	LiquidAI · Open weight	0.0%
145	GPT-4o	OpenAI · Closed	0.0%
146	Phi-4	Microsoft · Open weight	0.0%
147	LFM2.5-VL-1.6B-Extract	LiquidAI · Open weight	0.0%
148	Sarvam 105B	Sarvam · Open weight	0.0%
149	Sarvam 30B	Sarvam · Open weight	0.0%
150	Granite-4.0-350M	IBM · Open weight	0.0%
151	Granite-4.0-H-350M	IBM · Open weight	0.0%
152	Exaone 4.0 1.2B	LG AI Research · Open weight	0.0%
153	Solar Pro 2	Upstage · Closed	0.0%
154	LFM2-24B-A2B	LiquidAI · Closed	0.0%
155	LFM2.5-1.2B-Thinking	LiquidAI · Closed	0.0%
156	LFM2.5-1.2B-Instruct	LiquidAI · Closed	0.0%