if Bench

15 models evaluated

#	Model	Provider	Type	Score
1	MAI-Thinking-1	Microsoft	Closed	mai-thinking-1
3	Grok 4.3	xAI	Closed	grok-4-3
4	Inkling	Thinking Machines Lab · Open weight	79.8%
5	Qwen3.7 Max	Alibaba · Closed	79.1%
6	Qwen3.7 Plus	Alibaba · Closed	79.1%
7	Gemini 3.5 Flash	Google · Closed	76.3%
8	Qwen3.6 Plus	Alibaba · Closed	75.8%
9	Nemotron 3 Nano Omni 30B A3B	NVIDIA · Open weight	74.2%
10	Hy3 Preview	Tencent · Open weight	63.1%
11	Claude Opus 4.5	Anthropic · Closed	58%
12	Ling 2.6 Flash	InclusionAI · Open weight	57%
13	LFM2.5-8B-A1B	LiquidAI · Open weight	56.5%
14	ZAYA1-8B	Zyphra · Open weight	52.6%
15	MiniCPM5-1B	OpenBMB · Open weight	46.7%
16	LFM2.5-230M	LiquidAI · Open weight	38.4%