deep Planning

7 models evaluated

#	Model	Provider	Type	Score
1	Qwen3.7 Plus	Alibaba	Closed	qwen3-7-plus
2	Qwen3.6 Plus	Alibaba	Closed	qwen3-6-plus
3	Qwen3.5 397B	Alibaba	Open	qwen3-5-397b
4	Claude Opus 4.5	Anthropic · Closed	26.4%
5	Qwen3.6-35B-A3B	Alibaba · Open weight	25.9%
6	GLM-5	Z.AI · Open weight	14.6%
7	Kimi K2.5	Moonshot AI · Open weight	14.4%