v Star

11 models evaluated

#	Model	Provider	Type	Score
1	Kimi K2.6	Moonshot AI	Open	kimi-2-6
2	Qwen3.6 Plus	Alibaba	Closed	qwen3-6-plus
3	Qwen3.5 397B	Alibaba	Open	qwen3-5-397b
4	Step 3.7 Flash	StepFun · Open weight	95.3%
5	Qwen3.6-27B	Alibaba · Open weight	94.7%
6	Qwen3.5-27B	Alibaba · Open weight	93.7%
7	Qwen3.5-122B-A10B	Alibaba · Open weight	93.2%
8	Qwen3.5-35B-A3B	Alibaba · Open weight	92.7%
9	Gemini 3 Pro	Google · Closed	88.0%
10	GPT-5.2	OpenAI · Closed	75.9%
11	Claude Opus 4.5	Anthropic · Closed	67.0%