hmmt Feb2025

7 models evaluated

#	Model	Provider	Type	Score
1	GLM-5	Z.AI	Open	glm-5
2	Qwen3.6 Plus	Alibaba	Closed	qwen3-6-plus
3	Kimi K2.5	Moonshot AI	Open	kimi-k2-5
4	Qwen3.5 397B	Alibaba · Open weight	94.8%
5	Qwen3.6-27B	Alibaba · Open weight	93.8%
6	Claude Opus 4.5	Anthropic · Closed	92.9%
7	Qwen3.6-35B-A3B	Alibaba · Open weight	90.7%