mmmlu

6 models evaluated

#	Model	Provider	Type	Score
1	Interfaze Beta	Interfaze	Closed	interfaze-beta
2	Qwen3.7 Max	Alibaba	Closed	qwen3-7-max
3	DeepSeek V4 Pro Base	DeepSeek	Open	deepseek-v4-pro-base
4	Qwen3.7 Plus	Alibaba · Closed	89.0%
5	DeepSeek V4 Flash Base	DeepSeek · Open weight	88.8%
6	Gemma 4 12B	Google · Open weight	83.4%