erqa

7 models evaluated

#	Model	Provider	Type	Score
1	Qwen3.7 Plus	Alibaba	Closed	qwen3-7-plus
2	Gemini 3.1 Pro	Google	Closed	gemini-3-1-pro
3	GPT-5.4	OpenAI	Closed	gpt-5-4
4	Muse Spark	Meta · Closed	64.7%
5	Qwen3.6-27B	Alibaba · Open weight	62.5%
6	Grok 4.20	xAI · Closed	54.1%
7	Claude Opus 4.6	Anthropic · Closed	51.6%