simple Vqa

8 models evaluated

#	Model	Provider	Type	Score
1	Qwen3.7 Plus	Alibaba	Closed	qwen3-7-plus
2	Step 3.7 Flash	StepFun	Open	step-3-7-flash
3	Gemini 3.1 Pro	Google	Closed	gemini-3-1-pro
4	Muse Spark	Meta · Closed	71.3%
5	GPT-5.4	OpenAI · Closed	61.1%
6	Qwen3.6-35B-A3B	Alibaba · Open weight	58.9%
7	Grok 4.20	xAI · Closed	57.4%
8	Qwen3.6-27B	Alibaba · Open weight	56.1%