arc Agi2

19 models evaluated

#	Model	Provider	Type	Score
1	GPT-5.6 Sol	OpenAI	Closed	gpt-5-6-sol
2	Claude Opus 5	Anthropic	Closed	claude-opus-5
3	GPT-5.5	OpenAI	Closed	gpt-5-5
4	GPT-5.6 Terra	OpenAI · Closed	83.9%
5	GPT-5.4 Pro	OpenAI · Closed	83.3%
6	Gemini 3.1 Pro	Google · Closed	77.1%
7	Claude Opus 4.7 (Adaptive)	Anthropic · Closed	75.8%
8	GPT-5.4	OpenAI · Closed	74.0%
9	Gemini 3.5 Flash	Google · Closed	72.1%
10	Claude Opus 4.8	Anthropic · Closed	72.1%
11	GPT-5.6 Luna	OpenAI · Closed	59.5%
12	GPT-5.2 Pro	OpenAI · Closed	54.2%
13	Grok 4.20	xAI · Closed	53.3%
14	GPT-5.2	OpenAI · Closed	52.9%
15	Grok 4.5	xAI · Closed	52.6%
16	Gemini 3 Pro Deep Think	Google · Closed	45.1%
17	Muse Spark	Meta · Closed	42.5%
18	Gemini 3 Pro	Google · Closed	31.1%
19	Claude Sonnet 4.5	Anthropic · Closed	13.6%