program Bench

8 models evaluated

#	Model	Provider	Type
5	Claude Opus 4.6	Anthropic · Closed	2.5%
7	Claude Sonnet 4.6	Anthropic · Closed	1.0%
8	GPT-5.4	OpenAI · Closed	0.0%
9	Gemini 3.1 Pro	Google · Closed	0.0%
10	Gemini 3 Flash	Google · Closed	0.0%
11	Claude Haiku 4.5	Anthropic · Closed	0.0%
12	GPT-5.4 mini	OpenAI · Closed	0.0%
13	GPT-5 mini	OpenAI · Closed	0.0%