AICodingPricing - LLM Leaderboard

Claude Opus 4.5

ANTHROPIC

partial

SWE-BENCH

76.80%

CONTEXT

Not disclosed

PRICING (1M TOKENS)

IN: $5.00 OUT: $25.00

SOURCE: DOCS

Strong evidence; expensive output price

Claude Sonnet 4.5

ANTHROPIC

partial

SWE-BENCH

71.40%

CONTEXT

Not disclosed

PRICING (1M TOKENS)

IN: $3.00 OUT: $15.00

SOURCE: DOCS

Good candidate; caveat visible

Gemini 3 Flash

GOOGLE

partial

SWE-BENCH

75.80%

CONTEXT

Not disclosed

PRICING (1M TOKENS)

IN: not disclosed OUT: not disclosed

SOURCE: API

Benchmark visible; price/context need exact source

DeepSeek V4 Flash

DEEPSEEK

partial

SWE-BENCH

not publicly benchmarked

CONTEXT

1,000,000

PRICING (1M TOKENS)

IN: $0.14 OUT: $0.28

SOURCE: API

Cheap token price; exact coding benchmark not verified

RECOMMENDED WORKFLOWS

AGENTIC WORKFLOW

I'm building a coding agent

Prioritize public coding evidence, source-backed pricing, retry risk, and caveat visibility.

BATCH PROCESS

Repo-level refactor

Prioritize source-backed context, editing evidence, and caveats about effective long-context reliability.

Our Methodology

verified

INTEGRITY

Raw provider data only.

account_balance

ECONOMICS

Real-world task math.

fact_check

CURATION

Official or public sources only.

visibility

TRANSPARENCY

Open citation sources.

warning

UNKNOWN VALUE POLICY

Models without exact public coding evidence stay partial or not publicly benchmarked until verified.

Compare Coding Models by Workflow Cost

Claude Opus 4.5

Claude Sonnet 4.5

Gemini 3 Flash

DeepSeek V4 Flash

RECOMMENDED WORKFLOWS

I'm building a coding agent

Repo-level refactor

Our Methodology

INTEGRITY

ECONOMICS

CURATION

TRANSPARENCY

UNKNOWN VALUE POLICY