Preços e markup decrescente

Tokia cobra markup decrescente por modelo: modelos baratos têm multiplicador maior, modelos caros têm multiplicador menor. A regra garante margem em chamadas pequenas e mantém Tokia competitivo em modelos premium.

INTERATIVO

Calculadora de custo Tokia

Estima custo BRL/mês baseado em tokens consumidos. FX USD/BRL editável. Preços upstream baseados em snapshot 2026-05.

Ex: 100 input tokens × 5.000 requests = 500.000

Ex: 40 output tokens × 5.000 requests = 200.000

Upstream USD/mês
$0.1950
Custo Tokia BRL/mês
R$ 2.03
Por 1.000 tokens
R$ 0.00290

Preços reais usam fx BCB PTAX diário e podem variar ±5%. Markup pode mudar sem aviso (catálogo atualizado em /docs/models).

Fórmula

text
cost_billed_brl = cost_upstream_usd × fx_BCB_PTAX × markup_modelo

onde:
  cost_upstream_usd = custo real cobrado pelo provedor (OpenRouter/Anthropic/etc)
  fx_BCB_PTAX       = cotação USD/BRL venda do dia (atualizada 1x/dia)
  markup_modelo     = multiplicador da tabela abaixo

Tabela de markup atual (9 modelos)

Sprint 198 — tabela carregada do catálogo real da API em tempo real (cache 24h). Última atualização: 25/05/2026.

ModeloCategoriaMarkupRoteamento
deepseek-v3llm3.0xopenrouter
gemini-flashllm3.0xopenrouter
llama-3-3-70bllm3.0xopenrouter
flux-schnellImagem2.5xfal
sdxlImagem2.0xfal
gpt-4o-minillm2.0xopenrouter
claude-sonnet-46llm1.5xopenrouter
klingVídeo1.5xfal
test-freellm1.0xopenrouter

Exemplo prático — gpt-4o-mini

text
Chamada: 17 prompt tokens + 2 completion tokens

Custo upstream OpenRouter:
  prompt:     17 × $0.00015 / 1k = $0.00000255
  completion:  2 × $0.00060 / 1k = $0.00000120
  total upstream                = $0.00000375

Cálculo Tokia (fx_BCB = 4.9274, markup_gpt-4o-mini = 2.0):
  $0.00000375 × 4.9274 × 2.0 = R$ 0.0000370

Arredondado pra Decimal(12,4): R$ 0.0000
Chamadas sub-centésimo (custo < R$ 0.0001) arredondam pra R$ 0.0000 e não debitam saldo. Caveat conhecido do MVP — vai ser corrigido em V2 com Decimal(14,8) ou agregação batch.

Recargas

  • Mínimo: R$ 10 por recarga.
  • Saldo nunca expira.
  • Métodos: PIX (instantâneo) ou cartão (Auto Top-Up — ver /docs/auto-topup).
  • Tarifa Asaas (~3%) é absorvida pelo Tokia — você paga o valor cheio em saldo.

Por que markup decrescente

  • Modelos baratos (3x): custo upstream é tão pequeno (~$0.000001 por chamada) que sem markup alto não cobre Asaas + infra. Com 3x ainda fica imbatível.
  • Modelos caros (1.5x): Claude Sonnet 4.6 já é premium. Markup alto inviabilizaria — 1.5x mantém competitivo vs ir direto na Anthropic (sem tarifa de câmbio + IOF).
  • Imagem/vídeo (1.5-2.5x): Fal.ai tem custos médios. Markup calibrado pra cobrir custos sem inflar geração.