Modelos disponíveis
Catálogo curado Tokia. Lista atualizada em tempo real — também acessível via API pública em GET /models sem auth.
POST /v1/chat/completionsPOST /v1/embeddingsPOST /v1/images/generationsPOST /v1/audio/transcriptionsComo chamar
No request POST /v1/chat/completions (LLM) ou POST /v1/images/generations (imagem), passe o upstream_model_id (não o id Tokia).
LLMs (texto)
| Tokia ID | upstream_model_id (use no request) | Markup | Provedor |
|---|---|---|---|
test-free | test-free | 1.0x | openrouter |
claude-sonnet-46 | claude-sonnet-46 | 1.5x | openrouter |
gpt-4o-mini | gpt-4o-mini | 2.0x | openrouter |
deepseek-v3 | deepseek-v3 | 3.0x | openrouter |
gemini-flash | gemini-flash | 3.0x | openrouter |
llama-3-3-70b | llama-3-3-70b | 3.0x | openrouter |
test-free: Modelo gratuito pra testes — usa OpenRouter free tier (rate limit ~20 req/min compartilhado). Sem cobrança BRL.
claude-sonnet-46: Claude Sonnet 4.6 — melhor LLM premium custo-benefício 2026.
gpt-4o-mini: GPT-4o mini — equivalente acessível ao GPT-4o.
deepseek-v3: LLM barato e bom pra tarefas gerais. Alternativa econômica.
gemini-flash: Gemini Flash do Google. Rápido + barato pra tarefas curtas.
llama-3-3-70b: Llama 3.3 70B open-source. Boa pra fine-tune custom futuro.
Imagem
| Tokia ID | upstream_model_id (use no request) | Markup | Provedor |
|---|---|---|---|
sdxl | sdxl | 2.0x | fal |
flux-schnell | flux-schnell | 2.5x | fal |
sdxl: SDXL — alta qualidade pra arte/marketing visual.
flux-schnell: Geração rápida de imagem. ~5s por imagem, qualidade boa.
Vídeo
| Tokia ID | upstream_model_id (use no request) | Markup | Provedor |
|---|---|---|---|
kling | kling | 1.5x | fal |
kling: Kling — geração de vídeo curto a partir de texto/imagem.
Adicionando novos modelos
Catálogo é curado pelo Tokia (DR-009 — só listamos modelos validados). Pra sugerir um modelo novo, envie email pra contato@usetokia.com com link da documentação do provider e caso de uso.