Back to blog

Comparativa de costes de API de IA: modelos locales vs proveedores de API

Un desglose detallado de los costes reales de ejecutar agentes de IA: comparando OpenAI, Anthropic, DeepSeek, OpenRouter y modelos locales mediante Ollama. Encuentra el equilibrio adecuado para tu uso.

K-Claw Team·30 de octubre de 2025·3 min read

Los dos componentes del coste de un agente de IA personal

Ejecutar OpenClaw en un VPS personal tiene dos componentes de coste bien diferenciados: el servidor en sí (cuota mensual fija) y la inferencia del modelo de IA (variable, según el uso). La mayoría de personas se centran en el coste del servidor, pero el gasto en API de IA es el que realmente escala con el uso.

Entender ambos componentes —y las concesiones entre proveedores de API y modelos locales— te permite construir un agente que se adapte a tu presupuesto sin sacrificar capacidad.

Coste del servidor: el suelo fijo

OpenClaw en sí es ligero. Un Hetzner CX22 a EUR 4,35/mes gestiona el uso personal sin problemas. Para inferencia de modelos locales mediante Ollama, necesitas más:

EscenarioServidorCoste mensual
Solo agente (modelos API)2 vCPU / 4 GB RAMEUR 4–6/mes
Agente + modelo local pequeño4 vCPU / 8 GB RAMEUR 12–20/mes
Agente + modelo local potente8 vCPU / 32 GB RAMEUR 40–80/mes

Ejecutar modelos locales requiere considerablemente más RAM que ejecutar únicamente el framework del agente. Un modelo de 7B parámetros con cuantización de 4 bits necesita aproximadamente 5 GB de RAM solo para cargarse.

Precios de proveedores de API (a finales de 2025)

Todos los precios de API son por millón de tokens. Un "token" equivale aproximadamente a 0,75 palabras. Un intercambio de mensajes típico consume entre 200 y 800 tokens combinados de entrada y salida.

ModeloEntrada (por 1M tokens)Salida (por 1M tokens)Nivel de calidad
GPT-4oUSD 5,00USD 15,00Insignia
GPT-4o miniUSD 0,15USD 0,60Rápido/económico
Claude 3.5 SonnetUSD 3,00USD 15,00Insignia
Claude 3.5 HaikuUSD 0,80USD 4,00Rápido/económico
DeepSeek V3USD 0,27USD 1,10Potente / muy económico
Gemini 1.5 FlashUSD 0,075USD 0,30Rápido/económico

Para darte contexto: si envías 100 mensajes al día con una media de 500 tokens cada uno, consumes aproximadamente 1,5 millones de tokens al mes (contando la acumulación de la ventana de contexto). Con los precios de DeepSeek V3, eso supone menos de USD 2/mes.

Usar OpenRouter para optimizar costes

OpenRouter agrega docenas de modelos bajo una única clave de API y cuenta de facturación. Esto significa que puedes:

  • Cambiar de modelos sin reconfigurar tu agente
  • Usar el modelo más económico para tareas sencillas y enrutar las solicitudes complejas a modelos más potentes
  • Acceder a modelos de Anthropic, OpenAI, Meta y otros a través de una sola factura

OpenClaw es compatible con OpenRouter de forma nativa. Configura OPENROUTER_API_KEY en tu configuración y especifica los modelos mediante su identificador de OpenRouter (deepseek/deepseek-chat, anthropic/claude-3-5-sonnet, etc.).

Modelos locales mediante Ollama: cuándo tiene sentido

Ollama te permite ejecutar modelos de código abierto (Llama, Mistral, Gemma, etc.) directamente en tu servidor sin llamadas a API externas. Esto significa:

  • Coste por token cero — solo pagas por el hardware del servidor
  • Privacidad total — ningún dato sale de tu VPS
  • Sin límites de velocidad — la velocidad de inferencia solo la limita tu hardware

La contrapartida: Los modelos locales requieren hardware potente, y los mejores modelos de código abierto actualmente siguen por detrás de los modelos frontera (GPT-4o, Claude 3.5) en tareas de razonamiento complejo.

Cuándo los modelos locales son la opción correcta

  • Procesas datos altamente sensibles y quieres exposición cero a APIs externas
  • Tienes un volumen alto de mensajes en el que los costes de API se acumulan de forma significativa
  • Tus casos de uso son sencillos (resumen, preguntas y respuestas simples) y un modelo de 7B es suficiente
  • Quieres experimentar con modelos ajustados a tus necesidades específicas

Configuración recomendada según nivel de uso

PerfilConfiguración recomendadaCoste mensual estimado
Usuario ocasional (30 msg/día)Hetzner CX22 + GPT-4o miniEUR 5–7/mes
Usuario habitual (100 msg/día)Hetzner CX22 + DeepSeek V3 vía OpenRouterEUR 6–10/mes
Usuario avanzado (300+ msg/día)Hetzner CPX31 + combinación de DeepSeek + Claude HaikuEUR 15–25/mes
Usuario con prioridad en privacidadHetzner CPX41 + Ollama + Llama 3.1 8BEUR 25–40/mes

El instalador de k-claw te permite configurar tu modelo preferido durante la instalación y cambiarlo en cualquier momento desde el panel de control, sin necesidad de reinstalar.

Stop paying per-seat. Pay once, own your agent.

OpenClaw runs on a EUR 4/month VPS. Add your own API keys. k-claw gets it installed and configured in 15 minutes.

See pricing