Comparativa de costes de API de IA: modelos locales vs proveedores de API
Un desglose detallado de los costes reales de ejecutar agentes de IA: comparando OpenAI, Anthropic, DeepSeek, OpenRouter y modelos locales mediante Ollama. Encuentra el equilibrio adecuado para tu uso.
Los dos componentes del coste de un agente de IA personal
Ejecutar OpenClaw en un VPS personal tiene dos componentes de coste bien diferenciados: el servidor en sí (cuota mensual fija) y la inferencia del modelo de IA (variable, según el uso). La mayoría de personas se centran en el coste del servidor, pero el gasto en API de IA es el que realmente escala con el uso.
Entender ambos componentes —y las concesiones entre proveedores de API y modelos locales— te permite construir un agente que se adapte a tu presupuesto sin sacrificar capacidad.
Coste del servidor: el suelo fijo
OpenClaw en sí es ligero. Un Hetzner CX22 a EUR 4,35/mes gestiona el uso personal sin problemas. Para inferencia de modelos locales mediante Ollama, necesitas más:
| Escenario | Servidor | Coste mensual |
|---|---|---|
| Solo agente (modelos API) | 2 vCPU / 4 GB RAM | EUR 4–6/mes |
| Agente + modelo local pequeño | 4 vCPU / 8 GB RAM | EUR 12–20/mes |
| Agente + modelo local potente | 8 vCPU / 32 GB RAM | EUR 40–80/mes |
Ejecutar modelos locales requiere considerablemente más RAM que ejecutar únicamente el framework del agente. Un modelo de 7B parámetros con cuantización de 4 bits necesita aproximadamente 5 GB de RAM solo para cargarse.
Precios de proveedores de API (a finales de 2025)
Todos los precios de API son por millón de tokens. Un "token" equivale aproximadamente a 0,75 palabras. Un intercambio de mensajes típico consume entre 200 y 800 tokens combinados de entrada y salida.
| Modelo | Entrada (por 1M tokens) | Salida (por 1M tokens) | Nivel de calidad |
|---|---|---|---|
| GPT-4o | USD 5,00 | USD 15,00 | Insignia |
| GPT-4o mini | USD 0,15 | USD 0,60 | Rápido/económico |
| Claude 3.5 Sonnet | USD 3,00 | USD 15,00 | Insignia |
| Claude 3.5 Haiku | USD 0,80 | USD 4,00 | Rápido/económico |
| DeepSeek V3 | USD 0,27 | USD 1,10 | Potente / muy económico |
| Gemini 1.5 Flash | USD 0,075 | USD 0,30 | Rápido/económico |
Para darte contexto: si envías 100 mensajes al día con una media de 500 tokens cada uno, consumes aproximadamente 1,5 millones de tokens al mes (contando la acumulación de la ventana de contexto). Con los precios de DeepSeek V3, eso supone menos de USD 2/mes.
Usar OpenRouter para optimizar costes
OpenRouter agrega docenas de modelos bajo una única clave de API y cuenta de facturación. Esto significa que puedes:
- Cambiar de modelos sin reconfigurar tu agente
- Usar el modelo más económico para tareas sencillas y enrutar las solicitudes complejas a modelos más potentes
- Acceder a modelos de Anthropic, OpenAI, Meta y otros a través de una sola factura
OpenClaw es compatible con OpenRouter de forma nativa. Configura OPENROUTER_API_KEY en tu configuración y especifica los modelos mediante su identificador de OpenRouter (deepseek/deepseek-chat, anthropic/claude-3-5-sonnet, etc.).
Modelos locales mediante Ollama: cuándo tiene sentido
Ollama te permite ejecutar modelos de código abierto (Llama, Mistral, Gemma, etc.) directamente en tu servidor sin llamadas a API externas. Esto significa:
- Coste por token cero — solo pagas por el hardware del servidor
- Privacidad total — ningún dato sale de tu VPS
- Sin límites de velocidad — la velocidad de inferencia solo la limita tu hardware
La contrapartida: Los modelos locales requieren hardware potente, y los mejores modelos de código abierto actualmente siguen por detrás de los modelos frontera (GPT-4o, Claude 3.5) en tareas de razonamiento complejo.
Cuándo los modelos locales son la opción correcta
- Procesas datos altamente sensibles y quieres exposición cero a APIs externas
- Tienes un volumen alto de mensajes en el que los costes de API se acumulan de forma significativa
- Tus casos de uso son sencillos (resumen, preguntas y respuestas simples) y un modelo de 7B es suficiente
- Quieres experimentar con modelos ajustados a tus necesidades específicas
Configuración recomendada según nivel de uso
| Perfil | Configuración recomendada | Coste mensual estimado |
|---|---|---|
| Usuario ocasional (30 msg/día) | Hetzner CX22 + GPT-4o mini | EUR 5–7/mes |
| Usuario habitual (100 msg/día) | Hetzner CX22 + DeepSeek V3 vía OpenRouter | EUR 6–10/mes |
| Usuario avanzado (300+ msg/día) | Hetzner CPX31 + combinación de DeepSeek + Claude Haiku | EUR 15–25/mes |
| Usuario con prioridad en privacidad | Hetzner CPX41 + Ollama + Llama 3.1 8B | EUR 25–40/mes |
El instalador de k-claw te permite configurar tu modelo preferido durante la instalación y cambiarlo en cualquier momento desde el panel de control, sin necesidad de reinstalar.
Stop paying per-seat. Pay once, own your agent.
OpenClaw runs on a EUR 4/month VPS. Add your own API keys. k-claw gets it installed and configured in 15 minutes.
See pricingRelated articles
¿Qué es un agente de IA personal? Guía completa para 2026
Descubre qué son los agentes de IA personales, cómo funcionan y por qué el autoalojamiento te ofrece privacidad, control y personalización ilimitada frente a los asistentes en la nube.
Cómo instalar OpenClaw en un VPS: guía paso a paso
Una guía completa para instalar OpenClaw en tu propio VPS. Desde la elección del servidor hasta la configuración de los modelos de IA y los canales de mensajería.