Stack de APIs de IA organizado por presupuesto
| Plan | Presupuesto | APIs Incluidas | Tokens/d铆a estimados |
|---|---|---|---|
| Plan Cero | $0/mes | Groq, Google AI, OpenRouter, HuggingChat, Cerebras, Ollama | ~500K+ |
| Plan Intermedio | $50-200/mes | + Paid tiers + Together AI + Manus Pro | ~2M+ |
| Plan Ilimitado | $500-5000+/mes | + OpenAI Enterprise + Anthropic + GPU cloud | Ilimitado |
Maximizar capacidad con APIs gratuitas
URL: https://console.groq.com/
Modelos: Llama 3.3 70B, Llama 3.1 8B, Mixtral 8x7B, Gemma 2 9B
L铆mites: 14,400 req/d铆a (~6,000 con modelos grandes)
Velocidad: Extremadamente r谩pida (LPU)
Latencia: ~100-300ms
API Key: Gratis
Uso recomendado:
URL: https://aistudio.google.com/
Modelos: Gemini 2.0 Flash, Gemini 1.5 Pro, Gemini 1.5 Flash
L铆mites: 60 req/min, 1500 req/d铆a (Gemini 1.5 Flash)
Contexto: Hasta 1M tokens (Gemini 1.5 Pro)
API Key: Gratis con cuenta Google
Uso recomendado:
URL: https://openrouter.ai/
Modelos gratuitos: Llama 3.1 8B, Mistral 7B, varios open source
L铆mites: ~50 req/d铆a en tier gratuito
Ventaja: Acceso unificado a m煤ltiples proveedores
Uso recomendado:
URL: https://huggingface.co/chat/
Modelos: Llama 3.3 70B, Qwen 2.5 72B, DeepSeek, Command R+
L铆mites: Sin l铆mite claro (uso razonable)
Interfaz: Web (no API directa, pero se puede automatizar)
Uso recomendado:
URL: https://inference.cerebras.ai/
Modelos: Llama 3.3 70B, Llama 3.1 8B
L铆mites: Generoso en tier gratuito
Velocidad: Muy r谩pida (chips especializados)
Uso recomendado:
URL: https://chat.mistral.ai/
Modelos: Mistral Large, Codestral
L铆mites: Uso razonable gratuito
Uso recomendado:
# Modelos recomendados seg煤n specs
ollama pull llama3.2:3b # Ligero, respuestas r谩pidas
ollama pull llama3.1:8b # Balance calidad/velocidad
ollama pull qwen2.5:7b # Excelente razonamiento
ollama pull deepseek-coder:6.7b # Para c贸digo
ollama pull phi3:medium # Microsoft, eficiente
# Solo modelos peque帽os
ollama pull llama3.2:1b # M铆nimo viable
ollama pull qwen2.5:1.5b # Muy ligero
ollama pull phi3:mini # Microsoft mini
ollama pull tinyllama # Ultra ligero
1. Ollama local (sin l铆mites, privacidad)
2. Groq (velocidad, l铆mites generosos)
3. Google AI Studio (contexto largo)
4. HuggingChat (backup ilimitado)
5. Cerebras (backup r谩pido)
6. OpenRouter (煤ltimo recurso)
# Pseudoc贸digo para rotar APIs
apis_priority = [
{"name": "ollama", "endpoint": "http://localhost:11434"},
{"name": "groq", "endpoint": "https://api.groq.com/v1"},
{"name": "google", "endpoint": "https://generativelanguage.googleapis.com"},
{"name": "cerebras", "endpoint": "https://inference.cerebras.ai"}
]
def get_completion(prompt):
for api in apis_priority:
try:
return call_api(api, prompt)
except RateLimitError:
continue
return fallback_huggingchat(prompt)
Escalar capacidad manteniendo costos controlados
L铆mites: 100K+ tokens/min
Prioridad: Cola preferente
Modelos: Todos disponibles
URL: https://www.together.ai/
Modelos: Llama, Mixtral, CodeLlama, etc.
Precio: ~$0.20/1M tokens (modelos peque帽os)
Ventaja: Fine-tuning disponible
Claude 3.5 Sonnet: $3/1M input, $15/1M output
Claude 3 Haiku: $0.25/1M input, $1.25/1M output
L铆mite presupuesto: $50-100/mes
GPT-4o-mini: $0.15/1M input, $0.60/1M output
GPT-4o: $2.50/1M input, $10/1M output
L铆mite presupuesto: $30-50/mes
Navegador ag茅ntico profesional
Tareas automatizadas ilimitadas
Integraci贸n con holobionte
API de automatizaci贸n web
Complemento para navegadores ag茅nticos
Total: $150/mes ejemplo
Groq Developer: $30/mes (velocidad)
Together AI: $30/mes (fine-tuning)
Claude pay-as-go: $40/mes (calidad)
OpenAI pay-as-go: $30/mes (GPT-4o-mini)
Manus Pro: $20/mes (automatizaci贸n)
---
Total: $150/mes
Capacidad enterprise sin restricciones
GPT-4 Turbo ilimitado
Acceso prioritario
SLA garantizado
Fine-tuning avanzado
Claude 3.5 Opus
L铆mites extendidos
Soporte dedicado
Gemini Ultra
Procesamiento masivo
Integraci贸n GCP
GPUs bajo demanda: A100, H100
Ollama con modelos 70B+
Fine-tuning local
GPUs para training
Modelos custom
GPUs econ贸micas
Ideal para inferencia batch
Enterprise APIs: $1500/mes
- OpenAI Enterprise: $500
- Anthropic: $500
- Google Vertex: $500
GPU Cloud: $300/mes
- RunPod A100: $200
- Vast.ai backup: $100
Herramientas: $200/mes
- Manus Enterprise: $100
- MultiOn Pro: $50
- BrowserOS Pro: $50
Total: $2000/mes
Plan Cero - Maximizar APIs gratuitas
Plan Intermedio - $100-150/mes
Plan Ilimitado - Escalar seg煤n necesidad
| *Documentado por Comet de Zro @ 1rec3 | 2025* |