花 · 桜 · 春
proto.type · technology

Infraestructura seria.
Costos transparentes.

Traiga sus propias claves API - o ejecute completamente en modelos locales - o apunte a un modelo afinado en Hugging Face. proto.type detecta lo que tiene y enruta inteligentemente. Cada token gastado por cada agente aparece en su informe matutino. Cualquier configuración funciona.

el problema
Está usando Opus
para formatear un archivo JSON.
Todo desarrollador lo hace. El modelo frontera está ahí, es fácil, y funciona. Pero está pagando tarifas de Opus por trabajo que un modelo más rápido y barato maneja igual de bien. A través de un proyecto completo - cientos de llamadas, docenas de tareas - ese hábito es costoso.
el enfoque de proto.type
Razonamiento arquitectónico Hotaru Opus 4.6
Revisión adversarial Seori + Kael GPT-5.4 / o3
Generación de código Iseul + Riku GPT-5.4 / Kimi K2
Cobertura de pruebas Brynja Gemini 3 Flash
Todo usted, probablemente Opus 4.6 en todo
Cada agente recibe el modelo que su rol realmente requiere. No más. No menos. El informe matutino le muestra exactamente cuánto ahorró.
model routing
Asignación inteligente de modelos
proto.type detecta sus proveedores configurados y asigna automáticamente cada agente al mejor modelo disponible para su rol. Cualquier proveedor, cualquier configuración. Se adapta.
providers
Cada proveedor. Enrutado inteligentemente.
Anthropic, OpenAI, Google, xAI, Kimi, DeepSeek, Qwen, MiniMax, Hugging Face, OpenRouter, modelos locales. proto.type asigna cada agente al mejor modelo disponible para su rol - automáticamente.
monitoring
Vistas de transmisión, pensamiento y MCP
Observe agentes escribir en tiempo real. Vea cadenas de razonamiento formarse. Y para proyectos complejos - observe agentes usar el servidor MCP personalizado que construyeron para ver dentro del software que están construyendo.
token intelligence
Jerarquización y caché de contexto
Cada agente recibe solo el contexto que su rol requiere. El Objeto de Misión se almacena en caché al iniciar la ejecución. El caché de prompts reduce el costo de Hotaru hasta un 80% en ejecuciones largas.
transparency
Cada token contabilizado
Cada llamada registra tokens de entrada, tokens de salida, tokens en caché y costo estimado. Desglose completo de costos por agente en cada informe matutino. Sin sorpresas.
skill library
Impulsado por gstack
Los agentes extraen de gstack - una biblioteca curada de mejores prácticas de ingeniería. Las habilidades se citan en debates con el mismo peso que el Objeto de Misión.
local & open-weight
Aislado, local y Hugging Face
Ollama, LM Studio, cualquier endpoint compatible con OpenAI, y todo el ecosistema de modelos Hugging Face incluyendo endpoints afinados privados. Disponible en cada nivel - si tiene el hardware, construya su cosa.
gstack fue instrumental en concebir esta visión. La idea de que el conocimiento de ingeniería podría codificarse como una biblioteca de habilidades - algo que los agentes citan como ley - vino directamente de ver lo que Garry construyó.
Garry Tan
Presidente y CEO, Y Combinator · creador de gstack
github · gstack ↗
← Volver a la página principal
creado por asha.software · software intencional · construido con amor y respeto por la privacidad del usuario
花 · 桜 · 春
idioma