proto.type — 육십삼 명의 전문가. 하룻밤 만에 실행됩니다.

문제

귀하께서 Opus를
JSON 파일 포맷팅에 사용하고 계십니다.

모든 개발자가 그렇게 합니다. 프론티어 모델이 바로 거기에 있고, 쉽고, 작동합니다. 하지만 더 빠르고 저렴한 모델이 똑같이 잘 처리하는 작업에 Opus 요금을 지불하고 있습니다. 전체 프로젝트에서 - 수백 번의 호출, 수십 개의 작업 - 그 습관은 비쌉니다.

proto.type의 접근 방식

아키텍처 추론	Hotaru	→	Opus 4.6
대립적 검토	Seori + Kael	→	GPT-5.4 / o3
코드 생성	Iseul + Riku	→	GPT-5.4 / Kimi K2
테스트 커버리지	Brynja	→	Gemini 3 Flash
모든 것	귀하, 아마도	→	Opus 4.6를 모든 것에

모든 에이전트가 역할에 실제로 필요한 모델을 얻습니다. 더 많지도, 더 적지도 않습니다. 아침 보고서가 귀하께서 얼마나 절약하셨는지 정확히 보여줍니다.

model routing

지능형 모델 할당

proto.type은 구성된 제공업체를 감지하고 자동으로 모든 에이전트를 역할에 가장 적합한 사용 가능한 모델에 할당합니다. 모든 제공업체, 모든 설정. 적응합니다.

providers

모든 제공업체. 지능적으로 라우팅.

Anthropic, OpenAI, Google, xAI, Kimi, DeepSeek, Qwen, MiniMax, Hugging Face, OpenRouter, 로컬 모델. proto.type이 자동으로 모든 에이전트를 역할에 가장 적합한 사용 가능한 모델에 할당합니다 - 자동으로.

monitoring

스트림, 사고 및 MCP 뷰

에이전트가 실시간으로 작성하는 것을 지켜보십시오. 추론 체인이 형성되는 것을 보십시오. 복잡한 프로젝트의 경우 - 에이전트가 그들이 구축 중인 소프트웨어 내부를 보기 위해 구축한 커스텀 MCP 서버를 사용하는 것을 지켜보십시오.

token intelligence

컨텍스트 계층화 및 캐싱

각 에이전트는 역할에 필요한 컨텍스트만 받습니다. 미션 객체는 실행 시작 시 캐싱됩니다. 프롬프트 캐싱은 장기 실행에서 Hotaru의 비용을 최대 80% 절감합니다.

transparency

모든 토큰이 기록됨

모든 호출은 입력 토큰, 출력 토큰, 캐시된 토큰, 예상 비용을 기록합니다. 모든 아침 보고서에서 에이전트별 전체 비용 내역. 놀라움 없음.

skill library

gstack 제공

에이전트는 gstack에서 추출합니다 - 엄선된 엔지니어링 모범 사례 라이브러리. 스킬은 미션 객체와 동일한 무게로 토론에서 인용됩니다.

local & open-weight

에어갭, 로컬 및 Hugging Face

Ollama, LM Studio, 모든 OpenAI 호환 엔드포인트, 그리고 전체 Hugging Face 모델 생태계를 포함한 프라이빗 파인튜닝 엔드포인트. 모든 계층에서 사용 가능 - 하드웨어가 있다면, 직접 구성하십시오.

“gstack은 이 비전을 구상하는 데 필수적이었습니다. 엔지니어링 지식이 스킬 라이브러리로 인코딩될 수 있다는 것 - 에이전트가 법처럼 인용하는 것 - 이 아이디어는 Garry가 구축한 것을 보고 직접 생겨났습니다.”

Garry Tan

사장 겸 CEO, Y Combinator · gstack 제작자

github · gstack ↗

진지한 인프라.투명한 비용.

진지한 인프라.
투명한 비용.