문제
귀하께서 Opus를
JSON 파일 포맷팅에 사용하고 계십니다.
모든 개발자가 그렇게 합니다. 프론티어 모델이 바로 거기에 있고, 쉽고, 작동합니다. 하지만 더 빠르고 저렴한 모델이 똑같이 잘 처리하는 작업에 Opus 요금을 지불하고 있습니다. 전체 프로젝트에서 - 수백 번의 호출, 수십 개의 작업 - 그 습관은 비쌉니다.
proto.type의 접근 방식
| 아키텍처 추론 | Hotaru | → | Opus 4.6 |
| 대립적 검토 | Seori + Kael | → | GPT-5.4 / o3 |
| 코드 생성 | Iseul + Riku | → | GPT-5.4 / Kimi K2 |
| 테스트 커버리지 | Brynja | → | Gemini 3 Flash |
| 모든 것 | 귀하, 아마도 | → | Opus 4.6를 모든 것에 |
모든 에이전트가 역할에 실제로 필요한 모델을 얻습니다. 더 많지도, 더 적지도 않습니다. 아침 보고서가 귀하께서 얼마나 절약하셨는지 정확히 보여줍니다.
model routing
지능형 모델 할당
proto.type은 구성된 제공업체를 감지하고 자동으로 모든 에이전트를 역할에 가장 적합한 사용 가능한 모델에 할당합니다. 모든 제공업체, 모든 설정. 적응합니다.
providers
모든 제공업체. 지능적으로 라우팅.
Anthropic, OpenAI, Google, xAI, Kimi, DeepSeek, Qwen, MiniMax, Hugging Face, OpenRouter, 로컬 모델. proto.type이 자동으로 모든 에이전트를 역할에 가장 적합한 사용 가능한 모델에 할당합니다 - 자동으로.
monitoring
스트림, 사고 및 MCP 뷰
에이전트가 실시간으로 작성하는 것을 지켜보십시오. 추론 체인이 형성되는 것을 보십시오. 복잡한 프로젝트의 경우 - 에이전트가 그들이 구축 중인 소프트웨어 내부를 보기 위해 구축한 커스텀 MCP 서버를 사용하는 것을 지켜보십시오.
token intelligence
컨텍스트 계층화 및 캐싱
각 에이전트는 역할에 필요한 컨텍스트만 받습니다. 미션 객체는 실행 시작 시 캐싱됩니다. 프롬프트 캐싱은 장기 실행에서 Hotaru의 비용을 최대 80% 절감합니다.
transparency
모든 토큰이 기록됨
모든 호출은 입력 토큰, 출력 토큰, 캐시된 토큰, 예상 비용을 기록합니다. 모든 아침 보고서에서 에이전트별 전체 비용 내역. 놀라움 없음.
skill library
gstack 제공
에이전트는 gstack에서 추출합니다 - 엄선된 엔지니어링 모범 사례 라이브러리. 스킬은 미션 객체와 동일한 무게로 토론에서 인용됩니다.
local & open-weight
에어갭, 로컬 및 Hugging Face
Ollama, LM Studio, 모든 OpenAI 호환 엔드포인트, 그리고 전체 Hugging Face 모델 생태계를 포함한 프라이빗 파인튜닝 엔드포인트. 모든 계층에서 사용 가능 - 하드웨어가 있다면, 직접 구성하십시오.