兩端分工
Hermai 有兩端:- CLI(hermai-cli,開源)— 在你的機器上執行。貢獻者用它來檢視網站、撰寫描述端點的 schema,然後把 schema 推送到 registry。
- Platform(api.hermai.ai)— schema registry。儲存並提供貢獻者推送的 schema。agent 在執行期查詢以取得 registry 中任何網域的即時、結構化端點資料。不用瀏覽器、零探索成本、200 毫秒內回應。
CLI 做什麼
CLI 提供一組確定性的工具組 — 每個子指令做一件事,並輸出可供下一步處理的 JSON:hermai detect— 分類網站平台(Shopify、WordPress、Next.js 等)並偵測 anti-bot 系統。hermai wellknown— 探測robots.txt、sitemap、RSS feed 與 GraphQL 端點。hermai probe --body | hermai extract— 從頁面擷取內嵌資料。可辨識 13 種 SSR/hydration 模式(__NEXT_DATA__、ytInitialData、__APOLLO_STATE__、SIGI_STATE等)。hermai intercept— 啟動瀏覽器並捕獲真實 XHR 流量,適用於動態功能(搜尋、購物車、篩選)。hermai introspect— 取得 GraphQL schema。hermai session bootstrap— 為 anti-bot 網站預熱瀏覽器 session。
hermai registry push 推送。不需要 LLM key 或託管服務。
Platform 做什麼
Platform 是一個純查詢的 registry:GET /v1/catalog/{domain}— 回傳該網域所有端點與 action。這是主要的 agent 介面,需要intent說明用途。GET /v1/schemas— 瀏覽並搜尋整個 registry。POST /v1/schemas— 推送新 schema。會依intent 分類進行驗證並立即發布。
為什麼要這樣分工?
探索很貴(瀏覽器 + LLM + 時間)。查詢很便宜(資料庫讀取)。分開之後:- 貢獻者只需在自己機器上,本地付一次探索成本
- 之後的每一個 agent都能免費取得即時結構化資料
- Platform完全沒有探索的運算成本 — 它只是一個加了驗證與分析的 registry
- 不鎖死平台 — CLI 是開源(AGPL-3.0)且可離線運作