跳轉到主要內容

兩端分工

Hermai 有兩端:
  1. CLI(hermai-cli,開源)— 在你的機器上執行。貢獻者用它來檢視網站、撰寫描述端點的 schema,然後把 schema 推送到 registry。
  2. Platform(api.hermai.ai)— schema registry。儲存並提供貢獻者推送的 schema。agent 在執行期查詢以取得 registry 中任何網域的即時、結構化端點資料。不用瀏覽器、零探索成本、200 毫秒內回應。
Contributor                        Platform                         Agent
    │                                  │                               │
    │  discovery toolkit (local)       │                               │
    │  hermai registry push            │                               │
    │──────────────────────────────>   │                               │
    │                                  │   GET /v1/catalog/{domain}    │
    │                                  │ <────────────────────────────│
    │                                  │   { endpoints, actions }      │
    │                                  │ ────────────────────────────> │
    │                                  │                               │
    │                                  │   (agent calls site directly) │
    │                                  │                        curl ──┘

CLI 做什麼

CLI 提供一組確定性的工具組 — 每個子指令做一件事,並輸出可供下一步處理的 JSON:
  • hermai detect — 分類網站平台(Shopify、WordPress、Next.js 等)並偵測 anti-bot 系統。
  • hermai wellknown — 探測 robots.txt、sitemap、RSS feed 與 GraphQL 端點。
  • hermai probe --body | hermai extract — 從頁面擷取內嵌資料。可辨識 13 種 SSR/hydration 模式(__NEXT_DATA__ytInitialData__APOLLO_STATE__SIGI_STATE 等)。
  • hermai intercept — 啟動瀏覽器並捕獲真實 XHR 流量,適用於動態功能(搜尋、購物車、篩選)。
  • hermai introspect — 取得 GraphQL schema。
  • hermai session bootstrap — 為 anti-bot 網站預熱瀏覽器 session。
貢獻者依照探索結果撰寫 schema JSON 檔,並以 hermai registry push 推送。不需要 LLM key 或託管服務。

Platform 做什麼

Platform 是一個純查詢的 registry:
  • GET /v1/catalog/{domain} — 回傳該網域所有端點與 action。這是主要的 agent 介面,需要intent說明用途。
  • GET /v1/schemas — 瀏覽並搜尋整個 registry。
  • POST /v1/schemas — 推送新 schema。會依intent 分類進行驗證並立即發布。
Platform 不會代替你執行請求。agent 會直接使用 catalog 回應中的 URL 呼叫上游網站。託管執行將在未來階段推出 — 有興趣可加入 waitlist

為什麼要這樣分工?

探索很貴(瀏覽器 + LLM + 時間)。查詢很便宜(資料庫讀取)。分開之後:
  • 貢獻者只需在自己機器上,本地付一次探索成本
  • 之後的每一個 agent都能免費取得即時結構化資料
  • Platform完全沒有探索的運算成本 — 它只是一個加了驗證與分析的 registry
  • 不鎖死平台 — CLI 是開源(AGPL-3.0)且可離線運作