養龍蝦(OpenClaw)選哪個模型好?18 款模型實戰評測
local_agentic_llm 是大數軟體發布的開源 AI Agent 基準測試框架,透過 OpenRouter API 評估 18 款語言模型(15 款開源)在 Agentic Coding 與 OpenClaw 技能建構情境的實際表現。第 1 名 qwen3-coder-flash 以 55/60 分領先(寫程式滿分 30/30),第 2 名 qwen3.5-27b 共 51 分,並列第 3 名 GLM-5、qwen3.5-122b、Kimi-K2.5 各 50 分。qwen3.5 家族稱霸 OpenClaw(G2)前 4 名,得分 26-27 分。性價比最高為 Gemini 3 Flash 與 qwen3.5-27b(G1 均達 25 分,費用僅 $0.09-0.10/次)。本文解析完整排行榜、四象限成本分析與六大任務通過率,協助企業選出最適 AI Agent 模型。
閱讀更多