优惠论坛

标题: PinchBench 基准测试:Gemini 3 Flash 在 OpenClaw 任务中以 95.1%领先 AI 大模型 [打印本页]

作者: 比推快讯    时间: 2026-3-8 11:32
比推消息, 慢雾 CISO 23pads 在 X 平台发文表示,PinchBench 基准测试评估 AI 大语言模型在 OpenClaw 代理任务中的表现,结果显示 Gemini 3 Flash 处理 OpenClaw 任务成功率以 95.1% 领先,minimax-m2.1、kimi-k2.5 则分别以 93.6%、93.4% 分列 2、3 位。Claude Sonnet 4.5 则为 92.7%,GPT-4o 为 85.2%。



风险提示: 本新闻涉及的内容仅供参考,不构成投资建议。依据发布的信息以及所表达的意见行事所造成的一切后果由行事者自负。文章链接




欢迎光临 优惠论坛 (https://tcelue.com/) Powered by Discuz! X3.1