🚀 谷歌推出 Gemini 2.5 Flash 预览版:推理能力大幅提升,成本效益更优
谷歌发布 Gemini 2.5 Flash 的早期预览版本,通过 Google AI Studio 和 Vertex AI 上的 Gemini API 提供。新模型在 2.0 Flash 的基础上,显著提升了推理能力,同时保持了速度和成本优势。Gemini 2.5 Flash 采用混合推理模型,允许开发者开启或关闭“思考”过程,并设置“思考预算”以平衡质量、成本和延迟。即使关闭“思考”,也能保持 2.0 Flash 的速度并提升性能。在 LMArena 的 Hard Prompts 测试中,Gemini 2.5 Flash 的表现仅次于 2.5 Pro。该模型还具有精细的控制功能,开发者可以通过设置 0 到 24576 个 tokens 的“思考预算”来管理推理质量。
(HackerNews)via
茶馆 - Telegram Channel 


