文章作者、来源:AIBase 谷歌近期对其 Gemini API 的计费结构进行了更新,旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位,包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。 首先,标准档位提供了基础的推理服务,用户可以根据自己的使用情况进行选择。弹性档位则是文章作者、来源:AIBase 谷歌近期对其 Gemini API 的计费结构进行了更新,旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位,包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。 首先,标准档位提供了基础的推理服务,用户可以根据自己的使用情况进行选择。弹性档位则是

谷歌发布 Gemini API 新定价策略,推理服务按需计费

2026/04/03 15:32
阅读时长 4 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:AIBase

谷歌近期对其 Gemini API 的计费结构进行了更新,旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位,包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。

首先,标准档位提供了基础的推理服务,用户可以根据自己的使用情况进行选择。弹性档位则是一个创新的选择,它利用非高峰时段的闲置算力资源,为用户提供了标准价格的五折优惠。这个档位的目标延迟在 1 至 15 分钟之间,但并不保证固定的延迟时间,适合那些对时间要求不太严格的应用场景。

此外,批量档位同样为用户提供了标准费率的五折优惠,适合需要处理大量数据的用户,延迟时间最长可达 24 小时。此档位特别适用于大规模的数据处理场景,用户在进行大量信息查询时可以大大节省成本。

在缓存档位方面,计费将依据缓存的词元数量与存储时长进行,特别适合需要频繁调用复杂指令的对话机器人、长视频分析或大规模文档集的查询。这个档位使得用户能够有效管理存储和计算资源,提高系统的运行效率。

优先档位的定价则比标准价格高出 75% 至 100%,但能够在毫秒到秒级内控制延迟。这一档位非常适合那些需要实时响应的应用,如客服聊天机器人、实时欺诈检测和关键业务智能助手等场景。谷歌建议有需求的用户选择优先档位,以确保他们的应用程序在响应速度和效率上的最佳表现。

划重点:

🌟 新增多种 Gemini API 服务档位,满足不同用户需求。

⏳ 弹性与批量档位提供五折优惠,适合大规模数据处理。

⚡ 优先档位确保毫秒级响应,适合实时应用场景。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值并交易 PRL,即可提升您的奖励!