谷歌重磅更新Gemini15Pro全面开放2百万Token上下文窗口代码执行和Gemma

快速一览

Gemini 1.5 Pro 2百万Token上下文窗口现已向所有人开放

代码执行工具现已在Gemini 1.5中可用

Gemini 1.5 Flash文本调优已经开始逐步推出

Gemma 2现已在AI Studio中可用

重大更新

今天,Google为开发者带来了几项重大更新。 Gemini 1.5 Pro 的2百万Token上下文窗口现在对所有开发者开放,此外还引入了 代码执行功能 ,并在Google AI Studio中添加了 Gemma 2 。

谷歌重磅更新Gemini15Pro全面开放2百万Token上下文窗口代码执行和Gemma-2

长上下文窗口和上下文缓存

在I/O大会上,Google宣布了历史上最长的2百万Token上下文窗口,该功能此前仅对等待名单上的用户开放。现在,这一功能向所有开发者开放。

随着上下文窗口的增加,输入成本也随之增加。为了帮助开发者降低在多个提示中使用相同Token的任务成本,Google在Gemini 1.5 Pro和1.5 Flash的Gemini API中推出了 上下文缓存功能 [1] 。这一功能可以帮助开发者更高效地管理和利用Token,节约开销。

谷歌重磅更新Gemini15Pro全面开放2百万Token上下文窗口代码执行和Gemma-3

代码执行

LLMs在处理数学或数据推理问题上历来存在困难。生成并执行能够解决这些问题的代码有助于提高准确性。为了解锁这些能力,Google为Gemini 1.5 Pro和1.5 Flash引入了 代码执行功能 [2] 。

一旦开启,代码执行功能可以动态生成并运行Python代码,迭代学习结果直到得到所需的最终输出。执行沙箱不连接互联网,标准配置了几个数值库,开发者只需为模型输出的Token付费。

这项功能现已通过Gemini API和Google AI Studio的“高级设置”提供。

Google AI Studio中的Gemma 2

Gemma 2现已在Google AI Studio中提供以供实验,旨在让所有开发者都能访问AI,无论是通过API密钥集成Gemini模型,还是使用开源模型Gemma 2。

谷歌重磅更新Gemini15Pro全面开放2百万Token上下文窗口代码执行和Gemma-4

Image

生产中的Gemini 1.5 Flash

Gemini 1.5 Flash是为了满足开发者对速度和可负担性的需求而构建的。Google对开发者如何使用Gemini 1.5 Flash进行创新感到非常兴奋,并展示了一些实际案例:

Envision :通过应用程序或智能眼镜,Envision帮助视力低下的人更好地理解他们的周围环境,并提出具体问题。借助Gemini 1.5 Flash的速度,Envision的用户能够实时获取周围环境的描述,这对于他们导航世界至关重要。

Plural :这个自动政策分析和监控平台使用Gemini 1.5 Flash为NGO和政策关注者总结和推理复杂的立法文件,从而影响法案的通过。

Zapier :利用Gemini 1.5 Flash的视频推理能力,从原始视频素材中提取具体细节到Zapier表格中,启用新的视频编辑自动化机会。

Dot :一个设计为随用户成长并变得越来越个性化的AI,利用Gemini 1.5 Flash进行信息压缩任务,这对于其自主长期记忆系统至关重要。

根据Google上个月的公告,他们正在努力使Gemini 1.5 Flash的调优对所有开发者开放,以支持新的用例,增强生产稳定性和提高可靠性。1.5 Flash的文本调优现已准备好进行红队测试,并将逐步向开发者推出。所有开发者将在7月中旬通过Gemini API和Google AI Studio访问Gemini 1.5 Flash的调优功能。

谷歌重磅更新Gemini15Pro全面开放2百万Token上下文窗口代码执行和Gemma-5

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/162.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>