当前位置：首页 > 电脑 > 正文

谷歌承认Gemini演示视频非实时录制为“可能的样子”激发灵感

2023-12-10 15:41:33　　

　　谷歌最新发布的大语言模型Gemini在一段演示视频中展示了其强大的多模态用户体验。然而，根据谷歌发言人的承认，这段视频并非实时录制，而是通过拼凑静止图像帧和文字提示而成。让我们深入了解这一情况。

　　演示视频真相揭秘

　　虽然演示视频中Gemini模型似乎能够轻松识别杯中的纸团和图画中的物体，但谷歌发言人透露，Gemini只能对输入的提示和静态图像做出反应。视频中的语音互动也是由后期配音完成的，与实际响应存在延迟。

　　激发灵感的多模态体验

　　谷歌DeepMind研究副总裁兼深度学习负责人Oriol Vinyals解释说，这段视频旨在展示Gemini构建的多模态用户体验的“可能的样子”，以激发开发人员的灵感。视频中的所有用户提示和输出都是真实的，但为了简洁起见进行了缩短。此外，视频展示的是Gemini Ultra模型。

　　Gemini Ultra性能突出

　　在之前的报道中，谷歌声称Gemini Ultra在32个广泛使用的学术基准测试中有30个表现出超越当前时代的“先进结果”。Gemini Ultra不仅在大规模多任务语言理解（MMLU）上超越人类专家，还在新的多模态任务基准测试中表现卓越。

　　Bard Advanced即将登场

　　谷歌计划在明年初推出全新升级的Bard Advanced，为用户提供更出色的模型和功能体验。这将进一步巩固Gemini Ultra在语言理解领域的领先地位。

免责声明： IT商业新闻网遵守行业规则，本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章，请转载时务必注明文章作者和来源“IT商业新闻网”，不尊重本站原创的行为将受到IT商业新闻网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：post@itxinwen.com

微信公众号：您想你获取IT商业新闻网最新原创内容，请在微信公众号中搜索“IT商业网”或者搜索微信号：itxinwen，或用扫描左侧微信二维码。即可添加关注。

标签：

品牌、内容合作请点这里： 寻求合作 ››

榜单

今日推荐

谷歌承认Gemini演示视频非实时录制 ...

谷歌承认Gemini演示视频非实时录制 为“可能的样子”激发灵感

相关阅读RELEVANT

榜单

今日推荐

科技互联

谷歌承认Gemini演示视频非实时录制为“可能的样子”激发灵感