IT商业网-解读信息时代的商业变革
当前位置: 首页 > 电脑 > 正文

谷歌承认Gemini演示视频非实时录制 为“可能的样子”激发灵感

2023-12-10 15:41:33     

  谷歌最新发布的大语言模型Gemini在一段演示视频中展示了其强大的多模态用户体验。然而,根据谷歌发言人的承认,这段视频并非实时录制,而是通过拼凑静止图像帧和文字提示而成。让我们深入了解这一情况。

  演示视频真相揭秘

  虽然演示视频中Gemini模型似乎能够轻松识别杯中的纸团和图画中的物体,但谷歌发言人透露,Gemini只能对输入的提示和静态图像做出反应。视频中的语音互动也是由后期配音完成的,与实际响应存在延迟。

  激发灵感的多模态体验

  谷歌DeepMind研究副总裁兼深度学习负责人Oriol Vinyals解释说,这段视频旨在展示Gemini构建的多模态用户体验的“可能的样子”,以激发开发人员的灵感。视频中的所有用户提示和输出都是真实的,但为了简洁起见进行了缩短。此外,视频展示的是Gemini Ultra模型。

  Gemini Ultra性能突出

  在之前的报道中,谷歌声称Gemini Ultra在32个广泛使用的学术基准测试中有30个表现出超越当前时代的“先进结果”。Gemini Ultra不仅在大规模多任务语言理解(MMLU)上超越人类专家,还在新的多模态任务基准测试中表现卓越。

  Bard Advanced即将登场

  谷歌计划在明年初推出全新升级的Bard Advanced,为用户提供更出色的模型和功能体验。这将进一步巩固Gemini Ultra在语言理解领域的领先地位。

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT