根据BBC和The Verge的报道,谷歌正在紧急修复其Gemini大模型的文生图功能,因为该功能存在追求多元化的bug。部分用户反馈称,在生成的图片中出现了各种性别、种族的人群,与实际情况不符。
问题曝光
用户反馈:
Gemini在生成的图片中出现了不准确的人物描述,例如在以“美国开国元勋华盛顿”为主题的图片中,出现了妇女和有色人种。
白人存在问题:
某些用户发现,在要求生成“1943年德军士兵”的图片时,Gemini展示了由黑人、亚裔和白人女性身穿纳粹德军制服的照片,令人尴尬。
谷歌的回应
意识到问题:
谷歌在声明中表示已意识到Gemini在某些历史图像生成描述中提供了不准确的信息,并将立即进行修复。
多元化努力:
谷歌表示,尝试提高多元化是有道理的,因为长期缺乏这一特性的生成式AI。图像生成器是在大量图片和文字说明的基础上进行训练的,但往往容易放大刻板印象。
Gemini模型的文生图功能
模型背景:
Gemini模型的文生图功能由谷歌Imagen 2模型提供支持,需要英语指令。用户可以根据向Bard提供的描述生成自定义图像。
谷歌承诺:
谷歌承诺Bard可以提供高质量、逼真的图像输出,但目前需要解决多元化问题。
Gemini模型的文生图功能对于生成多样化的人物形象通常是有益的,但当前的问题显示出在某些情况下会出现严重的不准确性。谷歌的紧急修复行动和对多元化的努力将决定其在未来AI发展中的地位。