IT商业网-解读信息时代的商业变革
当前位置: 首页 > 区块链 > 正文

OpenAI发布ChatGPT4.5正式版 击败Claude3重夺全球AI一哥宝座

2024-04-18 10:42:06  来源:IT商业网    

  根据LMSYS Chatbot Arena最新评比,全球最强AI宝座近日再度换人坐,两个月前才遭AI新创公司Anthropic旗下Claude3 Opus超越的OpenAI ChatGPT,再次用实力重夺AI一哥地位,在最新的AI基准测试中,OpenAI几天前刚发布的GPT-4-Turbo-2024-04-09版本,大幅超越Claude3 Opus。

  值得一提的是,这个版本不是普通测试版本,而是作为正式版本GPT-4-Turbo发布,虽然GPT-4-Turbo发布已久,但一直以「预览版」的方式提供,此次首度发布正式版,足以看出该版本的份量,有不少网友甚至直接将其改名为 GPT-4.5-Turbo 了。

  根据 OpenAI 介绍,GPT-4-Turbo-2024-04-09 版本在写作、数学、逻辑推理以及编程等多个领域均有显著进步,使用新版 GPT4 写作会发现它的反应速度提升,沟通更为流畅,表达方式更趋于口语化。 新版的写作风格更贴近人类的自然语言,多了些人情味,少了点 AI 机器味。

  就在 OpenAI 发布更新版本后,中国玩家通过 AI 工具站 BotGo 进行了 GPT-4-Turbo 体验并发布测评指出,在代码能力测试上,相较于 Claude 3 Opus 完全没找到 bug 在哪,GPT-4-Turbo-2024-04-09 版本已经能够发现 Bug 的问题,并且提供了修复的代码,修改后的代码也更为优质,而且除了 Bug 之外还提出了索引处理和效率方面的问题及建议,整体表现确实比Claude3更为优秀。

  解析上传图片方面,最新版的GPT-4则好像还不能解析上传的图片,可能还在调测当中,并在图片问答方面还是不如Claude-3 Opus。

  此外,在让GPT-4讲述Sora技术原理时,GPT-4跟Gemini的表现都非常优秀,Claude-3则有些部分出现错误,像是Sora是生成式的,不是检索式的。 Gemini将Sora所采用的卷积网络技术模拟于乐高的积木结构,确实更容易理解,GPT-4则在专业上更胜一筹,也许是因为GPT-4知识库已更新到今年4月,Sora则是在2月刚发布。

  营销能力方面,结果发现更新版的GPT-4正式版还不能支持文件分析,跟官方公布信息一致,要进行文档分析仍要有请最强大的GPT4全能版本。

  最后,在写作能力测试方面,由于每个人的看法都可能不一样,测验结果可能见仁见智,中国玩家给予的评论则是Claude-3写的文章既较口语化且富有感染力,内容也有一定的深度,GPT-4和Gemini Pro则差不多,GPT-4比较专业,Gemini Pro比较流畅,速度也快一些。

  此前,LMSYS平台曾专门做过测验对比,GPT4的英文写作更强,而Claude3的中文写作能力更胜一筹。 LMSYS 是一个专门评测大型语言模型性能的平台,通过各种客观指标与人工评估,为业界提供最新、最全面的 LLM 排行榜。

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT