IT商业网-解读信息时代的商业变革
当前位置: 首页 > 区块链 > 正文

全球首个开源GPT-4来了!Meta正式推出Llama 3 即将追上OpenAI

2024-04-19 15:08:01  来源:互联网    

  脸书母公司Meta周四宣布推出新一代大语言模型Llama 3.共有80亿和700亿参数两种版本,用了24000块GPU、15万亿个token训练训练的Llama 3一亮相便登上开源大模型铁王座,而随着推理编码大幅提升,代码和权重全开源,加上4000 亿参数的版本也正在开发,专家认为4000亿参数的版本推出后将是全球首个开源GPT-4级别的模型。

  Meta这次推出的80亿和700亿参数模型分别有预训练和指令微调两种版本,Meta也声称Llama 3性能优于Claude Sonnet、Mistral Medium和GPT-3.5.

  80亿参数版本让所有人都能接触最前端的AI技术,全球各地的开发人员、研究人员都可以借此进行游戏、建造和实验,不过上下文长度相较之前虽增加一倍,但依然只能一次生成8千字。

  Meta 也预告,接下来几个月将发布多个新功能的模型,包括多语言对话、更长上下文,以及整体能力提升。

  在性能上,8B和70B显著优于Llama 2.取代了SOTA,预训练模型和指令微调模型在8B和70B的参数规模上取得了如此先进的性能,都是得益于预训练和训练后的改进。

  此外,Llama 3已能在网页版Meta AI使用且免登录,AI模型资源平台Hugging Face共同创办人兼首席执行官表示:「Llama 1和2现已衍生出3万个新模型,Llama 3将给AI生态带来更大冲击。 」

  不过,80亿跟700亿参数版本的Llama 3还只是开胃菜,Llama 3的4000亿参数版本不久便要解禁,目前还在训练中,其中预训练版本在推理挑战测试集ARC-Challenge上拿下96的高分,Llama 3的4000亿参数指令微调版更在数学、代码、 大规模多任务语言理解基准上表现非常亮眼。

  英伟达高级科学家范麟熙将 Llama 3 的 4000 亿参数版本与 Claude 3 Opus、GPT-4-2024-04-09 版和 Gemini 在同基准数据中进行对比,结果显示 Llama 3 的 4000 亿参数版本在多语言推理任务跟代码能力,已经能跟 GPT-4、Claude 3 相匹敌,甚至完全胜过 Gemini Ultra 1.0.

  OpenAI共同创办人兼AI研究员Andrej Karpathy认为,Llama 3的4000亿参数版本将会是首个开源GPT-4级别的模型,范麟熙也说Llama 3的4000亿参数版本将成为一个分水岭,将改变许多研究工作和草根创业公司的计算方式。

  OpenAI研究科学家Will Depue也表达同样看法,认为Llama 3的4000亿参数版本将让未来的可能性无穷无尽,非常期待这样一款开源GPT-4级别的模型。

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT