在2023年10月,苹果公司与哥伦比亚大学的研究人员合作发布了名为Ferret的开源多模态LLM(大型语言模型),这一举措引起了人工智能社区的广泛关注。苹果以往一直被视为“封闭花园”,然而这次的开源举措表明了苹果积极参与开源人工智能社区的决心。
1. Ferret的开源背景
Ferret的发布并未引起广泛关注,但在欧洲非营利组织的一位专注于医学领域开源人工智能的负责人在社交媒体上发帖后,引起了人们的关注。这一动态展示了苹果进入开源LLM领域的决心,尤其是在医学领域的开源人工智能社区。
2. Ferret的功能与应用
Ferret是以非商业许可证开源的,当前版本不能用于商业目的。然而,它具有广泛的应用前景,尤其是在图像处理方面。Ferret可以在图像中引用和定位任何事物,使得用户能够以图像中的元素作为查询的一部分,并获得典型的响应。例如,用户可以突出显示图像中的特定元素,询问有关其属性的问题,Ferret将能够识别并提供准确的响应。
3. Ferret的技术优势
Ferret的技术优势在于其多模态特性,可以处理图像中的元素,并在上下文中提供更深入的理解和响应。这一技术突破标志着苹果在人工智能研究中的开放态度,有望对未来的产品和服务产生积极影响。
4. 苹果在AI领域的策略调整
苹果此次开源Ferret对研究人员具有重大意义,显示了苹果逐步开放其AI研究的决心,与其过去神秘封闭的形象形成了鲜明对比。苹果还面临基础设施挑战,但通过与其他公司合作和开源模型的途径,苹果正在寻找拓展其AI能力的新途径。
Ferret的开源标志着苹果在人工智能领域迈出了积极的一步,为未来的技术创新和产业发展奠定了基础。这一举措有望推动多模态LLM领域的发展,同时也为其他科技公司在开源领域的参与树立了榜样。