是一种新的开始英语 (是一种新的开源多模态机器学习模型-Ferret-苹果的)

文章编号:2415 更新时间:2024-01-10 分类:互联网资讯 阅读次数:

资讯内容

公司与康奈尔大学的研究人员于10月份悄然推出了一款名为「Ferret」的开源多模态大型语言模型(LLM)。这一研究成果在Github上发布,但并未引起太多关注,没有进行任何宣布或庆祝。的代码与Ferret-Bench一同于10月30日发布,而检查点版本则于12月14日推出。

是一种新的开始英语是一种新的开源多模态机器

据VentureBeat报道,虽然起初并未受到太多关注,但在周六,这一发布对研究人员来说变得更为重要。一家医疗AI非营利组织的负责人BartDeWitte在X平台上发帖称这一「错过」的发布「证明了苹果对有影响力的AI研究的承诺」。

Ferret的开源发布采用非商业许可,因此在当前状态下不能商业化。然而,它总有可能以某种方式被用于未来的苹果产品或服务中。

苹果AI/ML研究科学家ZheGan在10月的一条推文中解释了Ferret的用途,即作为一个可以「在图像中的任何位置、以任何精度、使用任何形状的区域进行参考和定位」的系统。简而言之,该模型可以检查在图像上绘制的区域,确定其中对用户查询有用的元素,识别它,并在检测到的元素周围绘制边界框。它可以将识别出的元素作为查询的一部分,然后以典型的方式做出响应。

例如,高亮显示图像中的动物并询问LLM动物是什么,它可以确定动物的物种,以及用户指的是一群动物中的个体。它可以使用图像中检测到的其他项目的上下文提供进一步的响应。

这一发布对研究人员来说很重要,因为它表明苹果愿意在AI工作上更加开放,而不是采取其通常的保密立场。

苹果面临的另一个问题是基础设施,虽然它正在努力增加AI服务器的数量,但目前可能没有足够的规模来与例如ChatGPT等进行竞争。尽管苹果可以与其他公司合作扩大其能力,但另一种方法是像它刚刚做的那样,即发布一个开源模型。

Github发布中的一个有趣元素是,Reddit的r/APPle注意到Ferret是「在拥有80GB内存的8个A100GPU上训练的」。考虑到苹果与NvidiaGPU采用的历史,这被视为对GPU制造商的罕见认可。

查看Ferret更多介绍:https://top.aibase.com/tool/ml-ferret

(举报)

标签: AI多模态苹果Ferret

本文地址: https://yihaiquanyi.com/article/c1f8632ce5b341311144.html

上一篇:重新定义汽车安全问界新M7全球首发全向防碰...
下一篇:小米汽车技术大公开小米汽车技术发布会直播...

发表评论