被低估的多模态AI-被高估的Pika

文章编号:3079 更新时间:2023-12-29 分类:互联网资讯 阅读次数:

资讯内容

这个demo足够吸引很多的流量,甚至出圈,有这样的信心,那投资的逻辑就能走下去了。

公司初创团队只有4个人,创始人兼CEO郭文景有女学霸斯坦福退学创业上市公司创始人女儿等个人标签;Pika三轮融资已筹款5500万美元,估值在2-3亿美元之间;投资者包括Quora创始人兼CEOAdamD’angelo、OpenAI科学家AndrejKarpathy、HuggingFace联合创始人兼CEOClemDelangue、YC合伙人DanielGross等人。

例如,在医疗领域可以通过结合图像、录音和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声音、视频相结合,呈现更具互动性的教育内容。

微博新技术研发负责人、AI首席科学家张俊林说。

从事AI生成视频研究的浦林(化名)告诉「甲子光年」,自有AIGC概念开始,无论是AI生成图片还是AI生成视频都很热,但是基于技术的发展程度,业内预计今年年底,AI生成视频会有一个不错的demo出现。

Pika1.0推出的当天,科技圈大佬们纷纷为其站台。

尽管Pika1.0的宣传视频被一些用户认为是炒作,亦或谷歌承认Gemini的展示视频经过剪辑,但不能否认,它们丰富了人们对多模态AI的想象力。

从GPT-4V的惊艳亮相,到AI视频生成工具1.0的火爆出圈,再到谷歌Gemini的全面领先,多模态AI都是其中的关键词。

但在Discord上,许多用户已经晒出了测试视频。

这些都加起来,可以说Pika的爆火是在发展过程中,讲了一个技术、商业、资本、用户都感兴趣的故事,而且赶上了一个好的时机。

1.Pika:实力还是炒作?

被低估的多模态AI被高估的Pika 最近的AI圈的饭局上,大家聊到多模态AI,往往都会提到一家硅谷的初创公司——PikaLabs

自然语言处理领域学者ChristopherManning称赞Pika的两位创始人郭文景和孟晨琳推动了高质量视频的快速发展;OpenAI科学家AndrejKarpathy在社交平台上转发了Pika1.0的展示内容并表示:每个人都能成为多模态梦想的导演,就像《盗梦空间》中的建筑师一样。

之前很多公司都在卷文本大模型,GPT-4V的出现代表多模态大模型可落地,毫无疑问明年大家都会卷多模态AI,原因很简单,因为OpenAI说明这条路是能够走得通。

而用户B输入了更为细致的提示词:femalepriest-dndcharacter-inbattlepose-characterselectdefaultanimation-camerazoomin-motion1(女性牧师-龙与地下城角色-战斗姿势-角色选择默认动画-摄像头放大-动作1)。

不过,想使用的Pika1.0,在官网可能还需一段时间的排队。

目前,Pika1.0还只能生成3秒展示视频。

今年6月份之后,AI生成图片的投资变得比较保守,很多投资人会更关注AI生成视频。

在社群中,用户A输入提示词:Adragonflyinsky(一条龙在天上飞)。

Pika1.0火爆出圈,离不开一段官方宣传视频。

这个表达是比较清晰明确的,但输出的视频结果却和龙毫不相关,更像一个克苏鲁生物。

在行业主语为落地的当下,多模态AI正走向场景化、实用化、商业化。

视频中,用户只要输入马斯克穿着太空服,3D动画,就生成了下面这段视频。

但是业界一直在提多模态的概念,但是远没有近期几个现象级产品的展示那么直观:多模态不仅可以为AI应用带来更多可能性,还是实现通用人工智能的重要路径

Pika1.0官方宣传视频中其它展示也可以用惊艳来形容,视频发布后,已经有媒体迫不及待地称AI生成视频的ChatGPT时刻即将达来。

但是,Pika真的如宣传视频上所展现的那么惊艳吗?今年7月,PikaLabs就在Discord推出服务器,短短几个月时间内收获了50万用户。

可以说,Pika占到一个很好的时间点。

多模态AI正处于爆发前夜。

标签: Pika多模态AI

本文地址: https://yihaiquanyi.com/article/683ca56fae9468f367cd.html

上一篇:苹果市值往年数据苹果市值往年涨近1万亿第...
下一篇:比亚迪侧面保险杠多少钱侧面硬刚比亚迪五菱...

发表评论