登陆发布提交

被低估的多模态AI-被高估的Pika

文章编号：3079 更新时间：2023-12-29 分类：互联网资讯 阅读次数：次

资讯内容

这个demo足够吸引很多的流量，甚至出圈，有这样的信心，那投资的逻辑就能走下去了。

公司初创团队只有4个人，创始人兼CEO郭文景有女学霸斯坦福退学创业上市公司创始人女儿等个人标签;Pika三轮融资已筹款5500万美元，估值在2-3亿美元之间;投资者包括Quora创始人兼CEOAdamD’angelo、OpenAI科学家AndrejKarpathy、HuggingFace联合创始人兼CEOClemDelangue、YC合伙人DanielGross等人。

例如，在医疗领域可以通过结合图像、录音和病历文本，提供更准确的诊断和治疗方案;在交通领域，结合图像和传感器数据，带来更智能、更安全的自动驾驶体验;在教育领域，将文本、声音、视频相结合，呈现更具互动性的教育内容。

微博新技术研发负责人、AI首席科学家张俊林说。

从事AI生成视频研究的浦林（化名）告诉「甲子光年」，自有AIGC概念开始，无论是AI生成图片还是AI生成视频都很热，但是基于技术的发展程度，业内预计今年年底，AI生成视频会有一个不错的demo出现。

Pika1.0推出的当天，科技圈大佬们纷纷为其站台。

尽管Pika1.0的宣传视频被一些用户认为是炒作，亦或谷歌承认Gemini的展示视频经过剪辑，但不能否认，它们丰富了人们对多模态AI的想象力。

从GPT-4V的惊艳亮相，到AI视频生成工具1.0的火爆出圈，再到谷歌Gemini的全面领先，多模态AI都是其中的关键词。

但在Discord上，许多用户已经晒出了测试视频。

这些都加起来，可以说Pika的爆火是在发展过程中，讲了一个技术、商业、资本、用户都感兴趣的故事，而且赶上了一个好的时机。

1.Pika:实力还是炒作?

被低估的多模态AI被高估的Pika

最近的AI圈的饭局上，大家聊到多模态AI，往往都会提到一家硅谷的初创公司——PikaLabs。

自然语言处理领域学者ChristopherManning称赞Pika的两位创始人郭文景和孟晨琳推动了高质量视频的快速发展;OpenAI科学家AndrejKarpathy在社交平台上转发了Pika1.0的展示内容并表示:每个人都能成为多模态梦想的导演，就像《盗梦空间》中的建筑师一样。

之前很多公司都在卷文本大模型，GPT-4V的出现代表多模态大模型可落地，毫无疑问明年大家都会卷多模态AI，原因很简单，因为OpenAI说明这条路是能够走得通。

而用户B输入了更为细致的提示词:femalepriest-dndcharacter-inbattlepose-characterselectdefaultanimation-camerazoomin-motion1（女性牧师-龙与地下城角色-战斗姿势-角色选择默认动画-摄像头放大-动作1）。

不过，想使用的Pika1.0，在官网可能还需一段时间的排队。

目前，Pika1.0还只能生成3秒展示视频。

今年6月份之后，AI生成图片的投资变得比较保守，很多投资人会更关注AI生成视频。

在社群中，用户A输入提示词:Adragonflyinsky（一条龙在天上飞）。

Pika1.0火爆出圈，离不开一段官方宣传视频。

这个表达是比较清晰明确的，但输出的视频结果却和龙毫不相关，更像一个克苏鲁生物。

在行业主语为落地的当下，多模态AI正走向场景化、实用化、商业化。

视频中，用户只要输入马斯克穿着太空服，3D动画，就生成了下面这段视频。

但是业界一直在提多模态的概念，但是远没有近期几个现象级产品的展示那么直观:多模态不仅可以为AI应用带来更多可能性，还是实现通用人工智能的重要路径。

Pika1.0官方宣传视频中其它展示也可以用惊艳来形容，视频发布后，已经有媒体迫不及待地称AI生成视频的ChatGPT时刻即将达来。

但是，Pika真的如宣传视频上所展现的那么惊艳吗？今年7月，PikaLabs就在Discord推出服务器，短短几个月时间内收获了50万用户。

可以说，Pika占到一个很好的时间点。

多模态AI正处于爆发前夜。

标签： Pika、多模态AI、

本文地址： https://yihaiquanyi.com/article/683ca56fae9468f367cd.html

上一篇：苹果市值往年数据苹果市值往年涨近1万亿第...
下一篇：比亚迪侧面保险杠多少钱侧面硬刚比亚迪五菱...

发表评论

相关文章