OpenAI信号灯又亮了 Sora能照亮国内AGI前路吗?
时间:2024-02-22 17:23:43来自:第一财经字号:T  T

OpenAI旗下文生视频Sora爆火之时,国内大模型初创企业头部之一的月之暗面(MoonshotAI)传出最新融资消息。

据称,月之暗面在完成新一轮融资后,估值已达约25亿美元。这轮融资是由红杉中国、小红书、美团、阿里等投资方参与,且是国内AI大模型公司迄今获得的单轮最大金额融资。

此次融资动作,阿里与美团站到同一阵列。此前,另一家头部大模型企业智谱AI最新融资列表中,美团、蚂蚁、阿里、腾讯在列。王小川创立的百川智能资方中,也有阿里、腾讯、小米的身影。

面对微软加持OpenAI、亚马逊与谷歌加持Anthropic的巨头阵列,以及复杂的宏观环境,国内大厂与大厂之间、大厂与大模型创业公司之间,选择了牵手的形式,下注人工智能2.0赛道。

作为AGI(通用人工智能)领域的信号灯,此次OpenAI推出Sora的成功,轻易掩盖掉AI视频创业公司此前的光芒,给国内希冀通过垂直行业应用落地实现弯道超车的路径,蒙上了一层阴影。

Sora拉起新一轮大模型热潮

Sora的面世将人工智能热潮再次拉到新高度,360集团创始人周鸿祎感叹:Sora的出现意味着AGI的实现从十年缩短至一两年。从OpenAI发布的样片来看,Sora不仅展现了视频画面的前后一致性,也展现出基本符合现实世界物理规律的画面效果。

兴奋之余也需冷静看到,一方面Sora产出的视频内容仍存在不符合物理规律的问题。另一方面,文本转视频模型并非OpenAI首创,该领域中此前已有Google推出的Lumiere、StabilityAI推出的SVD、Meta推出的EmuVideo等,相关产品技术已被影视制作公司使用制作影视特效。

真格基金管理合伙人戴雨森表示,很多人现在对Sora的期待短期会落空,是因为将Sora直接类比ChatGPT,实际上类比GPT3更合适。Sora通过学习海量视频使得AI开始涌现对物理规律的理解,这与GPT3通过学习海量文本使得AI开始涌现对语言+知识的理解很像。但需注意,GPT3刚面世时也是一个问题很多、很难用的模型,经过了几次模型和产品的迭代,两年后才有了一个完整的ChatGPT产品问世。

IDC中国研究总监卢言霞表示,Sora是生成式AI在文生视频领域真正迈出了第一步,做到生成式AI驱动生成短视频。接下来也将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。但未来具体哪些公司能在什么时间点推出与Sora类似的产品,不可预测。当前Sora生成的是1分钟的视频,对于行业已经是重大突破,下一步何时能生成2分钟或5分钟以上的视频,也不可预测。

但目前最先应用落地的领域将是短视频、广告、互娱、影视、媒体等。在卢言霞看来,这些领域采用多模态大模型能力辅助人类员工生成视频,既可以提高生产速度又可以提高生产数量,还可以创造全新的视觉感受,能够帮助企业真正实现降本增效、提升用户体验。

在万兴科技AI创新中心总经理齐博看来,OpenAI采用DiT等技术实现“世界模拟器”,达到理解真实世界的运动和物理能力。它用于文生视频,可以生成超逼真的符合物理和运动学的复杂场景的视频,也就是说,可以理解和模拟真实世界。理解和模拟真实世界是AGI关键一步,能够加速通用人工智能的实现。

此次Sora的成功在齐博看来是因其依然遵循OpenAI的ScalingLaw,大力出奇迹,采用了大量数据、大模型与大量算力。Sora底层采用了游戏、无人驾驶和机器人领域验证的世界模型,构建文生视频模型,达到模拟世界的能力,具体采用DiT(DiffusionTransformer),处理不同持续时间、分辨率和比例的视频/图像。

世界模拟器是AI生成视频的另一种方式,齐博认为,它的成功会带动视频生成赛道的发展,加速视频生成的创新和成熟。

Sora背后的多模态趋势

OpenAI凭借此次Sora的爆火一举将生成式AI的关注点从文生文、文生图拉高至文生视频。一位行业人士表示,如果说AIGC(生成式人工智能)是AI领域皇冠,那么文生视频就是皇冠上的宝石。而Sora的出现意味着大模型的竞争到了比拼多模态、也是大模型技术最后一块拼图的阶段。在国内市场从业者眼中,这是他们正在追赶但尚未达到的目标。

清华系背景的杨植麟在2015年从清华计算机系毕业后,前往美国卡内基梅隆大学攻读博士,师从苹果AI研究负责人RuslanSalakhutdinov和谷歌首席科学家WilliamCohen。

虽从2020年开始确定“大模型是未来”的趋势,但在2023年之前,他认为亚洲可能并不存在做大模型公司的机会。但从2022年年底,杨植麟的判断开始发生很大变化,因GPT在美国市场已引发很大关注。

如今行业对大模型的议题已从ChatGPT变为Sora,杨植麟表示,多模态过去几年卡在架构上,缺少真正通用的模型。预计2024年月之暗面也会推出多模态产品,但公司的目标是在大模型领域做ToC超级应用。

智谱AI成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来。其创始人张鹏表示,智谱AI可能是国内最早开始一批做大模型和技术研发的团队,

谈及OpenAI,张鹏表示智谱AI和OpenAI最重要的一个相似之处是目标相同,都希望能够实现AGI,且都认为大模型是实现AGI的必经之路,因此双方在发展路径有相似

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持