视频大模型 快手美图殊途同归

来源: 猫眼娱乐
2024-06-14 07:45:08

  来源:北京商报

  有图像视频业务傍身的互联网企业,加速奔向大模型。近日,快手正式上线视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品MOKI,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成AI短片。不论是做视频还是做短片,都是通过大模型辅助用户创作,契合自己的主营业务。目前,获得内测资格的用户可以免费使用可灵,其他AI功能以限时免费、限次免费等方式向用户开放。美图相关人士并未透露KOMI的变现计划,但付费会员、单次付费等变现模式已是美图成熟的商业模式。

  不约而同

  “今天你‘可灵’了吗?”6月12日晚间,快手通过官方公众号向用户“安利”自家的视频生成大模型“可灵”。为了证明实力,快手不光拿出一条由快手可灵生成的一分钟预告片,还放出一系列首批获得测试资格的创作者生成的视频,如一朵花绽放的过程、复活成语故事《对牛弹琴》等。

  打开快手的视频剪辑App快影,进入主页的“AI玩法”,再点击“AI生成视频”模块填写问卷,即可以申请免费的内测资格。根据内测网友提供的信息,用户可以输入一段200字以内的文字描述,自行选择超现实主义、极简等风格,再等待约3分钟,就能看到由可灵生成的一段5秒视频。

  来自快手的最新数据显示,截至目前,在快影App上申请文生视频内测资格的人数已超6万,图生视频功能将于近期上线。

  同样瞄准视频大模型出手的还有美图。“目前市场上的AI视频产品倾向于提供文生视频等能力,我们认为只有深度理解创作者的需求,提炼有共性的视频场景,才能打造辅助内容创作的工具。”美图创始人吴欣鸿谈到MOKI时说,“MOKI聚焦于AI短片创作,专注于动画短片、网文短剧、故事绘本和MV等视频场景。”

  具体的工作流程是 :在脚本、视觉风格、角色等前期设定完成后,AI自动生成分镜图并转为视频素材,通过智能剪辑、AI配乐、AI音效、自动字幕等功能串联素材并实现成片。MOKI的上述能力即基于美图奇想大模型。

  热度升温

  除了快手、美图,近日视频生成的网红应用Pika、联合清华大学发布视频大模型Vidu的生数科技,也为视频大模型赛道添了一把柴。

  Pika不久前通过官网宣布,Pika已完成总额8000万美元的B轮融资,由Spark Capital领投,Greycroft、Lightspeed Venture Partners以及Jared Leto参投。Pika团队表示,这一轮融资将加快公司构建最佳视频模型的进程,同时帮助公司聘用优秀的人才。

  成立于2023年4月,爆火于2023年11月,早在Sora出世前,Pika就依靠AI生成和编辑3D动画、动漫等多种风格的视频,成为网红应用。

  生数科技仅比Pika早成立一个月,主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。

  “近期视频大模型活跃,说明大模型最早形成的一些技术壁垒在被打破。”文渊智库创始人王超告诉北京商报记者,“我认为能超过GPT-4的中国大模型可能在年中就会出现。中国的算力、能源和人才,支持着中国大模型持续追赶。”

  谈及视频大模型的门槛,中经传媒智库专家张书乐向北京商报记者表示,“视频生成不是将一堆AI绘画连在一起变成动画片,除了考虑形象一致、符合描述、光影分割、分镜表现等,还要具有对剧情的理解能力、再创造能力,这些都需要对视频结构、内容解析等多个垂直领域进行深度学习,难度高于聊天、绘画或棋类等靠主要数据堆积和用户纠错完成的功能”。

  跟着业务走

  2022年底OpenAI的ChatGPT让国内科技巨头在生成式大模型赛道扎堆,且大多瞄准对话式互动形式,2024年OpenAI又推出文生视频模型Sora。和一拥而上的大语言模型竞争相比,在视频大模型领域比拼的主角更多是图像视频类互联网公司。

  站在技术的角度,王超认为,“这两种大模型虽然都是AGI(通用人工智能),但技术路线不同,OpenAI两个都做,但不是每个企业都有这样的能力”。

  在视频大模型赛道,“快手和美图的最大优势在于用户积累、算法和数据处理等方面的经验”,深度科技研究院院长张孝荣表示。

  张书乐的看法是,“快手、美图拥有可以让人工智能深度学习的‘学习资料’,且可以规避一定的版权问题。这两家企业在视频领域的内容积累、垂直细分的标签标注,能让大模型更好地‘检索’知识”。

  不过第三方观察者也提醒,做视频大模型的难度比大语言模型更高,前景还不明确,“这是没多少国内大模型创业公司进入视频大模型赛道的原因,连巨头都没那么积极”,王超说。“视频大模型的变现比大语言模型困难。”张孝荣补充。

  快手和美图正通过各种手段吸引更多用户使用AI,并寻找AI变现的路径。以快影的AI创作功能为例,快影向用户提供AI舞王、AI小说转漫画、AI变装、AI头像壁纸等十几种服务,其中AI舞王提供免费5次的使用机会、AI变装限时免费、AI小说转漫画是VIP会员的权益。

  美图相关人士并未向北京商报记者透露MOKI可能的变现模式,但吴欣鸿在介绍美图新品时多次提到产品的商业化数据,在他看来,“如果AI帮用户创收,用户是很愿意为能创造价值的AI产品付费的”。

  北京商报记者 魏蔚

  三级水火箭与一、二级相比,在瓶子的连接方式、开伞方式、尾翼部分和分离装置都有升级。一级水火箭无法在空中完成分离,二级水火箭能完成一次分离,而三级水火箭能分离两次。重量更小、速度更强,飞行高度也能达到180米,制作也更为复杂。

  过去几年,快递行业经历了高速发展,根据国家邮政局数据显示,中国快递业务量2018年为507.1 亿件,2022年则为1105.8亿件,年均复合增长率达到21.52%,快递业务收入年均复合增长率也达到15.02%。不过2022年,受宏观环境影响,中国快递业务量和快递业务收入同比增长仅有约2%。此前几年,增长速度均是双位数。

  曾当过中科院古脊椎动物与古人类研究所所长的周忠和认为,真正对基础研究有益的长期稳定支持,不是项目式的稳定,而是给科研人员提供一种“最基本的稳定”,即有一份体面而稳定的薪酬,这应该是由财政兜底的。现在的问题是,财政每年给研究所提供的稳定运行费太低,造成稳定与竞争性经费的比例失衡。

  除此之外,信息消费联盟理事长项立此前对《环球时报》记者表示,美光在中国销售的产品可能存在安全问题,比如被操纵、数据泄露,以及其他法律法规禁止的行为。中国政府完全有权力进行监管、审查,确认这些产品是否合乎中国的安全要求。项立刚认为,以前,中国市场对美光的依赖性较高,很多芯片由美光供应。但是近年来,由于美国对中国高科技企业实施制裁,美光等制造商对中国的供应出现问题;同时,长江存储等中国企业也成长起来,中国对美光的依赖程度大大降低,许多器件基本可以实现自给自足。

  与此同时,据新加坡《海峡时报》22日报道,美菲宣布菲律宾总统马科斯将于5月1日访问美国。白宫发言人当地时间21日称,在访问期间,双方将“讨论捍卫国际法和促进一个自由开放的印太地区”,“拜登总统将重申美国对菲律宾防务的坚定承诺”。报道称,菲律宾和美国曾是长期盟友,但双边关系在杜特尔特执政时变冷。马科斯上台后,菲美关系重新得到提升。不过,菲律宾同时也加强同中国的经济关系,中国仍是菲律宾最大的贸易伙伴。今年1月,菲律宾总统马科斯对中国进行了国事访问,希望重启共同开发南海天然气的谈判。

  后来,他从农村考到山东农业大学读农业机械。大二时,在一门讲锻造的专业课上,他发现自己小时候就已摸索过相关的手工制作,一看便会。本科毕业,他考上华东理工大学机械制造和自动化相关专业,但读到第二年,他决定退学。他更希望与人交流,而非跟机械打交道,想将帮助自己成长的动手学习理念应用在更多的教育场景中。

李丰荣

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有