世人惊呼Sora诞生:现实不存在了!多家A股公司积极布局视频生成模型赛道

来源: 人生五味
2024-06-19 00:34:41

  本报记者 郭冀川 丁蓉

  继ChatGPT这一现象级的应用推出一年之后,近日,美国开放人工智能研究中心OpenAI正式发布了旗下首款视频生成模型Sora,再次在全球掀起了人工智能关注浪潮。相较于此前的视频生成模型,Sora在底层模型和算法上进行了创新,被业界称为视频生成领域的里程碑。因此,Sora的问世令世人惊呼:现实不存在了!

  从自动生成文字到自动生成图片,再到现如今自动生成视频,人工智能大模型技术在加速迭代。中央财经大学数字经济融合创新发展中心主任陈端在接受《证券日报》记者采访时表示:“人工智能技术的国际竞争,本质上是国家创新力、创新生态以及创新资源体系的全方位竞争。国内人工智能相关企业拥有庞大的市场需求和丰富的数据资源等优势,正紧抓时间窗口,加强国际交流与合作,加快技术创新和商业化步伐,创造更多应用与成果。全球人工智能产业正进入加速发展阶段。”

  为什么Sora引发关注潮?

  Sora作为文字转视频模型,能够严格根据用户输入的提示词、文本指令或静态图像,生成长达1分钟的视频,保持较高的视觉质量。据OpenAI官网介绍,该公司正在努力教人工智能“理解和模拟处在运动当中的物理世界”。

  据悉,Sora相较于过去几款主流文生视频工具有了极大幅度的提升。华金证券分析师方闻千表示,Sora生成的视频具有超长时长、世界模型、多镜头切换三大特点。具体来看,之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。

  继文字生成和图像生成技术之后,Sora是视频生成技术方面的突破性进展。短期来看,Sora将直接改变很多内容产业的成本结构以及资源支撑体系。萨摩耶云科技集团首席经济学家郑磊向《证券日报》记者表示:“Sora的诞生将对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。”

  陈端表示:“长期来看,Sora将远远不止是内容生产工具,其构建的基于三维物理世界来创造数字原生世界的强大引擎,将给一些产业从底层工具层面带来变化,形成深远影响。”360集团创始人、董事长周鸿祎2月16日在其微博上表示,Sora意味着AGI(人工通用智能)实现将从10年缩短到1年。

  不过,目前的Sora仍存在一定局限性。例如,它可能难以精确模拟复杂场景的物理状况,也可能无法理解一些特定的因果和时间联系等。此外,模型还可能混淆一些文本指令中的空间细节,例如左右方向等。据了解,相关领域专家将对模型展开测试,目前,该模型只向有限数量的创作者提供访问权限。

  中国信息协会常务理事、国研新经济研究院创始院长朱克力向《证券日报》记者表示:“要用好Sora,企业首先需深入了解其技术特性和应用场景,其次要积极探索Sora与其他技术的结合,如与虚拟现实、增强现实等技术的融合应用。同时,还应注意数据安全和隐私保护等问题。”

  多家上市公司涉足相关领域

  2023年,科技大厂、创业企业、科研院所等纷纷入局AI大模型,目前,我国大数据、云计算、人工智能企业创新发展,数字产业化体系逐渐完备,并向全球产业链中高端跃进。政策端,《生成式人工智能服务管理暂行办法》《关于加快推进视听电子产业高质量发展的指导意见》等陆续出台,既促进了人工智能大模型技术的创新发展和生成式人工智能产业健康发展,也进一步规范制度引领技术落地。

  今年春节期间,支付宝等平台陆续推出了人工智能全家福照片制作功能,上传家人照片可以生成不同风格背景的全家福照片,生成式人工智能工具在图生图领域的落地应用已经被公众广泛接纳。

  例如,佳都科技公布了其自主研发的国产化的大模型技术,聚焦在交通、城市治理、政务服务等垂直领域的应用,公司的TransCore-M多模态大模型能够理解文本、图像、视频等多种模态的信息, 并且按照用户需求将其描述、提示或转化为指令代码,是个“聪明”的交通信息小助手。

  当虹科技拥有自研的生成式人工智能工具集,于2023年上半年发布了以静态照片生成三维体积视频的方案,支持六自由度视角自由移动,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。

  我国在人工智能技术和大模型领域已经取得了显著的进展,但与国际领先水平相比,仍存在一些短板。中国电子商务专家服务中心副主任、资深人工智能专家郭涛在接受《证券日报》记者采访时表示:“这些短板包括原创算法的研发、高质量数据集的构建、芯片和硬件的自主研发能力、国际化人才的吸引和培养等方面。”

  陈晓华说:“人工智能革命将会推动算力基础设施的需求猛增,此外文生视频大模型将带动视频数据的调用规模持续放大,这对宽带质量也提出了更高的要求。”

  商务部研究院电子商务研究所副研究员洪勇向《证券日报》记者表示:“国际上,部分大型科技公司凭借雄厚的技术积累和资源在人工智能赛道占据领先地位。中国企业在某些细分领域已具备国际竞争力,但仍有短板。当下需要清醒意识到差距,加强基础科研、培养高层次人才、建立合规体系,并积极参与国际合作与竞争,进一步提升在全球人工智能领域的地位。”

责任编辑:韦子蓉

  [中国足协主席、党委副书记陈戌源接受审查调查]中国足球协会主席、党委副书记陈戌源涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国家体育总局纪检监察组和湖北省监委审查调查。

  进一步从成交项目来看,截至2月13日,在今年的成交榜上,洋浦星项目以298套的成交量位居第一。此外,荣和伍壹大道、华润未来城市、华润江南中心等项目的成交套数分别为164套、94套、87套依次排在二三四位。

  1988年3月,全国政协六届十七次常委会会议期间,“界别”这一提法首次出现。在此之前,全国政协的组织设置一直用“参加单位”来表述。2004年3月,全国政协十届二次会议通过的政协章程修正案,政协章程第一次正式以“界别”来指称所有的政协参加单位。

  为研制第一艘国产大型邮轮,从设计规划、工艺工法到现场管理,中国船舶集团(以下简称中船集团)上海外高桥造船有限公司的工程师几乎全面革新了此前的造船技术。

  振动和噪声评估是国产邮轮目前尚未完全攻克的难题之一。“一个房间里,不同物体能产生多大噪音,减振降噪材料又能起到多大效果?这些数据最好在设计阶段就完成评估,一旦完工,修改难度极大,而局部增加隔音材料,又会影响船身重量。”李嘉宁解释说,除了利用专业的仿真建模软件进行分析,还必须有准确的设计输入条件。目前,通过建造两艘邮轮,外高桥也将不断收集和丰富主要振动噪声源和大部分隔音材料的数据。

  2月13日上午,中国男足亚运队进行了佛山集训的最后一练。此时此刻,包括徐根宝、沈祥福、魏克兴在内的足协教练委员会成员正在佛山,他们此行的主要目的就是参加中国足协为国足选择新外籍主帅的专题工作会议。由于国足自去年3月下旬结束卡塔尔世预赛征程后,已有近1年没有组织过集训,比赛更无从谈起,鉴于球队今年将相继要参加世预赛和亚洲杯,中国足协不得不加紧落实球队重建。此次佛山会议正是在这一背景下召开的。

吴盈君

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有