迄今“最强大”、碾压GPT4……谷歌AI大模型问世,马斯克也点赞!股价大涨

来源: 人民资讯
2024-05-20 11:22:26

  当地时间12月6日,美国科技公司谷歌推出了Gemini大模型。与大语言模型ChatGPT不同,Gemini大模型是原生多模态大模型,不仅可以处理文本内容,还可以无缝丝滑地处理代码、音频、图像和视频等多种模态的信息。据介绍,这是谷歌目前规模最大、能力最强的大模型。

  Gemini大模型一经推出,便引发了科技圈的“地震”,业内多名人士都对Gemini大模型表达了祝贺与赞美。根据谷歌给出的基准测试结果,Gemini大模型在大部分测试当中都打败了OpenAI的ChatGPT4,显示了先进的性能。

  今日美股盘前,谷歌A、谷歌C均大幅上涨,一度涨约4%。开盘后,谷歌股价保持高位,截至发稿,谷歌A涨4.88%,谷歌C涨超5%。

  主打“原生多模态”,30项测试结果超越GPT4

  “Gemini 是我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。”在Gemini大模型发布的公开信中,谷歌CEO桑达尔·皮查伊如此说道。谷歌DeepMind的CEO和联合创始人德米斯·哈萨比斯代表团队对Gemini大模型进行了详细介绍。

  综合来看,谷歌此次发布的G emini大模型主要有以下几个亮点:

  三个版本:提供三种不同的尺寸,实现从云上到手机、平板都可以运行。据谷歌介绍,尺寸由大至小分别为Gemini Ultra(规模最大且功能最强大,适用于高度复杂的任务)、Gemini Pro(适用于各种任务的最佳模型)和Gemini Nano(端侧设备上最高效的模型)。

  多种模态:据介绍,Gemini大模型从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。

  性能卓越:性能测试方面,在32项性能基准测试中的30项上,Gemini Ultra模型超越了现有最先进的GPT4。其中,在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的成绩首次超过了人类专家。

  具备更强的理解、推理和编码能力:可以在海量的数据中发掘难以辨别的知识内容;尤其擅长解释数学和物理等复杂科目中的推理;可以理解、解释和生成世界上最流行的编程语言(如 Python、Java、C++ 和 Go)的高质量代码,能够跨语言工作并对复杂信息进行推理,这些能力使其成为世界领先的编码基础模型之一。

  以上这些亮点中,多模态信息识别、理解与处理能力无疑是谷歌Gemini大模型最令人感到惊艳的一个能力。在一个测评视频中,测评人让Gemini看一系列的影像,并要求Gemini推理所看到的内容。记者看到,当测评人绘制一幅图片的时候,Gemini可以实时描述它所“看”到的画面。更奇妙的是,当测评人展示两张斜坡上的车辆图片,问“从设计上看,哪个车会跑得更快?”时,Gemini会问答:“右边的车更快,它更符合空气动力学。”

  Gemini大模型卓越的性能引得科技圈人士纷纷点赞。比如,特斯拉CEO埃隆·马斯克在桑达尔·皮查伊社交平台X上的发布帖下评论称:“令人印象深刻。”除此以外,马斯克还对谷歌DeepMind的CEO、Gemini团队代表德米斯·哈萨比斯表示了祝贺。

  AI进入多模态时代,带动算力赛道持续繁荣

  一名人工智能研发人员向记者表示,谷歌Gemini模型的核心优势在于其原生多模态的特性。具体而言,以往的多模态大模型是通过针对不同模态训练单独的组件,然后把这些组件组合起来,模拟多模态功能。虽然在单独和具体的任务上表现良好,但在处理需要更深层次概念理解和复杂推理的任务时,表现往往不尽人意。

  “不像OpenAI那样为图像和语音训练独立的DALL-E和Whisper模型,谷歌从一开始就构建了一个多感官模型。”该研发人员表示。

  近期,以语音、图片、视频等为主要代表的多模态大模型站上风口。记者梳理发现,多家国内外科技公司密集发布了相关产品。

  语音方面,11月22日,Meta官网发出公告,推出了一款多语言和多任务模型SeamlessM4T,可用于无缝翻译和转录语音和文本。据悉,SeamlessM4T的主要能力包括自动识别近百种语言的语音、语音翻译、文本转语音翻译等。

  图像及视频方面,11月16日,Meta官网发布文生视频模型Emu Video和图像编辑模型Emu Edit。11月29日,美国初创公司Pika Labs发布了文生视频工具Pika1.0,支持对视频进行实时编辑和修改;12月5日,美图发布AI视觉大模型MiracleVision的4.0版本,新增AI设计与AI视频两大能力。其中,AI设计具备四大功能,包括矢量图形、文字特效、智能分层和智能排版,可以满足AI设计的基础需求。

责任编辑:杨赐

  即将迎来成立74周年纪念日,人民海军最近还有一个大动作,那就是正式公开了055型驱逐舰的七号舰遵义舰和八号舰咸阳舰。055型驱逐舰,人们习惯称它为“万吨大驱”。那么截至目前,人民海军共拥有多少艘满载排水量超过万吨的大型驱逐舰呢?答案是三年入列8艘。

  “就规模而言,中国人口有14.11亿,占全球总人口的比例接近20%。就市场结构而言,中国是个单一的大市场,法律体系统一、税务体系统一、商业规则统一、语言文化统一的市场。就工业基础而言,中国是全要素全门类全产业链集成的经济体。”重庆市原市长黄奇帆在CDF年会上说。

  上述“老虎”均不同程度地涉嫌内幕交易。田惠宇、姚刚长期在金融领域任职,可谓近水楼台。其中,田惠宇在信息未公开前,买入证券,明示、暗示他人从事相关证券交易;姚刚获悉内幕信息后,在关联股票停牌前买入,复牌后卖出获利。

  商务部新闻发言人束珏婷曾表示,今年商务部将大力开展“投资中国年”招商引资系列活动。通过一系列“请进来”“走出去”的推介活动,搭建平台、畅通渠道、精准对接,全面展示各地投资机遇和比较优势。

  他们失联的亲人,大多数是家里的老人:有的老人已经接受了截肢手术,丧失在火灾中逃生的能力,但意识清醒;有的老人意识不清醒,和子女都说不了话;还有老人依赖鼻饲。

  在全球经济充满诸多不确定性的当下,中国凭借经济强大的韧性和潜能,承担起“确定性”角色。而对中国来讲,全力拼经济的2023年,外资也显得格外重要。

萧志成

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有