OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能

来源: 人民日报
2024-06-21 14:37:41

  AI(人工智能)初创企业Anthropic发布自称“迄今为止最智能的模型”。

  当地时间6月20日,被视为OpenAI头号竞争对手的AI初创企业Anthropic发布了公司性能最强的AI模型Claude 3.5 Sonnet。据介绍,在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能基本全面超越了包括GPT-4o在内的一众知名AI模型,仅在MMLU(大规模多任务语言理解)和MATH(数理)数据集上略逊于GPT-4o,且优于自家此前最强的模型Claude 3 Opus。

  在Anthropic此前发布的Claude 3系列模型中,小型模型叫做Haiku,Sonnet是中档模型,最强模型的名字则是Opus。和Claude 3 Opus相比,最新3.5 Sonnet的运行速度可达到前者的两倍,在理解细微差别、幽默和复杂指令方面的表现有显著的提升,并能在生成内容时使用更自然的语气。在内部代理编码评估中,3.5 Sonnet解决了64%的问题,而Opus此前的成绩是38%。

  此外,Claude 3.5 Sonnet模型具备强大的“视觉”能力,在标准视觉基准测试中也超过了Claude 3 Opus。在诸如解释图表、图片等处理视觉推理的任务中,3.5 Sonnet可以准确地从不完美的图像中转录文本,对于零售、物流和金融服务等领域的客户来说尤为重要。3.5 Sonnet还可以用于自动化视觉数据处理任务,增强医疗保健、金融服务、媒体和娱乐工作任务中的数据分析。

  Anthropic表示,公司致力于“每隔几个月就显著改善智能、速度和成本之间的权衡曲线”,预计Claude 3.5 Haiku和Claude 3.5 Opus将在今年晚些时候推出。

  Anthropic的产品负责人Michael Gerstenhaber表示:“对企业来说,重要的是AI能否帮助他 们满足业务需求,而不是AI在性能测试中的竞争力如何,从这个角度来看,我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品,也领先于行业中的所有其他产品。”

  在定价方面,新模型定价与前代相同,即每输入3万token定价为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。

  现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外,新模型也在Anthropic的API以及亚马逊 Bedrock和谷歌云的Vertex AI等托管平台上上线。

  借着推出新模型的机会,Anthropic还为旗下模型引入了一个名为“Artifacts(人工制品)”的新功能。开启该功能后,用户将在对话框旁的一个新窗口中看到Claude生成的结果并与之交互:例如,要求模型设计一个图案,Claude就会在新窗口中展示生成的结果,并根据用户的新需求对结果进行实时编辑。

  Anthropic表示,该功能标志着Claude从对话式AI向协作式工作环境的演变,将很快扩展到支持团队协作,让Claude成为工作小组中的一员。

  科技网站The Verge指出,Anthropic的进步速度令人惊叹:公司刚于今年3月推出了Claude 3 Opus,现在已经迈出了下一步,相信OpenAI、谷歌等竞争对手很快也会跟上。

  今年5月,Anthropic正式推出Claude的iOS端应用程序,并宣布推出针对企业的新付费计划Team,提供比Pro版更多的对话次数,需要至少五名成员加入、每人每月30美元,展现出其在B端扩张的野心。社交媒体Instagram的联合创始人Mike Krieger和OpenAI前安全负责人Jan Leike也都在5月加入了Anthropic。

责任编辑:石秀珍 SF183

  在单元庄看来,西安具有新兴科学技术和产业的综合优势,跨的领域很多,从传统能源、技术加工到新型航空航天、电子通讯等都有很好的基础。这也是在智能化产业革命浪潮中,西安能够抓住新能源汽车等产业风口的重要原因。

  他曾任通河县委办副科级秘书,通河县委办副主任、主任,通河县委常委、宣传部部长,双城市委常委、组织部部长,双城市委副书记、市长等职。

  农业农村部数据显示,4月,猪肉、蔬菜批发价格继续处于回落通道,截至4月27日当周,猪肉及19种蔬菜批发市场周均价为19.41元/公斤、3.84元/公斤,分别较截至3月30日当周均价下跌3.91%和16.16%,同比分别上涨6.6%和下降18.8%。

  中国科学技术发展战略研究院研究员薛姝等在2021年发表的《当前我国青年科研人员面临的主要压力分析》一文中表示,由于评价考核的导向及要求,青年科研人员刚博士毕业就需要去申请青年基金项目,申请人数逐年增加,加剧了竞争。2019年自然科学基金青年项目受理项目数比2014年增长54.4%,而资助项目数只增长9.4%。相应地,青年科研人员项目申请成功率持续降低,2014~2019年,青年项目资助率从25.3%降至17.9%。青年科研人员申请项目的压力逐年增加。

  为促进当地房地产市场有序发展,近年来,淄博市政府采取了一系列的措施,包括出台扶持政策、组织房产交易博览会、加强市场调研座谈等,旨在吸引更多的购房者参与其中。

  从城镇非私营单位看,东部、中部、西部和东北地区年平均工资分别为13.3万元、9.0万元、10.1万元和9.0万元,分别增长7.1%、5.8%、6.1%和7.6%。以东部为1,东部、中部、西部和东北地区平均工资之比为1:0.68:0.76:0.68,2021年为1:0.69:0.77:0.67,东部与东北地区差距缩小0.01,与中部、西部地区的差距有所扩大。

卢怡君

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有