谷歌、OpenAI指明方向!第一个AI“杀手级应用”、AI手机必争之地?

来源: 星岛环球网
2024-05-15 11:19:50

69tghoxxxxxxあなたのために詩を書きたいのに这一技术利用场内多个专用摄像头,追踪场上的足球和每一名球员身上的29个数据点位,每秒可记录50次,从而精准算出他们在场地内的准确位置。此外,世界杯官方用球也内置了测量传感器,能让设备检测到更准确的触球点。一旦出现可能的“越位”,新技术可以自动即时向视频助理裁判提供越位警报。X2Y3-GKq0mTczHZhaoyTw94-谷歌、OpenAI指明方向!第一个AI“杀手级应用”、AI手机必争之地?

  有观点认为,两款AI助手看似功能强大,但实际效用仍是未知。

  本文作者:李笑寅

  来源:硬AI

  OpenAI抢发重磅新品次日,谷歌也“放大招”直接对垒GPT-4o。

  当地时间5月24日周二,年度Google I/O开发者大会上,谷歌CEO Sundar Pichai发布了一系列与AI有关的新品和新功能,包括:AI Overviews技术生成摘要功能、Gemini 1.5 Pro上下文窗口拓宽至200万Tokens、多模态Gemini Nano模型、第六代TPU芯片Trillium等。

  围绕AI搜索引擎方面,谷歌带来了一系列更新。值得一提的是,谷歌发布了一款多模态AI项目Astra,用来处理音频、视频等多模态的输入内容。

  演示视频显示,Astra可以通过手机摄像头辨别物体,还能够识别所处位置。

  Video Player is loading.

  Play Video

  Play

  Loaded0%

  Current Time 0:00

  /

  Duration 0:00

  1x

  Playback Rate

  Mute

  Fullscreen

  This is a modal window.

  No compatible source was found for this media.

  Beginning of dialog window. Escape will cancel and close the window.

  Text

  Color

  White

  Black

  Red

  Green

  Blue

  Yellow

  Magenta

  Cyan

  Transparency

  Opaque

  Semi-Transparent

  Background

  Color

  Black

  White

  Red

  Green

  Blue

  Yellow

  Magenta

  Cyan

  Transparency

  Opaque

  Semi-Transparent

  Transparent

  Window

  Color

  Black

  White

  Red

  Green

  Blue

  Yellow

  Magenta

  Cyan

  Transparency

  Transparent

  Semi-Transparent

  Opaque

  Font Size

  50%

  75%

  100%

  125 %

  150%

  175%

  200%

  300%

  400%

  Text Edge Style

  None

  Raised

  Depressed

  Uniform

  Dropshadow

  Font Family

  Proportional Sans-Serif

  Monospace Sans-Serif

  Proportional Serif

  Monospace Serif

  Casual

  Script

  Small Caps

  Reset restore all settings to the default valuesDone

  Close Modal Dialog

  End of dialog window.

  不论是定位还是功能,谷歌这款AI助手的到来显然对GPT-4o产生了威胁。

  华盛顿大学专门研究在线搜索的教授Chirag Shah对此评论道:

“最终,你会有一个真正了解你的代理,可以为你做很多事情,并执行跨任务和跨领域的命令。”

  谷歌还在发布会上表示,今年夏天开始,Gemini也将支持语音实时交互,并在今年晚些时候上线实时视频交互。未来几个月内,谷歌也将推出类似于GPTs的自定义AI助手功能,叫做Gems,能够与整套“谷歌全家桶”联动。

  第一个AI“杀手级应用”?

  从OpenAI和谷歌的发布会来看,GPT-4o目前只能处理静止图像,但Astra可以处理视频,这是一个显著的优势。

  并且,谷歌在发布会上还对Gemini 1.5 Pro大模型进行了诸多更新,使其可以拥有更自然的声音、更长的对话、对音频和图像的更好理解、更多的逻辑推理和规划能力,以及更好的代码生成。

  不过,GPT-4o背后的技术创新同样令人深刻。据悉,该原生多模态模型能够直接接收/生成语音,而无需经过语音-文字的转化过程,大大缩短了运行周期;并且在执行任务所需的参数量也大幅降低,从而提高运行速度、缩减成本。

  就当前进展而言,很难判断OpenAI和谷歌的AI助手中谁更胜一筹,但二者对该领域的重视程度是无疑的。

  科技巨头们相继发力,是否意味着AI助手会成为下一个AI“杀手级应用”?

  答案尚不肯定。

  有分析指出,虽然目前GPT-4o和Astra展示出的用例都很有趣,但“几乎没有一个”是帮助人们完成工作的。也就是说,这两款AI助手看似功能强大,但实际效用仍是未知。

  分析称,如果AI助手后续能够更理解用户的个人偏好,可能其“代理”属性能够有所增强,帮助用户真正完成日常工作,比如网购、预订、填表……

  AI手机下一步需要解决什么?

  虽然OpenAI和谷歌的AI助手可以直接通过语音、视频等形式运行,但有观点认为,二者仍不能被称作是一个AI助手。

  原因在于,GPT-4o和Astra虽然都可以回答问题并执行搜索工作,但它们不能真正执行任务。

  华尔街见闻此前提及,OpenAI的在发展边缘AI方面的痛点即为:端侧应用权限、系统级权限。这可能也是它寻求与苹果合作的原因之一。

  就目前而言,只要AI助手产品还没有真正接入到手机系统中去,Siri之类的语音助手的地位就无法被撼动。

  有观点指出,确定性要比AGI(通用人工智能)更重要,靠谱才是第一的。

  该观点认为,即使是目前最好的AI系统,也没有做足准备真正实现个人助手的功能;而手机自带的语音助手虽然没那么“有趣”,但至少不会出错。

  本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里

风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

责任编辑:王永生

瓦伦西亚在国际赛场上的首秀发生在2012年3月,当时他22岁,自那以来,他在75场比赛中打进37球,是厄瓜多尔队史上最佳射手,并在厄瓜多尔的第四次世界杯之旅中作为队长引领球队。对于“超人”来说,这是他第二次参加世界杯比赛,他现在已有5粒世界杯进球。2014年巴西世界杯是这位前锋的世界杯首秀,当时他打入3球。

沙特队今年可能又要“被惨案”

“我是铁杆球迷,这世界杯必须得看,尤其第一场。”市民孙先生说,自己在家里看,影响家人休息,还少了点气氛。约几个朋友一边看球一边撸串喝点啤酒才过瘾。还有很多市民表示,看球赛的时候,球友们都有独乐乐不如众乐乐的心态,自己看球赛没气氛,深更半夜在家也不敢高声喧哗,但在这里球友们一起谈论、预测、呐喊、助威,随心所欲。

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有