研究发现,OpenAI 的 GPT-4o 道德推理能力胜过人类专家

来源: 上游新闻
2024-06-24 10:03:36

可以看女生小穴的软件「死は生の対極にあるのではなくc我々の生のうちに潜んでいるのだ」  他在城市进化论“<a href="https://weibo.cn/sinaurl?u=http%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzg2MjA5Mjc0OA%3D%3D%26amp%3Bmid%3D2247548191%26amp%3Bidx%3D1%26amp%3Bsn%3D19e900213aa1b4eaf4dfa858d493040b%26amp%3Bchksm%3Dce0f51bcf978d8aad3d7b889a1862d792d1e2e97ac2bc47267f76b26d4e4c20fd6fa6f242f54%26amp%3Bscene%3D21%23wechat_redirect" target="_blank"><em>大家的城市公开课</em></a>”第二期上提到,“我觉得我们不需要让一个城市去抵御10万年一遇的洪水、暴雨、干旱,也不需要修到应对万年一遇的程度,能应对百年一遇就可以了。”9j5d0-qVobyKqD4dKyNJOb0-研究发现,OpenAI 的 GPT-4o 道德推理能力胜过人类专家

IT之家 6 月 24 日消息,近期的一项研究表明,OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议,且质量优于“公认的”道德专家所提供的建议。

据 The Decoder 当地时间周六报道,美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究,将 GPT 模型与人类的道德推理能力进行比较,以探讨大语言模型是否可被视为“道德专家”。

IT之家汇总研究内容如下:

研究一

501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明,人们认为 GPT 的解释比人类参与者的解释更符合道德、更值得信赖、更周到。

评估者也认为人工智能的评估比其他人更可靠。虽然差异很小,但关键发现是 AI 可以匹配甚至超越人类水平的道德推理。

研究二

将 OpenAI 最新的 GPT-4o 模型生成的建议与《纽约时报》“伦理学家”专栏中著名伦理学家 Kwame Anthony Appiah 的建议进行了比较。900 名参与者对 50 个“伦理困境”的建议质量进行了评分。

结果表明,GPT-4o 在“几乎每个方面”都胜过人类专家。人们认为 AI 生成的建议在道德上更正确、更值得信赖、更周到、更准确。只有在感知细微差别方面,人工智能和人类专家之间没有显著差异。

研究人员认为,这些结果表明 AI 可以通过“比较道德图灵测试”(cMTT)。而文本分析显示,GPT-4o 在提供建议时使用的道德和积极语言比人类专家更多。这可以部分解释为什么 AI 的建议评分更高 —— 但不是唯一因素。

需要注意的是,这项研究仅仅针对美国参与者进行,后续仍需进一步研究人们如何看待 AI 生成的道德推理的文化差异。

论文地址:https://osf.io/preprints/psyarxiv/w7236

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  据《海南日报》消息,7月31日至8月1日,海南省委书记冯飞、省长刘小明率海南省“八一”拥军慰问团赴广州、湛江,看望慰问南部战区机关及战区空军、海军机关官兵。

  不过,另一套位于复兴门外大街的“老破小”,单价为14.1万元,与该区域14.87万的均价有不小差距,由于该小区一向成交活跃,这样的降幅也堪称“捡漏”。但今年5月以来,交易频率显著降低,这套总价775万元的“捡漏房”挂牌一周,未能出手。

  路透社介绍称,印度根据汽车价值对电动汽车整车征收70%或100%的进口税,对在本地组装成电动汽车的进口汽车零部件征收15%或35%的进口税。不过,较低的进口税率只适用于进口电池组或电机等零部件,不适用于安装在车辆底盘的零部件。

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有