中新健康|复旦大学团队研发AI大模型 助视障者“看见”世界

来源: 国际在线
2024-06-20 11:30:02

  2023年上半年,复旦大学自然语言处理实验室发布了开发MOSS对话式大型语言模型,被称为中国版的GPT,仅用半年时间多模态模型“眸思”问世。据介绍,“眸思”和基于文本的MOSS不同,它能够理解并识别图片内容,致力于成为视障者的一双“眸”。

  基于“眸思”,“听见世界”APP为视障者日常生活需 求量身打造街道行走模式、自由问答模式和寻物模式。在街道行走模式中,“眸思”如一位忠实的向导。红绿灯、十字路口、障碍物……它能细致扫描道路情况,提示潜在风险,陪伴视障者安全通行“看不见”

  在自由问答模式中,“眸思”则像一位贴心的朋友,走进博物馆、艺术馆、公园……捕捉四周景象的每个细节,用声音构建丰富的生活场景,传递每一处日常之美。在寻物模式中,“眸思”将成为一名可靠的管家,被移动过的手杖、最爱口味的牛奶……它可以让视障人士找寻日常物件变得轻松。

  复旦大学自然语言处理实验室张奇教授说:“人工智能发展日新月异,科技应该要改变更多人的生活,希望‘眸思’能够帮助视障人士走出家门,让他们可以尝试更多工作,为人生书写更多可能。”据介绍,该项目的主导者都是“初出茅庐”的学生们,在组内头脑风暴会上,年轻学子总能提出开创性想法,能够找到另辟蹊径的解决办法。

  自去年9月以来,复旦大学自然语言处理实验室围绕GPT4-v复现多模态大模型,对核心关键点开展研究,希望提升单项任务的准确率和强化大模型的学习。为了更好地感受视障者的难处,团队成员模拟真实情境,蒙眼探索视障者“黑暗”世界。他们邀请视障人士加入,进一步摸清真实而具体的需求。

  在基于几亿张图片训练出“眸思”大模型基础上,针对视障者提出的各类需求,团队又用上万张图片进行特殊样本训练,使“眸思”具备能够适配更多场景的能力。据透露,今年上半年,团队将结合AR升级APP内的定位精度细化至亚米级别。下半年,团队希望将“眸思”升级为基于视频的判断。目前,更多模式正在开发中,比如,阅读模式、解说模式等。

  香香年满5岁,已经进入性成熟。福田丰说,“虽然不舍,但希望香香能努力适应环境,找到好伴侣、留下后代。”他介绍,发情高峰期是一个令人紧张的时期。由于发情高峰期只有半天到1天,要找到准确的时机把雌雄熊猫放在一起同居,非常困难。一旦错过时机就不可能完成交配,甚至在一起会打架。

  “在2022年取得的诸多成绩中,高技术、高附加值船舶的大量承接是中国船舶工业的最大亮点。”中国船舶工业行业协会秘书长李彦庆告诉《中国新闻周刊》,不仅是LNG运输船份额不断攀升,还有大量接单高端客滚船、风电安装船以及双燃料船舶等,中国造船产品结构不断调整,正向高端制造迈进。

  相较于王力、步阳等大型企业,许多中小企业招聘情况则不如人意。春节后,一家户外箱包制品企业的行政部经理袁永华就泡在了工厂附近的劳务市场里招人。他的工厂需要招40名装配工、30名组架工,以及冲床工、包装工、清洁工等数十名一线员工。这些装配工每天工作八九个小时,薪水完全按计件制,每月薪水多在5000~8000元之间。袁永华的工厂里,目前还有至少20%的人员缺口,尤为缺乏的是25岁以下的年轻人。

  难题接踵而至。国内从未设计建造过符合英国劳氏船级社规范的船舶,没有任何资料,没有相关图纸,但时间紧迫,要7天完成报价设计,38天完成合同设计,33天完成技术设计中的送审图纸。考虑到费用、时间、技术积累等问题,设计团队放弃了从国外购买图纸的方案,决定自主绘制,由上海船舶及海洋工程设计研究院负责。

  完全我个人的观点,我觉得里面分量最重的,可能是王毅的这句话——根据外交部通稿,王毅告诉普京:中俄的战略伙伴关系,从不针对第三方,当然也就不受任何第三方的干扰和挑拨,更不会被第三方的胁迫和施压所压倒。

  一切在六年前就已有了征兆。2016年实行“全面二孩”政策后,人口堆积效应在短期内释放完毕,继2016年短暂的生育高峰后,从2017年起,全国出生人口持续下滑,从1723万人减至2022年的956万人,首次跌破1000万人,还不到20世纪90年代初期2000多万的新生人口的一半。

邓静宜

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有