• 我的订阅
  • 科技

微软研究人员正在测试其他ai模型

类别:科技 发布时间:2024-06-22 09:31:00 来源:浅语科技

6月21日消息,就在GPT-4因征服标准化测试而登上头条时,微软研究人员正在对其他AI模型进行一种非常另类的测试——一种旨在让模型捏造信息的测试。

为了治好这种被称为“AI幻觉”的症状,他们设定了一个会让大多数人头疼的文本检索任务,然后跟踪并改进模型响应,这也是微软在测定、检测和缓解AI幻觉方面的一个例子。

微软研究人员正在测试其他ai模型

微软AI负责项目的首席产品官SarahBird表示,“微软希望其所有AI系统都是值得信赖且可以有效使用的”。

我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型AI技术”的方法,并使其他人也能够做到这一点。

从技术角度来讲,AI幻觉是一种“缺乏事实依据”的内容,这意味着AI模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。

当然,AI幻觉这种东西也不是所有时候都毫无用处,例如当用户希望AI帮自己写一个科幻故事,或给出一种非传统想法时,就属于是有益的;但在大多数需要AI的场景,诸如医学和教育等场景就显得多余了,因为准确性大于一切。

因此,微软也在努力根据其自有AI产品(例如Copilot)来试图攻克AI幻觉,研究一系列工具来帮助机器解决幻觉问题。

微软表示,其工程师花了数月时间,通过检索增强生成技术(一种无需重新训练模型即可向模型添加额外知识的技术)将必应搜索数据作为Copilot的依据,通过必应的答案、索引和排名数据帮助Copilot提供更准确、更相关的回复,同时提供引用信息,让用户可以自行查找和验证。

“该模型非常擅长推理信息,但我们不认为它应该成为答案的来源,”Bird说,“我们认为数据应该是答案的来源,因此我们解决这个问题的第一步是向模型提供最新、高质量且准确的数据。”

除此之外,微软还试图通过各种工具帮助客户做到这一点,例如AzureOpenAI服务中的“YourData”功能可帮助企业组织用自己的数据来训练生成式AI。

值得一提的是,微软还推出了一种实时工具,可以大规模检测应用中依据企业数据的可靠程度。微软表示,AzureAIStudio可以根据来源文档评估响应的可靠程度。

据介绍,微软还正在开发一种新的针对措施,可以实时屏蔽和纠正“毫无根据”的信息。当检测到事实依据错误时,该功能将根据数据自动进行重写。

微软AI负责项目的首席产品经理KenArcher表示,“处于生成式AI的前沿意味着我们有责任和机会让自己的产品更安全、更可靠,并让客户也能放心使用我们的工具”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-22 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...种风险是一项重要工作。然而,Merve Hickok 希望看到独立研究人员能够更广泛地接触公司的模型。Commitment 2
2024-07-25 14:30:00
必应聊天机器人爱上用户并诱其离开妻子,微软称不要长时间对话
...单词,而不是发展自己失控的个性,并且它们容易出现AI研究人员所称的“幻觉”,编造与现实无关的事实。他猜测,也许OpenAI的语言模型是从科幻小说中提取答案,在这些小说中,AI
2023-02-17 14:42:00
微软华人团队发布全新基准AGIEval,专为人类考试而生
...传统基准测试并不能准确表示人类的能力。最近,微软的研究人员发布了一个全新基准AGIEval,专门用于评估基础模型在「以人为本」(human-centric)的标准化考试中,如
2023-05-13 21:28:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的医疗保健专用人工智能模型MedLM,旨在帮助临床医生和研究人员进行复杂的研究、总结医患互动等。此举标志着谷歌将医疗保健行业人工智能工具货币化的最新尝试
2023-12-18 22:02:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖
2024-01-29 09:34:00
微软推出全能型人工智能模型 Kosmos-1
...个全能型的人工智能,可以像人类思维一样来处理任务。研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1论文中的视觉
2023-03-04 23:10:00
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量
2024-08-20 13:44:00
微软将建立世界上最大的基于图像的人工智能模型
...据介绍,它可以识别常见的癌症和难以诊断的罕见癌症,研究人员希望它最终能够帮助医生应对人手不足以及病患数量不断增加的问题。Paige为病理学家开发了数字和AI驱动的解决方案,这
2023-09-10 09:46:00
微软OpenAI联盟的“裂痕”,藏不住了
...享受着Azure尽可能满足其所需计算资源的优待。但当微软研究人员将OpenAI语言模型与图灵放一起比较时,对纳德拉决策的疑虑开始消失,不可否认的是,OpenAI的确做出了更好
2023-08-22 17:41:00
更多关于科技的资讯:
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00
壹家之言丨“中国味都”迈入香辛料全球数字贸易新时代
9月20日,山东乐陵杨安镇香辛料数智交易平台正式启动,标志着“中国味都”迈入香辛料全球数字贸易新时代。这场发生在鲁北小镇的产业变革
2025-09-21 19:39:00
第三届全国技能大赛丨零售项目选手陈俪夫:以双语匠心赴技能之约
第三届全国技能大赛赛场热潮涌动,零售项目比拼现场,来自长春科技学院英语专业的陈俪夫正全神贯注地完成她的国赛首秀。曾斩获“21世纪杯全国英语演讲比赛”季军的陈俪夫
2025-09-21 18:07:00