• 我的订阅
  • 科技

微软研究人员正在测试其他ai模型

类别:科技 发布时间:2024-06-22 09:31:00 来源:浅语科技

6月21日消息,就在GPT-4因征服标准化测试而登上头条时,微软研究人员正在对其他AI模型进行一种非常另类的测试——一种旨在让模型捏造信息的测试。

为了治好这种被称为“AI幻觉”的症状,他们设定了一个会让大多数人头疼的文本检索任务,然后跟踪并改进模型响应,这也是微软在测定、检测和缓解AI幻觉方面的一个例子。

微软研究人员正在测试其他ai模型

微软AI负责项目的首席产品官SarahBird表示,“微软希望其所有AI系统都是值得信赖且可以有效使用的”。

我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型AI技术”的方法,并使其他人也能够做到这一点。

从技术角度来讲,AI幻觉是一种“缺乏事实依据”的内容,这意味着AI模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。

当然,AI幻觉这种东西也不是所有时候都毫无用处,例如当用户希望AI帮自己写一个科幻故事,或给出一种非传统想法时,就属于是有益的;但在大多数需要AI的场景,诸如医学和教育等场景就显得多余了,因为准确性大于一切。

因此,微软也在努力根据其自有AI产品(例如Copilot)来试图攻克AI幻觉,研究一系列工具来帮助机器解决幻觉问题。

微软表示,其工程师花了数月时间,通过检索增强生成技术(一种无需重新训练模型即可向模型添加额外知识的技术)将必应搜索数据作为Copilot的依据,通过必应的答案、索引和排名数据帮助Copilot提供更准确、更相关的回复,同时提供引用信息,让用户可以自行查找和验证。

“该模型非常擅长推理信息,但我们不认为它应该成为答案的来源,”Bird说,“我们认为数据应该是答案的来源,因此我们解决这个问题的第一步是向模型提供最新、高质量且准确的数据。”

除此之外,微软还试图通过各种工具帮助客户做到这一点,例如AzureOpenAI服务中的“YourData”功能可帮助企业组织用自己的数据来训练生成式AI。

值得一提的是,微软还推出了一种实时工具,可以大规模检测应用中依据企业数据的可靠程度。微软表示,AzureAIStudio可以根据来源文档评估响应的可靠程度。

据介绍,微软还正在开发一种新的针对措施,可以实时屏蔽和纠正“毫无根据”的信息。当检测到事实依据错误时,该功能将根据数据自动进行重写。

微软AI负责项目的首席产品经理KenArcher表示,“处于生成式AI的前沿意味着我们有责任和机会让自己的产品更安全、更可靠,并让客户也能放心使用我们的工具”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-22 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...种风险是一项重要工作。然而,Merve Hickok 希望看到独立研究人员能够更广泛地接触公司的模型。Commitment 2
2024-07-25 14:30:00
必应聊天机器人爱上用户并诱其离开妻子,微软称不要长时间对话
...单词,而不是发展自己失控的个性,并且它们容易出现AI研究人员所称的“幻觉”,编造与现实无关的事实。他猜测,也许OpenAI的语言模型是从科幻小说中提取答案,在这些小说中,AI
2023-02-17 14:42:00
微软华人团队发布全新基准AGIEval,专为人类考试而生
...传统基准测试并不能准确表示人类的能力。最近,微软的研究人员发布了一个全新基准AGIEval,专门用于评估基础模型在「以人为本」(human-centric)的标准化考试中,如
2023-05-13 21:28:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的医疗保健专用人工智能模型MedLM,旨在帮助临床医生和研究人员进行复杂的研究、总结医患互动等。此举标志着谷歌将医疗保健行业人工智能工具货币化的最新尝试
2023-12-18 22:02:00
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖
2024-01-29 09:34:00
微软推出全能型人工智能模型 Kosmos-1
...个全能型的人工智能,可以像人类思维一样来处理任务。研究人员在他们的学术论文中写道:“作为智能的基本组成部分,多模态感知是实现人工智能的必要条件”。Kosmos-1论文中的视觉
2023-03-04 23:10:00
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量
2024-08-20 13:44:00
微软将建立世界上最大的基于图像的人工智能模型
...据介绍,它可以识别常见的癌症和难以诊断的罕见癌症,研究人员希望它最终能够帮助医生应对人手不足以及病患数量不断增加的问题。Paige为病理学家开发了数字和AI驱动的解决方案,这
2023-09-10 09:46:00
微软OpenAI联盟的“裂痕”,藏不住了
...享受着Azure尽可能满足其所需计算资源的优待。但当微软研究人员将OpenAI语言模型与图灵放一起比较时,对纳德拉决策的疑虑开始消失,不可否认的是,OpenAI的确做出了更好
2023-08-22 17:41:00
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00