• 我的订阅
  • 科技

微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」

类别:科技 发布时间:2024-10-12 09:51:00 来源:新智元

微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」

【新智元导读】近期微软的高层人员调动以及新工具的推出,可能暗示着其AI战略的转向。

微软已经有一段时间没有向外界透露任何有关GenAI的讯息了。

在减少对OpenAI技术依赖的过程中,GenAI本该是微软的重要战略,但科技媒体The information了解到的微软组织变革表明:

微软在自主开发和训练生成式人工智能上遇到了瓶颈。

而同期微软推出的AI相关的新工具,也佐证了其在生成式人工智能业务上的战略转向。

微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」

前途未卜的合成数据与蒸馏模型

今年的早些时候,微软似乎在对先前内部的一个名为「蒸馏」项目加倍投注。

这个项目的内容大致为先使用OpenAI的模型生成大量数据,然后再利用这些数据来训练类似ChatGPT的模型。

微软的目标是让这些模型在某些任务上几乎能达到与OpenAI模型相同的表现,这样微软就可以根据自身的需要,对自己开发的模型进行「公平市场价格」的定价和自由出售。

在人工智能的开发中,业内几乎都会使用某种形式的人工智能生成的训练数据,即合成数据。

作为OpenAI的主要资助者,微软拥有充分的自由来使用OpenAI的模型。

因此,微软的研究人员能够要求GPT-4生成数百万段与教科书质量类似的文本段落,包括文章和教科书风格的练习,这些练习附有解释的问答内容。

随后,微软便可以利用这些数据来训练一个较小但其性能表现与GPT-4相似的模型。

而大约从一年前开始,微软就通过提炼OpenAI的模型开发了Phi。

Phi不仅开源,运行成本也更低。

微软研究人员在他们的论文中表示,虽然Phi的规模要小得多,但其性能几乎可以与OpenAI的主要旗舰模型相媲美。

微软CEO纳德拉将Phi形容为微软在AI领域「掌握自己命运」的一种方式。

他向股东们表示,Phi在Azure上与投资公司贝莱德、阿联酋航空以及医疗软件公司Epic等客户进行了合作。

在某些情况下,特别是当问题相对简单、不需要复杂解答时,微软用Phi替代了OpenAI 的模型,例如在Bing等产品中取代GPT-4作为AI聊天机器人。

在Phi初步成功之后,今年一月,微软将负责Phi的首席研究员Sébastien Bubeck从微软研究部门调往一个专注于构建蒸馏模型的新组织。

同年三月,微软以6.5亿美元的协议聘请了Inflection的CEO 穆Mustafa Suleyman并让他负责公司的消费者AI业务后,Bubeck被调到了苏莱曼所管理的微软AI团队。

据两位知情人士称,他负责的是使用OpenAI的大型模型来生成训练数据。

然而,最近Bubeck已从Suleyman的团队离职,重新回到微软研究部门,并再次向研究主管Peter Lee汇报工作。

而在八月,负责将Phi模型添加到Azure和其他微软产品中的Misha Bilenko也离职前往了谷歌的DeepMind AI团队。

一位微软AI研究员认为,这些突如其来的人员变动可能表明,Suleyman将不再把合成数据和蒸馏视为部门的发展方向以及微软的首要目标。

另一方面,今年五月被寄予期望的大型模型MAI-1毫无消息,且Suleyman团队之后也再也没有公开发布过任何模型的情况,也佐证了这一战略转向。

微软现如今依然要依靠OpenAI的模型来支持自己的人工智能服务,据一些金融机构的预测,微软今年有望在Azure上通过转售OpenAI的模型获得超10亿美元的收入。

值得在意的是,微软近期推出了一项在Azure AI上的新服务——

「校正」:人工智能幻觉的纠正工具

现阶段阻碍生成式人工智能在现实中更广泛地应用落地的最大缺陷,就是「幻觉」(hallucinations)。

幻觉是指缺乏基础数据支持的内容的生成,输出误导性的信息。

这种现象尤其与大型语言模型( LLMs )相关。

在医学、自动驾驶等高风险领域,准确的信息至关重要。

虽然人工智能有潜力改善对重要信息的获取,但幻觉可能会导致误解,造成严重的后果。

虽然业内可以通过「过滤」来解决幻觉问题,但这种方法在输出的文本因内容被删减或屏蔽而变得不连贯时,会导致用户体验不佳。

而微软认为,在Azure AI内容安全的接地检测(groundedness detection)中引入的一项新功能——校正(correction),能够突破上述局限。

今年三月,微软在Azure AI引入了接地检测。它能够将人工智能的输出与原文档进行比较,以识别生成过程中的幻觉内容。

但在用户实际体验这项服务的过程中,一个疑问也随之产生:「对这些检测到的幻觉内容除了屏蔽之外,我们还能做什么?」

为了解决这个问题,微软在接地检测中引入了校正功能,让使用GenAI程序的用户能够遇到幻觉之前,实时识别和纠正幻觉。

但校正的运作,需要程序连接到用于文档摘要和给予RAG的接地文档。

之后,Azure AI上的接地检测将通过以下几步运行:

检测:首先,Azure AI内容安全会扫描AI生成内容中的无根据部分。

幻觉现象并不是一个完全有或完全无的问题,大多数无根据的输出实际上也包含了一些有根据的内容。

这就是为什么有根据性检测可以精确找到无根据内容的具体部分。

当无根据的内容被识别出来后,模型会高亮显示具体不正确、不相关或虚构的文本。

推理:在识别出无根据的段落后,模型会生成解释说明,说明为什么某些文本被标记。

这种透明性非常重要,因为它可以让用户明确无根据的点,并评估其不接地的严重性。

修正:一旦无根据的内容被标记,系统会实时启动改写过程。被标记为不准确的部分会被修改,以确保与相关数据源保持一致。

但如果该句子缺少任何与基础文件相关的内容,则可能会被完全过滤掉。

而在用户看到最初的无根据内容之前,修正就已经完成。

输出:最后,修正后的内容将返回给用户。

但微软强调,该工具提高的是人工智能生成的内容和源材料之间的一致性,它并不能保证生成的内容可以到达完美的准确性。

毕竟最根本的是数据来源的真实性和客观性。或许,这也是微软决定内部战略转向的原因。

而在构建值得信赖的人工智能的道路上,业界的开发者们还需要更多不同的尝试。

参考资料:

https://the-decoder.com/microsoft-unveils-ai-hallucination-correction-tool/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-12 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软研究人员正在测试其他ai模型
6月21日消息,就在GPT-4因征服标准化测试而登上头条时,微软研究人员正在对其他AI模型进行一种非常另类的测试——一种旨在让模型捏造信息的测试。为了治好这种被称为“AI幻觉”的
2024-06-22 09:31:00
涉捆绑销售 微软公司遭美联邦贸易委员会反垄断调查
...援引知情人士消息报道称,美国联邦贸易委员会已对美国微软公司启动反垄断调查,涉及微软、云计算服务与软件授权等方面。截至目前,微软暂未作出回应。涉捆绑销售 联邦贸易委员会调查微软
2024-11-30 15:30:00
openai公布gpt-4最新版本gpt-4模型
...未公布这个模型的参数量有多少。OpenAI表示,它使用的是微软(MSFT.US)Azure训练模型,微软已经向这家初创公司投资了数十亿美元
2023-03-15 23:12:00
微软、英伟达纷纷押注小模型,大模型不香了?
...着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B
2024-08-26 14:17:00
【科技早报】北大团队推出“职场神器”ChatExcel;今日头条状告今日油条败诉
...嵌入百度内部工作平台3. 苹果公司已注册Daily Cash商标4. 微软拟推出人工智能芯片,内部代号“雅典娜”5. 马斯克回应特斯拉上海工厂被爆克扣员工绩效:已知晓,将调查
2023-04-19 10:00:00
旧电脑安装win10系统告别卡顿,这个神器轻松搞定!
...得淋漓尽致……看得出来,确实不想让我们好过。也是,微软在进行win10更新开发的时候,要么忙于更新修复旧Bug,要么顺手制作制造一些新Bug,至于改善用户体验?抱歉,没有时间
2023-01-10 11:05:00
英伟达推出“护栏”软件 让AI聊天机器人不再胡说八道
... AI 模型编写自定义规则。据IT之家搜索了解,包括谷歌和微软支持的 OpenAI 等其他 AI 公司,也使用了一种称为强化学习的方法来防止 LLM 应用产生有害的输出
2023-04-26 10:44:00
别再担心了!微软高管也吐槽AI:太累了 根本学不过来
...国企业家论坛第25届年会于2025年2月21日至23日成功召开。微软(中国)有限公司首席技术官韦青受邀出席开幕式并发表了精彩演讲。在演讲中,韦青透露了他上周在美国进行的一次特
2025-02-22 10:30:00
chatgpt和谷歌搜索不必二选一!爆火开源插件神器
...索引擎结合起来的念头,这个插件背后的开发者,可能跟微软-OpenAI想得一样早。去年11月30日,ChatGPT正式亮相
2023-02-18 18:49:00
更多关于科技的资讯:
全程支持极客营创新 拟上市的嘉立创助力18项硬件原型完成开发
2025年8月上旬,一场为期5天的硬件创意盛会——2025极客营(首场硬件黑客松)在深圳科创学院成功举办。来自美国、英国
2025-09-04 08:34:00
原钻产量同比降11%+GIA分级升级 天然钻石稀缺性支撑价格体系
2025年上半年,全球钻石市场呈现显著结构性分化。在整体价格下行压力下,大克拉异形钻凭借独特稀缺性展现强劲韧性。6月拉斯维加斯JCK珠宝展高端展区人流如织
2025-09-04 08:39:00
浪潮通信信息亮相2025年南亚东南亚数字合作大会
近日,2025南亚东南亚数字合作大会在泰国召开。本次大会由云南省人民政府和泰国数字经济与社会部联合主办,以“促进区域数字合作
2025-09-04 10:01:00
浪潮通信信息亮相2025算网融合产业发展大会,数据中心产品荣获优秀案例
近日,以“开放、创新、融合、共赢”为主题的2025算网融合产业发展大会在北京召开。会上,浪潮通信信息申报的“浪潮预制模块化数据中心产品”
2025-09-04 10:02:00
中新经纬9月4日电 据路透社报道,法国数据保护机构周三表示,已对Alphabet旗下的Google(谷歌)处以3.25亿欧元(3
2025-09-04 10:04:00
河北新闻网讯(邓学军)近日,中国贸促会正式发布《中国好礼产业促进计划2025—2026年度推荐企业及产品名录》,承德避暑山庄旅游集团有限责任公司精心选送的“朕在凉快”折扇
2025-09-04 10:05:00
国产GEO工具破局者 小陌引擎在济南书写AI创新传奇
近日,在生成式AI重塑全球数字竞争格局的浪潮中,来自济南高新区齐鲁软件园的济南矩阵跃动智能有限公司,凭借自主研发的国内首个攻克大模型搜索优化难题的“小陌GEO对抗引擎”
2025-09-04 10:13:00
集萃智造产业化基地项目开工,开启规模化量产新篇章未来三年力争实现年产近万台智能机器人南报网讯(通讯员芦玲玲记者徐宁)记者昨天从江苏集萃智能制造技术研究所有限公司(以下简称“集萃智造”)获悉
2025-09-04 07:40:00
山东移动日照分公司携手山东鲜醇乳业打造5G智能工厂 全流程赋能乳业生产新标杆
鲁网9月3日讯在数字化浪潮推动传统产业转型升级的背景下,山东移动日照分公司助力山东鲜醇乳业有限公司成功入选《2025年5G工厂名录》
2025-09-03 17:12:00
当晚期肺癌患者仅需支付最低207元、最高千余元的保费,即可通过“穗新保”全额报销高达30万元的质子治疗费用,重燃高质量生活希望时
2025-09-03 17:13:00
山东移动日照分公司:数智转型,打造高端板材涂镀产业新标杆
鲁网9月3日讯日照市昱岚新材料有限公司招商引资项目总投资达 63 亿元,目标打造全国最具竞争力的马口铁生产基地。项目分三期建设
2025-09-03 17:14:00
短视频平台丰富了公众的日常生活,提供了公众所需的各类信息,近年来,越来越多的人通过短视频平台向公众传播医学知识,但这些内容并非全部真实可信
2025-09-03 21:24:00
夏末秋初求职盛宴,山东省人力资源市场喊你来“挑”工作啦!
金九银十求职季,山东省人力资源市场为广大求职者准备了一系列精彩纷呈的招聘活动,无论是刚踏出校园的应届生,还是寻求职业转型的职场人
2025-09-03 18:51:00
吉哒哒生炸鸡架盛唐荟店开业,凭差异化优势领跑行业
近日,炸鸡品类新势力——济南星瀚途旗下吉哒哒生炸鸡架盛唐荟店正式开业,持续引发市场关注。开业当日,现场食客络绎不绝,人气火爆
2025-09-03 18:57:00
豪米客鲜烤牛肉拌饭以特色引领韩式餐饮新潮流
当下餐饮行业竞争日趋白热化,同质化严重的赛道已难见增长红利,而那些能精准捕捉消费需求、构建独特记忆点的特色品类,正凭借差异化优势突围而出
2025-09-03 18:59:00