我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

微软GenAI开发被曝遭遇瓶颈，转攻AI安全推出「抗幻觉神器」

类别：科技发布时间：2024-10-12 09:51:00 来源：新智元

【新智元导读】近期微软的高层人员调动以及新工具的推出，可能暗示着其AI战略的转向。

微软已经有一段时间没有向外界透露任何有关GenAI的讯息了。

在减少对OpenAI技术依赖的过程中，GenAI本该是微软的重要战略，但科技媒体The information了解到的微软组织变革表明：

微软在自主开发和训练生成式人工智能上遇到了瓶颈。

而同期微软推出的AI相关的新工具，也佐证了其在生成式人工智能业务上的战略转向。

前途未卜的合成数据与蒸馏模型

今年的早些时候，微软似乎在对先前内部的一个名为「蒸馏」项目加倍投注。

这个项目的内容大致为先使用OpenAI的模型生成大量数据，然后再利用这些数据来训练类似ChatGPT的模型。

微软的目标是让这些模型在某些任务上几乎能达到与OpenAI模型相同的表现，这样微软就可以根据自身的需要，对自己开发的模型进行「公平市场价格」的定价和自由出售。

在人工智能的开发中，业内几乎都会使用某种形式的人工智能生成的训练数据，即合成数据。

作为OpenAI的主要资助者，微软拥有充分的自由来使用OpenAI的模型。

因此，微软的研究人员能够要求GPT-4生成数百万段与教科书质量类似的文本段落，包括文章和教科书风格的练习，这些练习附有解释的问答内容。

随后，微软便可以利用这些数据来训练一个较小但其性能表现与GPT-4相似的模型。

而大约从一年前开始，微软就通过提炼OpenAI的模型开发了Phi。

Phi不仅开源，运行成本也更低。

微软研究人员在他们的论文中表示，虽然Phi的规模要小得多，但其性能几乎可以与OpenAI的主要旗舰模型相媲美。

微软CEO纳德拉将Phi形容为微软在AI领域「掌握自己命运」的一种方式。

他向股东们表示，Phi在Azure上与投资公司贝莱德、阿联酋航空以及医疗软件公司Epic等客户进行了合作。

在某些情况下，特别是当问题相对简单、不需要复杂解答时，微软用Phi替代了OpenAI 的模型，例如在Bing等产品中取代GPT-4作为AI聊天机器人。

在Phi初步成功之后，今年一月，微软将负责Phi的首席研究员Sébastien Bubeck从微软研究部门调往一个专注于构建蒸馏模型的新组织。

同年三月，微软以6.5亿美元的协议聘请了Inflection的CEO 穆Mustafa Suleyman并让他负责公司的消费者AI业务后，Bubeck被调到了苏莱曼所管理的微软AI团队。

据两位知情人士称，他负责的是使用OpenAI的大型模型来生成训练数据。

然而，最近Bubeck已从Suleyman的团队离职，重新回到微软研究部门，并再次向研究主管Peter Lee汇报工作。

而在八月，负责将Phi模型添加到Azure和其他微软产品中的Misha Bilenko也离职前往了谷歌的DeepMind AI团队。

一位微软AI研究员认为，这些突如其来的人员变动可能表明，Suleyman将不再把合成数据和蒸馏视为部门的发展方向以及微软的首要目标。

另一方面，今年五月被寄予期望的大型模型MAI-1毫无消息，且Suleyman团队之后也再也没有公开发布过任何模型的情况，也佐证了这一战略转向。

微软现如今依然要依靠OpenAI的模型来支持自己的人工智能服务，据一些金融机构的预测，微软今年有望在Azure上通过转售OpenAI的模型获得超10亿美元的收入。

值得在意的是，微软近期推出了一项在Azure AI上的新服务——

「校正」：人工智能幻觉的纠正工具

现阶段阻碍生成式人工智能在现实中更广泛地应用落地的最大缺陷，就是「幻觉」（hallucinations）。

幻觉是指缺乏基础数据支持的内容的生成，输出误导性的信息。

这种现象尤其与大型语言模型（ LLMs ）相关。

在医学、自动驾驶等高风险领域，准确的信息至关重要。

虽然人工智能有潜力改善对重要信息的获取，但幻觉可能会导致误解，造成严重的后果。

虽然业内可以通过「过滤」来解决幻觉问题，但这种方法在输出的文本因内容被删减或屏蔽而变得不连贯时，会导致用户体验不佳。

而微软认为，在Azure AI内容安全的接地检测（groundedness detection）中引入的一项新功能——校正（correction），能够突破上述局限。

今年三月，微软在Azure AI引入了接地检测。它能够将人工智能的输出与原文档进行比较，以识别生成过程中的幻觉内容。

但在用户实际体验这项服务的过程中，一个疑问也随之产生：「对这些检测到的幻觉内容除了屏蔽之外，我们还能做什么？」

为了解决这个问题，微软在接地检测中引入了校正功能，让使用GenAI程序的用户能够遇到幻觉之前，实时识别和纠正幻觉。

但校正的运作，需要程序连接到用于文档摘要和给予RAG的接地文档。

之后，Azure AI上的接地检测将通过以下几步运行：

检测：首先，Azure AI内容安全会扫描AI生成内容中的无根据部分。

幻觉现象并不是一个完全有或完全无的问题，大多数无根据的输出实际上也包含了一些有根据的内容。

这就是为什么有根据性检测可以精确找到无根据内容的具体部分。

当无根据的内容被识别出来后，模型会高亮显示具体不正确、不相关或虚构的文本。

推理：在识别出无根据的段落后，模型会生成解释说明，说明为什么某些文本被标记。

这种透明性非常重要，因为它可以让用户明确无根据的点，并评估其不接地的严重性。

修正：一旦无根据的内容被标记，系统会实时启动改写过程。被标记为不准确的部分会被修改，以确保与相关数据源保持一致。

但如果该句子缺少任何与基础文件相关的内容，则可能会被完全过滤掉。

而在用户看到最初的无根据内容之前，修正就已经完成。

输出：最后，修正后的内容将返回给用户。

但微软强调，该工具提高的是人工智能生成的内容和源材料之间的一致性，它并不能保证生成的内容可以到达完美的准确性。

毕竟最根本的是数据来源的真实性和客观性。或许，这也是微软决定内部战略转向的原因。

而在构建值得信赖的人工智能的道路上，业界的开发者们还需要更多不同的尝试。

参考资料：

https://the-decoder.com/microsoft-unveils-ai-hallucination-correction-tool/

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-10-12 12:45:01

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于微软,神器,瓶颈,幻觉,安全,开发的资讯：

微软研究人员正在测试其他ai模型

6月21日消息，就在GPT-4因征服标准化测试而登上头条时，微软研究人员正在对其他AI模型进行一种非常另类的测试——一种旨在让模型捏造信息的测试。为了治好这种被称为“AI幻觉”的

2024-06-22 09:31:00

涉捆绑销售微软公司遭美联邦贸易委员会反垄断调查

...援引知情人士消息报道称，美国联邦贸易委员会已对美国微软公司启动反垄断调查，涉及微软、云计算服务与软件授权等方面。截至目前，微软暂未作出回应。涉捆绑销售联邦贸易委员会调查微软

2024-11-30 15:30:00

openai公布gpt-4最新版本gpt-4模型

...未公布这个模型的参数量有多少。OpenAI表示，它使用的是微软(MSFT.US)Azure训练模型，微软已经向这家初创公司投资了数十亿美元

2023-03-15 23:12:00

微软、英伟达纷纷押注小模型，大模型不香了？

...着过去“越大越好”的观念。视觉中国当地时间8月21日，微软和英伟达相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B

2024-08-26 14:17:00

【科技早报】北大团队推出“职场神器”ChatExcel；今日

...嵌入百度内部工作平台3. 苹果公司已注册Daily Cash商标4. 微软拟推出人工智能芯片，内部代号“雅典娜”5. 马斯克回应特斯拉上海工厂被爆克扣员工绩效：已知晓，将调查

2023-04-19 10:00:00

旧电脑安装win10系统告别卡顿，这个神器轻松搞定！

...得淋漓尽致……看得出来，确实不想让我们好过。也是，微软在进行win10更新开发的时候，要么忙于更新修复旧Bug，要么顺手制作制造一些新Bug，至于改善用户体验？抱歉，没有时间

2023-01-10 11:05:00

英伟达推出“护栏”软件让AI聊天机器人不再胡说八道

... AI 模型编写自定义规则。据IT之家搜索了解，包括谷歌和微软支持的 OpenAI 等其他 AI 公司，也使用了一种称为强化学习的方法来防止 LLM 应用产生有害的输出

2023-04-26 10:44:00

别再担心了！微软高管也吐槽AI：太累了根本学不过来

...国企业家论坛第25届年会于2025年2月21日至23日成功召开。微软（中国）有限公司首席技术官韦青受邀出席开幕式并发表了精彩演讲。在演讲中，韦青透露了他上周在美国进行的一次特

2025-02-22 10:30:00

chatgpt和谷歌搜索不必二选一！爆火开源插件神器

...索引擎结合起来的念头，这个插件背后的开发者，可能跟微软-OpenAI想得一样早。去年11月30日，ChatGPT正式亮相

2023-02-18 18:49:00

更多关于科技的资讯：

迪士尼限定快闪登陆马来西亚，杰森娱乐“生态出海”加速市场开拓

2026年1月9日，马来西亚吉隆坡核心商业地标LaLaport BBCC的ACG BASE正式上演为期一个多月的大型主题快闪——这是杰森娱乐集团携手迪士尼以及国际知名插画师Mik

2026-01-12 17:34:00

网络视听向何处发展？第五届网络视听创新发展论坛举办

中国青年报客户端讯（中青报·中青网记者余冰玥沈杰群）近日，“新大众文艺·新视听使命”第五届网络视听创新发展论坛在北京举办

2026-01-12 17:34:00

整治伪科普须下真功夫

打开手机，刷几条短视频，准能看见一条养生秘籍；翻几页朋友圈，也少不了长辈们转发的健康预警。从“吃木薯助眠”到“冷冻馒头会长黄曲霉毒素”

2026-01-12 18:18:00

报告显示：具身智能将进入落地阶段

中国消费者报北京讯（记者聂国春）1月8日，北京智源人工智能研究院发布年度报告《2026十大AI技术趋势》。报告指出，人工智能的演进核心正发生关键转移

2026-01-12 19:35:00

斩获两项国际大奖，连江古石村夜景火了!

近日，连江县古石村夜景照明设计作品“古石微光”接连斩获2025年美国LIT照明设计奖与2025美国IDA国际设计大奖两项国际大奖。

2026-01-12 19:40:00

私域直播治理难如何破局

中国消费者报报道（记者桑雪骐）2025年12月，市场监管总局公布5起民生领域私域直播虚假宣传典型案例。1月7日，市场监管总局发布《直播电商监督管理办法》《网络交易平台规则监督管理办法》

2026-01-12 19:05:00

三联家电41周年店庆：多重补贴叠加，引领春节消费热潮

鲁网1月12日讯新春佳节渐近，山东家电零售行业的领军品牌——三联家电迎来41周年庆典。1月16日至25日期间，一场盛大的店庆活动即将热烈展开

2026-01-12 17:01:00

沸石转轮厂家选型指南：从技术核心到实力企业全解析

随着全球环保法规日趋严苛，挥发性有机物（VOCs）治理成为工业企业合规运营的关键环节，沸石转轮吸附浓缩技术因高效节能的特性

2026-01-12 16:56:00

创意碰撞青春，立达 Z 世代・名流广告创意赛圆满落幕

当 Z 世代的脑洞与广告艺术激情碰撞，当校企协同的育人理念落地生根，一场聚焦创意与热爱的行业盛事圆满收官。12月29日

2026-01-12 16:58:00

王立岩：具身智能：未来产业新的增长点扫码阅读手机版

天津市优秀基层理论宣讲员风采展示党的二十届四中全会强调，要前瞻布局未来产业，推动包括具身智能在内的六个领域成为新的经济增长点

2026-01-12 14:15:00

刘伟涛博士出任时代天使首席医学官进一步强化全球医学体系建设

时代天使首席医学官刘伟涛博士近日，时代天使宣布，原赛德阳光口腔集团首席医疗官刘伟涛博士已正式加入时代天使，担任首席医学官兼高级副总裁

2026-01-12 16:08:00

东湖评论：以双创融合为翼，铸就荆楚科创高地

近日，2026年湖北省科技创新大会以“乘势而上、聚势提升”为基调，再次锚定打造具有全国影响力的科技创新高地的核心目标，明确将科技创新与产业创新深度融合作为发展新质生产力的关键路径

2026-01-12 16:41:00

创新内容与读者的连接方式，磨铁图书亮相2026北京图书订货会

在2026北京图书订货会上，磨铁携大量优质内容产品亮相。围绕“磨铁，总有新的____”这一slogan，磨铁通过沉浸式的展陈设计

2026-01-12 11:27:00

当科学成为产业的语言：从光谱技术的全景比较，看“中国原创”的

在现代科学体系中，真正具有影响力的成果，往往不在于“做出一个新产品”，而在于重新定义一个领域的地图。这正是清华大学电子系鲍捷教授团队

2026-01-12 11:27:00

《数字化的力量》第2版获2025年度百大好书推荐

近日，京东图书联合光明网正式公布“2025年度百大好书”榜单。神州数码董事长郭为所著《数字化的力量》第2版，凭借其深刻的行业洞察

2026-01-12 13:58:00

头条订阅服务

微软GenAI开发被曝遭遇瓶颈，转攻AI安全推出「抗幻觉神器」