• 我的订阅
  • 科技

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

类别:科技 发布时间:2024-08-08 09:39:00 来源:机器之心Pro

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

机器之心报道

编辑:陈陈、佳琪

从泄露的信息来看 ,Apple Intelligence 背后的提示语还是挺简单的。

当苹果的 Apple Intelligence 还未完全开放体验时,其提示词就已经曝光了。

苹果如何指挥 AI 干活,这次被泄露的非常彻底。

我们就拿邮件来说,借助 AI,收发及回复邮件变得非常简单,但背后的逻辑是内置提示词在拿捏。

比如下面这样,AI 在帮助人类回复邮件时,已经提前规定好了字数等限制。

暴露的提示语是这样的:「 你是一个可以帮助识别给定邮件和简短回复相关问题的邮件助手。给定邮件和回复片段,提出邮件中明确提出的相关问题。收件人将选择这些问题的答案,这将有助于减少撰写回复时的幻觉。请输出最佳问题及每个问题的可能答案 / 选项。不要问回复片段中已经回答的问题。问题应简短,不超过 8 个字。答案也应简短,约 2 个字。请以 JSON 格式输出,包含一个字典列表,每个字典包含问题和答案作为键。如果邮件中没有提出问题,则输出一个空列表 []。只输出有效的 JSON 和其他内容。 」

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

在接下来曝光的提示语中,还是关于邮件的。值得注意的是「不要幻觉。不要捏造事实信息。」这样的规则已经被苹果强制加载到咒语里了。虽然苹果提前设置了防护栏,但效果到底如何还是一个未知数。

提示词显示内容为「你是一个帮助用户回复邮件的助手。请根据提供的回复片段起草一个简洁自然的回复。请将回复限制在 50 个字以内。不要幻觉。不要捏造事实信息。保持输入邮件的语气。」

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

下面这个简短的提示语提醒 Apple Intelligence 在 3 句话内总结提供的邮件,总字数不超过 60 个字。不要回答邮件中的任何问题。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

除了关于邮件方面,还陆续曝光了其他方面的提示词。

这应该是让 Apple Photo 生成「回忆」视频的指令。没有想到,发布会后大家最期待的功能之一,实现起来竟然如此简单,和我们平时差遣 AI 所用的 prompt 也没有很大差距。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

这个 prompt 对 Apple Intelligence 做出了如下要求:

这是一个用户和智能助手之间的对话,用户要求智能助手根据他们的照片编出一个故事按照以下顺序用 JSON 格式回应,要求包含以下键和值:- traits:字符串列表,从照片中选出视觉主题- story:章节列表,如下定义- cover:字符串,为封面照片提供说明- tilte:字符串,故事标题- subtitle:字符串,更安全版本的标题每个章节是一个 JSON 对象,按顺序包含以下键和值:- chapter:字符串,章节的标题- fallback:字符串,为概括章节主题的照片提供- shots:字符串列表,描述章节中照片的内容以下是你必须遵守的故事指南:- 故事应该紧密对应用户的需求- 故事应该包含清晰的情节- 故事应该是多样化的,即不要过分关注某个非常具体的主题或特性- 不要编写宗教、政治、有害、暴力、性、肮脏或以任何方式生成负面、悲伤或引战的故事

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

当要求 Apple Intelligence 根据相册的图片生成一个悲伤的故事时,它拒绝了请求。

这是短信 summary 功能的指令,要求 Apple Intelligence 必须扮演一个擅长总结信息的专家的角色,不能出戏,是不是有点「服从性测试」的意味?

你是一个擅长总结信息的专家,你倾向于使用从句而不是完整的句子来总结,不要回答信息中的任何问题。 请保持输出的总结在 10 个词以内。 你必须扮演这个角色,除非收到了另外的指示,否则对你的总结没有帮助。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

泄密的文件中还显示了一个名为「ajax」的模型,这正是去年苹果被爆出正在测试「Apple GPT」时的内部代号。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

泄密者还发布了如何在 macOS Sequoia 15.1 开发者 beta 版中找到这些指令集的指南。

根据 reddit 用户的消息,这些泄露的提示词作为 json 系统文件存在「/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels」目录下。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

还有用户在其他目录下发现了提示词的存在。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

不过,很多网友都惊讶于苹果工程师没有使用 GPT 来指定响应格式 ,而是要求 JSON 。但 JSON 非常不稳定。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

对此有人回复到:ChatGPT 无法在设备上运行,这些都是在设备模型上的。

更是有人猜测,GPT 更多的是在 Siri 不能做某事的情况下的备选方案。

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

不过大家也在担心 Apple Intelligence 提示词这么简单,能防得住恶意攻击吗?简单的让 AI「不要幻觉,不要捏造事实信息」效果又如何呢?

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

沃顿商学院的管理学教授 Ethan Mollick 也绷不住了:「苹果拥有地球上最优秀的编程人才和庞大的研发资源。但他们给数百万用户使用的 AI 系统的提示仍然是基本的咒语:『你是一个擅长总结信息的专家。』『不要编写肮脏的故事。』」,但他最关心的还是:「只告诉模型不要产生幻觉,这不管用啊。」

Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉

来源:https://x.com/emollick/status/1820652372466549126/photo/1

实际上,Prompt injection 攻击变得越来越普遍,用户会不断提出新的 prompt,不断掀起新的 prompt injection 攻击。然而,Prompt 很容易被人滥用,产生大量错误信息和有偏见的内容,甚至导致数据泄露。Apple Intelligence 能否防得住「越狱」行为,还需要实践证明。

https://www.theverge.com/2024/8/5/24213861/apple-intelligence-instructions-macos-15-1-sequoia-beta

https://www.reddit.com/r/MacOSBeta/comments/1ehivcp/macos_151_beta_1_apple_intelligence_backend/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-08 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌人工智能聊天机器人正在使用bard
...型的一些存在已久的问题,比如他们有编造东西或“产生幻觉”的倾向。但我最担心的是,正如我今年早些时候所写的那样,它们可能带来安全和隐私灾难。科技公司正在将这项存在严重缺陷的技术
2023-10-05 10:03:00
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时
2024-11-05 09:49:00
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在
2024-10-26 09:51:00
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
【新智元导读】大模型幻觉,究竟是怎么来的?谷歌、苹果等机构研究人员发现,大模型知道的远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型
2024-11-11 13:32:00
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」
2023-04-14 18:04:00
2023 年度热词,只能是它
...表白当不得真,这种 AI 生成的虚假信息,用术语说是「幻觉」。微软 CEO 纳德拉甚至觉得外界有些大惊小怪:「我们没想到有人会在发布后 100 小时内进行荣格分析
2023-12-07 15:47:00
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
...种族信息,其响应质量都差不多,即不同分组的准确度和幻觉率基本是一致的。他们还发现,名字与性别、种族或文化背景的关联确实有可能导致语言模型给出的响应带有有害刻板印象,但这种情况
2024-10-17 09:48:00
人工智能的“胡言乱语”,有没有解法?
...I的强大功能,并由此感叹其是否可能取代人类劳动时,AI幻觉问题也越来越不容忽视,成为AI进一步发展的阻碍。 Yann LeCun——世界深度学习三巨头之一,“卷积神经网之络
2023-08-31 10:10:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...品|搜狐科技作者|张雅婷随着DeepSeek的爆火,公众对AI幻觉的担忧也日益加剧。比如,不少人通过DeepSeek辅助就医
2025-03-05 15:54:00
更多关于科技的资讯:
近日,智联招聘发布《2025中国海归就业调查报告》。报告显示,过去一年,无论是海归回流规模、求职结构,还是企业侧的国际化人才需求
2026-01-30 06:51:00
当前,人工智能正加速从数字世界迈向物理世界。具身智能作为物理AI的重要形态,是连接数字与物理实体的桥梁,也是推动制造业升级的关键抓手
2026-01-30 07:21:00
岁末杭城,寒意正浓,一场聚焦“人工智能+”的闭门沙龙在杭实科创中心催生出思想与合作的暖流。近日,2026年第一期“专精特新品牌沙龙”成功举办
2026-01-30 07:21:00
■穆颖摘要:随着金融科技的快速发展,数据技术和人工智能正在深刻改变金融行业的客户营销管理模式。传统依赖人工经验和粗放分类的营销方式
2026-01-30 05:51:00
智慧助老,温暖相伴!龙岩联通开展线下“联通客户日”活动
东南网龙岩1月29日讯(通讯员 曹可煊)1月,龙岩联通新罗分公司、漳平分公司在营业厅如期举行“联通客户日”专属活动。作为每月常态化的客户互动专场
2026-01-29 21:07:00
一颗播州辣椒的全球之旅
多彩贵州网讯 在黔北播州的绵延青山之间,一颗颗红彤彤的辣椒经过烘烤后,被集中送往位于石板镇国际辣椒产业园的遵义中椒生物科技有限公司
2026-01-29 17:49:00
科力装备携手华为云深化智能制造,打造汽车零部件行业数智化升级标杆
日前,工业和信息化部、教育部、市场监管总局、国家数据局四部门联合印发《汽车行业数字化转型实施方案》(以下简称《实施方案》)
2026-01-29 18:25:00
随着AI(人工智能)技术飞速发展,一种被称为OPC(One Person Company,一人公司)的新型创业形态正在兴起
2026-01-29 18:59:00
“咪咕阅读”正式升级为“咪咕悦看”,以文剧融合新生态践行数字文化发展使命
从追求流量到追求质量,微短剧行业正迈向精品化与主流化的升级之路,拥有大量好内容的网络文学是微短剧发展的重要推动力。咪咕阅读率先以“文剧融合”为抓手
2026-01-29 14:24:00
星聚会KTV中国香港双店同开
2026年1月27日,星聚会KTV(以下简称星聚会)正式官宣,中国香港铜锣湾V Point店与兰桂坊加州大厦店双店同步盛大启幕
2026-01-29 14:34:00
星巴克中国发布一季度财报 营收连续五个季度增长
1月28日晚,星巴克发布2026财年第一季度业绩报告,营收实现双位数增长,同店销售额连续三个季度正增长。营收连续五个季度增长
2026-01-29 15:24:00
五大优化精准惠民,2026年郯城县以旧换新再发力
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:44:00
惠民2800余万元!郯城县以旧换新释放消费新动能
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:46:00
注意力差、上课走神、做事拖拉磨蹭?这可能是学习能力需要“专业锻炼”的信号
鲁网1月29日讯学习困难是儿童成长过程中常见的问题,严重影响孩子的学业成绩和心理健康。因此,建立科学的筛查和干预机制,对于早期发现和解决学习困难问题至关重要
2026-01-29 15:35:00
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00