• 我的订阅
  • 头条热搜
...经历,陈先生没有多想,便扫描了该二维码,并按照页面提示输入身份证号码、联系电话、银行卡账号、银行卡密码等个人信息。在填写完成后,页面弹出了一个客服对话框,对方称陈先生将收到一个验证码,如需进行退税操作...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教...……更多
AI催生新工种,人类或将扮演AI“担保人”?
...量标准。现在还没有特别好的方法解决生成式大模型的“幻觉”(指生成貌似合理,但与世界知识不一致或无法验证的内容)问题,毕竟大模型本质上是一个概率模型,它犯错误的概率永远不为0。所以,审核模型的生成结果是...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
亚马逊推出“自动推理检查”工具,对抗 AI 幻觉
...科技(AWS)发布了一款新工具,旨在解决 AI 模型产生的幻觉问题。IT之家注意到,在拉斯维加斯举办的 re:Invent 2024 大会上,AWS 推出了“自动推理检查”(Automated Reasoning checks)工具,该工具通过交叉引用客户提供的信息来验证...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不会彻底摆脱幻觉和出错的问题,这是数学上已经证明的。“AI代...……更多
基于大模型的Arc Search:颠覆百度的AI搜索来了?
...基于这些内容生成答案,可以在一定程度上降低大模型「幻觉」带来的影响,在回答质量、准确性上也更多一些保证。图/雷科技实际上,这就和我们在 ChatGPT 等 AI 对话服务基于链接、图片、文件等进行对话来提升对话效率和质...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具难度。例如,大语言模型通常会生成冗长的回...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
奇安信发布《2024人工智能安全报告》:AI深度伪造欺诈激增30倍
...的应用机会或进行相关资金投入。IDC预测,2026年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。《报告》认为,“AI是一种通用技术,通用就意味着既可以用来做好事,也可以被用来干坏事”。...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中,o1不仅比GPT-4o强上一大截,甚至比人类专家还要凶猛。OpenAI对此曾表示:通往AGI的路上,已经没有任何阻...……更多
微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」
...推出了一项在Azure AI上的新服务——「校正」:人工智能幻觉的纠正工具现阶段阻碍生成式人工智能在现实中更广泛地应用落地的最大缺陷,就是「幻觉」(hallucinations)。幻觉是指缺乏基础数据支持的内容的生成,输出误导性...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
打开大模型的无限可能,云栖通道看AI产业应用
...如约开放。这是一个为广大AI产业从业者、创业者以及大模型开发者提供的专属交流平台。来自教育、智能体应用、智能驾驶、人形机器人等多个AI应用领域的科学家、开发者、技术代表等现场分享最新行业动态,与现场嘉宾进...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
...。中兴通讯总裁徐子阳认为,行业大模型的一大问题就是幻觉。他指出,AI如果作为助手没问题,但如果把AI当成一名雇员,它就不能犯错。他指出,对于工业等场景,AI应用的门槛比较高,企业也在探索新路径解决幻觉问题。上...……更多
AI写的小说,能打败网文大神吗?
...,问题更加繁复多元……”不久前,有风君跟某个国内大模型对话,请它以今年高考作文中的“人工智能”为话题写作,不到10秒钟,它就以《问海无涯,探索永恒》为标题,写下了一篇800多字的文章。有风君和AI的对话。可以...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明,大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多
AI老师上线?专家:通用人工智能将推动教育范式转变
...复杂,大模型在进行意图识别时不够准确;第二,大模型幻觉问题突出,如在一些历史人物类的常识问题中,可能会出现张冠李戴的现象,这对教育行业来说非常“致命”。陈建华认为,要解决这一问题,可以使用RGA系统进行“...……更多
...象,只能是客观化的表达。□提示词和参数的使用,是大模型技术背景下人工智能内容生成中独创性的具体化操作行为。提示词和参数的使用,是人类意志因素的体现,也是人工智能生成内容受著作权法保护的正当性基础,更是...……更多
谷歌发布Pixel Studio应用:基于Imagen 3模型,可本地AI生成图片
...xel Studio 应用采用本地运行生成,基于谷歌自己的 Imagen 3 模型,主要生成艺术风格的图片,而写实风格的图片效果比较差。以生成下面这张小猫为例,生成时间不超过 2秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...自身的技术能力,保证正确答案的输出。 与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开始,就采用了预训练阶...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
美国执念抹黑他国 恰似人工智能“幻觉”
“幻觉”,在人工智能领域是一个专业术语,被用于描述机器可能输出“无中生有”的内容。这样的“幻觉”也出现在一些美国政客身上,他们无中生有地污称中国用人工智能技术收集美国人数据。治疗这种“幻觉”,美国一...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
合肥疾控最新提示
...绞痛发作。2.中度中毒,患者出现胸闷气短、呼吸困难、幻觉、判断力下降、运动失调、嗜睡或者浅昏迷,口唇可呈樱桃红色。3.重度中毒,患者多迅速出现昏迷、呼吸抑制、肺水肿、呼吸衰竭或者心力衰竭,患者可表现为去皮...……更多
...报快递员负荷重希望给予理解我省发布快递业务旺季消费提示【本报讯】当前,受近期电商平台促销活动影响,全省快递处理量迅速增加,全省邮件快件业务量已进入高峰期。省邮政管理局相关负责人表示,邮政、快递企业正在...……更多
业内震动!马斯克与它公开叫板
...规模的生态,尤其是在大模型技术仍不成熟、存在诸如“幻觉”等严重问题时,“我们需要开发者社区的力量”。但他也强调,未来大模型的能力将继续进化,开源后的滥用与安全问题必须警惕。“在我看来,AI的治理问题不是...……更多
更多关于社会的资讯:
找人代查考研成绩收获“情绪价值”?当心丢了信息安全
2月24日随着各个省份陆续公布考研初试成绩网上也出现了一项新“业务”帮考生代查考研成绩你不敢查有人替你查还负责夸你或是安慰你因此有考生愿意为此付费不过
2025-02-26 18:41:00
从“开盲盒”到“秒匹配” 宁夏政策计算器累计推送12万次惠企提醒
中新网银川2月26日电 (记者 李佩珊)记者26日从宁夏科技厅获悉,自“宁夏政策计算器”平台2021年上线运行以来,已累计推送12万次惠企信息
2025-02-26 18:41:00
2月24日,全国各地陆续发布2025年硕士研究生招生考试(初试)成绩,引发热议。其中,不少网红博主考研上线,引发广泛关注
2025-02-26 18:47:00
一周前,京东为全职外卖骑手缴纳五险一金的消息,引发了一场关于灵活用工人员保障问题的大讨论,至今仍在持续发酵。据统计,中国灵活就业人员规模达2亿人
2025-02-26 19:17:00
南方电网普安供电局:积极响应快速抢修 保障电网安全运行
“喂,请问是供电局吗?我早上路过高阳村路口时发现电杆被撞裂了,担心会倒下来砸到人,你们赶紧派人来看看。”2月25日8时
2025-02-26 19:19:00
李子柒将亮相第五届消博会 举办首个品牌作品展
点击查看更多视频南海网2月26日消息(记者 王子遥)记者从2月26日举办的第五届中国国际消费品博览会筹备进展发布会上获悉
2025-02-26 19:25:00
2月26日,上游新闻记者从陆军军医大学西南医院获悉,该院呼吸内科近日接诊了多名睡眠呼吸暂停低通气综合征患者,其中较为严重的睡眠中1小时呼吸暂停达到了68次
2025-02-26 19:28:00
近日,法医秦明谈李威案受害者致死原因:被害人被强迫长时间处于一种姿势,肌肉过度劳累,引发横纹肌溶解综合征。据台湾媒体25日报道
2025-02-26 19:47:00
2月26日,2025年京津冀人社协同活动月在河北省石家庄市启动。人社部门安排专人护送,精心准备就业大礼包,集中“点对点”输送4车次200名劳动者到京津就业。(视频摄制:杨佳薇、张
2025-02-26 19:53:00
七旬老人乘车迷路 海口公交司机和民警暖心相助找家
南海网2月26日消息(记者 王小畅 通讯员 陈杰)25日上午,七旬老人罗女士独自外出,因年事已高,不慎迷路。在海口公交G7路司机王伟与民警爱心接力下
2025-02-26 19:59:00
萍乡经开区胡正清:基层医疗的生命守护者
江西手机报萍乡讯(陈文锋、刘芳)胡正清,男,1983年11月生,是一位从农村走出来的大学生。他现为萍乡经开区赣西肿瘤医院副主任医师
2025-02-26 20:07:00
中国多地竞逐“首发经济”新赛道
中新社北京2月26日电 (记者 刘育英)首次发布、首个门店、首次设立研发中心......中国多地首发经济发展势头强劲,成为拉动消费的重要生力军
2025-02-26 20:12:00
河南驻马店19岁女生小雨(化名)遭侵犯逃跑时落水,被嫌疑人阻挡其上岸至溺亡,目前案件有了最近进展。2月26日,澎湃新闻从小雨家属处了解到
2025-02-26 20:17:00
近日,重庆市渝北区公安分局交巡警支队龙山大队查获一起“离谱”的醉酒后驾驶机动车违法行为。2月15日7时许,渝北区公安分局交巡警支队龙山大队接报警称
2025-02-26 20:30:00
宁阳县第一人民医院超声引导下穿刺活检,让疾病诊断更精准、更安全
目前“超声引导下穿刺活检”术越来越多应用于临床为后续治疗提供精准诊断然而许多患者朋友对这项技术还不是很了解甚至有恐惧心理超声引导下穿刺活检您听说过吗
2025-02-26 20:37:00