• 我的订阅
  • 头条热搜
大模型像“文科生”?业内人士在沪“论战”
...技术负责人张涛则认为,大模型在做辅助工作,并且有“幻觉”(看似合理但实际错误的现象)等缺点。但他认为,人无完人,知识非常渊博的人也会有盲区,要求大模型做一个完美助手,是不太现实的。RWKV元始智能COO罗璇认为,...……更多
OpenAI「补票」AI 搜索,SearchGPT 没有野心
...人质疑。尽管生成式搜索被认为是未来的搜索模式,但其幻觉问题仍然限制其发展。当地时间 7 月 25 日,OpenAI 宣布推出由 AI 驱动的搜索引擎 SearchGPT,并开启邀请测试,标志着 OpenAI 正式进军搜索引擎市场,直接对打谷歌、Bing...……更多
埃隆・马斯克推出grok聊天机器人
...异之一。然而,就像所有AI聊天机器人一样,Grok也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括ChatGPT。近日,一个Grok尴尬的“幻觉”在社交媒体上引起热议。...……更多
专家:openai语音转写工具存在重大缺陷
...家指出,这些生成的文本(IT之家注:业内通常称为“AI幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。专家们认为,这一问题尤其令人担忧,因为Whisper已被广泛应用于全球多个行业,包括用于翻译和转录访谈内...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...前,对于192k token以内的请求,百川智能可以实现100%回答精度。“我们的长窗口能够做到全绿,相当于能完全不遗漏地把192k里的信息全部召回。”王小川表示。并且,结合搜索系统,Baichuan-2能够获取的原本文本规模提升了两个...……更多
OpenAI入局AI搜索 SearchGPT演示中“翻车”
...Bard出糗的一幕,犯下了事实性错误。从技术角度看,“AI幻觉”(即AI编造语句通顺但事实逻辑错误的答案)仍是业界的一大难题。SearchGPT的发布彰显出OpenAI向搜索引擎扩张的野心,不过伟大的愿景往往伴随着巨大的资金需求。...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...与Claude 2相比,Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力,Claude 3可以理解图表、图形、报告等文件,并从中提取数据。▲Claude 3的多模态能力在准确率方面,Claude 3大幅改善了...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。合合信息的思路是,从“炼丹”源头的燃料出发,通过标准化平台进行语料结构化,提高数据预训练效率,帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多
...语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将AI大模型的幻觉率降低了40%,有助于大模型变得更有“人味”,理...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据,还能有效训练模型运用思维链进行推理思...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;与此同时,以昇腾AI为核心,软硬件协同优化,构建算力集中、协同优化、供给稳定、数据...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...为科研助手方面非常有前景,但也面临着重大挑战,包括幻觉、过于依赖过时的预训练数据,并且缺乏透明的信息出处,条条对科研领域都是重大弊病。就拿幻觉来说,实验中让GPT-4引用最新文献时,它在CS、生物医学等领域伪...……更多
库克:苹果智能取得重大突破 但无法回避AI幻觉
...展,但一些人工智能存在问题,苹果也无法回避,比如AI幻觉问题。AI幻觉是指AI在某些时候的盲目自信情况,其会相当自信的给出用户某个问题的答案,但其所提供的回答完全子虚乌有。库克承认这种情况也可能发生在苹果智能...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...当我们惊叹于大语言模型竟然能够流畅地与我们对话时,幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域,在AI扩图和AI视频生成中也屡...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
...回答人们提出的问题,这就导致它们经常胡编乱造,即AI幻觉。里德对此表示,AI概览通常不会 “产生幻觉”,也不会像其他大语言模型产品那样胡编胡造,因为它们与谷歌的传统搜索引擎更紧密地结合在一起,只显示最权威或...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...。问:在金融、医疗等这些比较严谨的领域,生成式AI的幻觉问题,怎么破解?李彦宏:今天,应该说你会很少发现幻觉问题了,尤其是用最大规模、最强大模型的时候,已经很少出现幻觉问题了。为什么呢?一开始,纯粹用原...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...确度,但 Grobid 解析和更大的块并没有显著提高 LitQA2 的精度、准确度或召回率(下图 6)。 总结科学主题为了评估 PaperQA2 的摘要功能,研究者设计了一个名为 WikiCrow 的系统。该系统通过结合多个 PaperQA2 调用来生成有关人类蛋...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理,但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词,而非真正理解信息。因此,LLM可能会自...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
奥尔特曼X上发“草莓” 网友疯狂猜测:这难道是GPT新模型
...究”。此外,草莓的研究方向则是与人工智能无法规避的幻觉问题相关。目前的人工模型在面对常识性问题时常常无法识别正确的逻辑,从而导向幻觉,并生产出虚假的内容。“草莓”等于GPT5?从奥尔特曼最新发帖下面的评论...……更多
...创新机会。”杨瑞荣说。两大挑战包括,第一大模型存在幻觉问题。看似流畅自然的表述,实则不符合事实或者是错误的。“日常生活的交流中,人们对大模型幻觉的容忍度相对较高。但在崇尚严谨的医疗领域,这是致命的弱点...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...式组织输出,例如,JSON、YAML或Markdown格式的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提...……更多
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
...调用(例如 LinkedIn 人物搜索、Bing API 等)。生成:面向精度的步骤,筛选检索到的噪声数据,对其进行过滤并生成最终响应。图 1:处理用户查询的简化 pipeline。KSA 代表「知识共享智能体」,是数十种可以处理用户查询的智能...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...解决这一问题。星火图文识别大模型具备对复杂板面的高精度解析,融合篇章语义的文字识别功能,以及覆盖多领域的专业符号识别等特点。借助该技术,讯飞星火可以实现对多媒体信息的深入理解,显著提高用户获取知识和学...……更多
谷歌人工智能聊天机器人正在使用bard
...型的一些存在已久的问题,比如他们有编造东西或“产生幻觉”的倾向。但我最担心的是,正如我今年早些时候所写的那样,它们可能带来安全和隐私灾难。科技公司正在将这项存在严重缺陷的技术交到数百万人的手里,并允许...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...强大模型理解能力,减少幻觉,对齐人类意图,将大模型精度提升至80%。持续的数据监控和质量控制是保证训练结果可靠性的关键。在专利大模型领域,目前市场上还没有比较全面、专业、完整的评估体系。智慧芽率先建立了Pat...……更多
更多关于科技的资讯:
人工智能AI机器狗亮相贵州西江千户苗寨
本文转自:人民网-贵州频道1月2日,“人工智能AI机器狗互动体验”展示活动在贵州西江千户苗寨景区精彩启幕,吸引众多游客前来参与体验
2025-01-04 15:36:00
全球首个光电融合确定性新型算网基础设施在南京开通
本文转自:人民网-江苏频道活动现场。人民网 王丹丹人民网南京1月4日电 (王丹丹)基于CENI设施的全球首个光电融合确定性新型算网基础设施昨日开通
2025-01-04 17:12:00
太原酒厂5G赋能生产驶上“高速路”
1月4日,太原酒厂5G全连接成装车间一派繁忙。该厂日前对多条生产线进行了5G数字化改造,通过加装环境传感器、OCR高速摄像机等智能化装备
2025-01-04 18:20:00
当AI被运用于内容生成,普通人将如何应对发展热潮
中国青年报客户端讯(中青报·中青网记者 沈杰群)1月4日,国内首档人工智能应用科学竞演节目《未来中国》AI季第三期在东方卫视播出
2025-01-04 18:47:00
得物App借势国潮创新,打造多元化消费场景
随着2025年春节的脚步日益临近,对于年轻人而言,以国潮为代表的线上消费即将迎来新一波高峰。国潮,这一融合了传统文化元素与现代设计理念的潮流趋势
2025-01-04 19:41:00
1月4日消息,山西建投三建集团在北京国际大数据交易所完成“建筑施工劳务评价数据集”数据资产登记,完成数据资产入表,成为全国首个建筑施工劳务数据入表企业
2025-01-04 19:53:00
韩国五大整车厂2024年本土销售135.88万辆:16年来最低
快科技1月4日消息,韩国五大整车厂商(现代、起亚、韩国通用、雷诺韩国、KGM)发布了2024年的销售业绩,韩产汽车全球总销量为794
2025-01-04 14:15:00
云南人真的猛 把蚂蚁下锅!打赌你不敢吃
在菜肴中加点柠檬汁、番茄酱、芝麻酱等来增添风味,多数人都可以接受,但如果说加点蚂蚁呢?有人可能就要“yue”了吧...
2025-01-04 14:15:00
官方揭秘诈骗新套路:骗子开始先给你转钱了
快科技1月4日消息,如今诈骗分子的骗局手段越来越丰富,年底大家一定要提高警惕。据央视新闻报道,近日江苏连云港东海县的李女士在网上认识了一名“网友”
2025-01-04 14:15:00
“贵州好物 安顺臻品”线上商城小程序上线
本文转自:人民网-贵州频道人民网安顺1月4日电 (记者高华)1月3日,“贵州好物 安顺臻品”线上商城小程序启动仪式在安顺市西秀区举行
2025-01-04 14:41:00
男子9个月坐933次地铁居全市第一 获赠一辆车
快科技1月4日消息,日前洛阳地铁公布2024“绿色出行联盟”活动获奖名单,颁发2024“绿色出行联盟”全年大奖。一名28岁的男子9个月乘地铁933次
2025-01-04 14:45:00
周鸿祎:我也要送车 什么车大家算了算
快科技1月4日消息,周鸿祎发文称,自己被黄子韬卷到了,“我(送5台平板电脑)被批评太抠门,我成了黄子韬送车的唯一牺牲品”
2025-01-04 14:45:00
理想汽车2024年度用车报告公布:纯电里程占比超6成
快科技1月4日消息,今天理想汽车2024年度用车报告出炉。2024年理想汽车交付了超过50万辆新车,平均每分钟交付一辆
2025-01-04 14:45:00
蛇年纪念钞太火爆!有人转手就赚150%
快科技1月4日消息,2025年蛇年贺岁纪念币和纪念钞昨日开启了首个兑换日,引发了广泛关注与热烈追捧,其二手市场价格迅速翻倍
2025-01-04 15:15:00
经常点外卖的人 后来都怎么样了 这个结果真没想到
武汉科技大学医学院最近发表了一项最新研究报告,说在外就餐会让人死亡风险大幅度增加。该研究对 3.5 万名 20 岁以上成年人进行饮食习惯的访谈调查发现
2025-01-04 15:15:00