• 我的订阅
  • 头条热搜
大幅减缓幻觉 百融云创大模型精度测评结果出炉
近日,百融云创大模型参加一场“考试”,并取得了行业领先的成绩,多项指标优于ChatGPT3.5。随着各类大模型的相继问世,如何去评估大模型的性能变得越来越重要。百融云创参加的这场“考试”名叫检索增强生成基准测评,...……更多
美国执念抹黑他国 恰似人工智能“幻觉”
“幻觉”,在人工智能领域是一个专业术语,被用于描述机器可能输出“无中生有”的内容。这样的“幻觉”也出现在一些美国政客身上,他们无中生有地污称中国用人工智能技术收集美国人数据。治疗这种“幻觉”,美国一...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
...。尽管大模型是划时代的技术突破,但现阶段并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百业必须要面对的挑战。百川智能CEO王小川说,搜索增强是大模型落地应用的关键,能够有效解决幻觉、时效性...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
2023金融大模型报告|智能交易:求解知易行难
...。这包括但不限于建立合适的模型评估机制、提高模型的精度和可解释性、加强数据的安全性和合规性等。北京商报记者 宋亦桐 ……更多
埃隆・马斯克推出grok聊天机器人
...异之一。然而,就像所有AI聊天机器人一样,Grok也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括ChatGPT。近日,一个Grok尴尬的“幻觉”在社交媒体上引起热议。...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...前,对于192k token以内的请求,百川智能可以实现100%回答精度。“我们的长窗口能够做到全绿,相当于能完全不遗漏地把192k里的信息全部召回。”王小川表示。并且,结合搜索系统,Baichuan-2能够获取的原本文本规模提升了两个...……更多
...语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将AI大模型的幻觉率降低了40%,有助于大模型变得更有“人味”,理...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;与此同时,以昇腾AI为核心,软硬件协同优化,构建算力集中、协同优化、供给稳定、数据...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...当我们惊叹于大语言模型竟然能够流畅地与我们对话时,幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域,在AI扩图和AI视频生成中也屡...……更多
...创新机会。”杨瑞荣说。两大挑战包括,第一大模型存在幻觉问题。看似流畅自然的表述,实则不符合事实或者是错误的。“日常生活的交流中,人们对大模型幻觉的容忍度相对较高。但在崇尚严谨的医疗领域,这是致命的弱点...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...强大模型理解能力,减少幻觉,对齐人类意图,将大模型精度提升至80%。持续的数据监控和质量控制是保证训练结果可靠性的关键。在专利大模型领域,目前市场上还没有比较全面、专业、完整的评估体系。智慧芽率先建立了Pat...……更多
谷歌人工智能聊天机器人正在使用bard
...型的一些存在已久的问题,比如他们有编造东西或“产生幻觉”的倾向。但我最担心的是,正如我今年早些时候所写的那样,它们可能带来安全和隐私灾难。科技公司正在将这项存在严重缺陷的技术交到数百万人的手里,并允许...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...常提到的技术挑战固然重要,但更为核心的问题在于机器幻觉和合规风险。 机器幻觉是指大模型在学习海量数据后,可能会根据对前文内容的理解“编造”出一些“无中生有”的内容。在容错率较低的金融领域,这种幻觉会直...……更多
2024年最重要的趋势,可能影响你的工作
...个重大的技术挑战。(图/unsplash)第二个重大的困境是AI幻觉。因为AI是一种概率模型,所以它不可避免地会出现幻觉。这种幻觉既是好事,也是坏事。好事就是它代表了AI具有想象力和融合性,有组合式创新和增量式创新的能力...……更多
...》杂志上。基于人工智能的工具(例如LLM)有时受制于“幻觉”,导致作出看似合理但实际是错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得利用LLM应对复杂问题成为可能。这些问题一般需要可验证且...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。但...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
汉王科技发布天地大模型:适用于古文、法律、教育等多个领域
...汉语大模型杜绝了通用大模型最容易产生的代词错乱甚至幻觉的场景,完成了开放式问答的任务。法律大模型的演示环节,通过劳动问答、婚姻问答、法考问答三个领域的开放性问答演示,结果表明,法律大模型不仅具备专业知...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。图片来自岩芯数智...……更多
2023金融大模型报告|重塑金融科技
...用对业务进行实际支持。 在消费金融领域,通用大模型精度不够、金融专业知识缺失,以及难以满足消费场景中大量定制化需求等问题,成为当前亟待解决的难题。对此,招联消费金融与中山大学联合研发推出开源金融大模“...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
2023金融大模型报告|智能风控:荆棘中有玫瑰
...场风险管理的准确性和全面性”。由于保险业对信息的高精度的要求和严苛的数据合规要求,元保保险经纪(北京)有限公司负责人也同样指出,大模型可以协同进行更总结性的监控,判断异常的交易频率规模,判断是否存在内...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...,大模型的输出标准相对比较模糊,当前阶段存在模型\'幻觉\',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛盾。针对此难点有两点建议:第一,建议大模型与小模型搭配,运用行业专业领域数据结合...……更多
...切入口。AI时代,是触手可及的未来,还是望山跑死马的幻觉?未来的问题,要回到现实寻找答案。比预想中更快的,是大模型的整体竞争,已经走向应用与落地的新赛段。我们需要找到一个链接现实与数字世界的载体,作为未...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
采用MoE大模型,清华创业团队医者AI构建健康管理Agent
...果仅用传统大模型如微调大模型、行业大模型等又会面临幻觉问题、长期记忆缺失问题、小样本训练不足等问题。为了解决这个现状,医者团队采用自研MoE架构大模型。通过混合架构,将大模型与全科医生AI、专科专家AI、运动...……更多
更多关于科技的资讯:
一加手机全球摄影大赛圆满落幕,大奖揭晓在即
8月23日消息,2024年一加全球手机摄影大赛在摄影爱好者的热烈参与下圆满结束。本次大赛历时4个月,吸引了来自全球150多个国家和地区的摄影爱好者
2024-08-23 20:20:00
AMD锐龙9000性能有望进一步提升 系统更新带来优化
AMD今天发布了最新的博客文章,针对近期海外Zen5系列桌面处理器评测结果差异较大的现象进行了分析,并且带来了更多关于后续采用Zen5架构锐龙9000系列处理器带来进一步系统优化的相关内容
2024-08-23 20:22:00
石头P20 Pro新品公布,创新对流毛发防缠绕系统
日前,石头科技正式公布全新的扫地机器人产品--石头P20Pro,包括水箱版以及自动上下水版本,将于8月26日公布最终售价
2024-08-23 20:22:00
知名儿童手表智能回答引起讨论 答案毁三观!
8月22日消息,有媒体报道称,根据网友发布的视频,网友向360儿童智能手表提问“中国人是世界上最聪明的人吗?”时,得到了令人震惊的答案
2024-08-23 20:23:00
后置三摄升级 苹果iPhone 16 Pro影像规格遭曝
根据爆料者透露,苹果iPhone16系列继续在配置上挤牙膏,如果你在使用iPhone15Pro系列的话,那么就没有必要进行更新换代了
2024-08-23 20:23:00
苹果折叠屏设备又跳票 技术挑战太大4年之后见
折叠屏手机在过去五年发展迅速,一些厂商甚至不再满足手机,开始在更大屏幕的设备中尝试折叠屏设计。苹果作为手机市场中的代表品牌
2024-08-23 20:24:00
HMD成巴塞罗那足球俱乐部合作伙伴,28日发布芭比手机
2024年8月23日,HMD手机官微发布消息称,已与巴萨签署合作协议,HMD将成为俱乐部男足、女足以及其他职业体育团队的官方移动设备合作伙伴
2024-08-23 20:24:00
微软确认控制面板即将被弃用 至今已存在39年
尽管微软此前已经多次暗示将会用目前已经在较新版本Windows系统当中更加常用的设置应用取代控制面板,但他们始终没有确认这一点
2024-08-23 20:24:00
事关小米14以及小米MIX Flip,雷军透露关键信息
8月17日雷军又进行了一场直播,虽然直播的重点是关于小米汽车的,但是雷军在直播的过程中也透露了关于手机的几个重要信息,估计友商看到这些消息之后有睡不着的
2024-08-23 20:25:00
云鲸扫地机器人J5评测:科学清洁理念打造的新一代清洁旗舰
2023年的8月,云鲸带来了旗下的云鲸J4扫地机器人,并提出了「科学清洁」的产品理念,云鲸J4所搭载的防缠绕滚刷、轻集尘方案等创新技术放到如今都引领着行业发展
2024-08-23 20:25:00
微软将优化FAT32分区格式 最大格式化限制扩展到2TB
如果说哪种硬盘分区格式大家最为熟悉,那么FAT32作为一种经久不衰的格式目前已经有30年的历史。FAT32是从FAT和FAT16发展而来的
2024-08-23 20:25:00
苹果、三星靠边站,国产品牌中端大乱战
智能手机领域只有苹果不发布中低端手机,而且只有苹果不靠机海战术以及大量的中低端机来走量。所以谈到中低端市场时根本没有苹果什么事
2024-08-23 20:26:00
vivo X200外观基本确认,这样的设计你给几分
vivoX100系列有一个被诟病的地方——三行诗。懂行的朋友都应该知道指的是什么,所以很多人希望在下一代上干掉三行诗,没想到vivo真听劝
2024-08-23 20:26:00
小米独占鳌头,OPPO不敌vivo
在国内市场每年高通当家旗舰处理器的出货量小米都是最高的,但是很多人不相信。现在有真实的数据出来,证明了这个观点。数据是来自行业人士“智慧芯片案内人”他给出的是截至目前高通骁龙8Gen3移动平台各品牌机型的出货量对比
2024-08-23 20:26:00
IGN日本为《黑神话》打出7分:战斗方面没有亮点、操作感也不好
8月23日消息,昨晚,IGN日本公布对《黑神话:悟空》的评测,评测者为其打出7分,认为作为一款动作RPG,它有很多无法掩盖的缺陷
2024-08-23 20:27:00