• 我的订阅
  • 头条热搜
OpenAI叫板搜索霸主谷歌:摆脱“AI幻觉”困扰,我的SearchGPT已抢先一步
...”,不过目前还没有看到相关案例演示。 谷歌曾因“AI幻觉”大翻车OpenAI为此采用成本更高昂的办法OpenAI首席执行官奥尔特曼7月25日在社交媒体上发文称:“我们一直认为搜索引擎还有很大的发展空间,因此我们推出了SearchGPT...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...常提到的技术挑战固然重要,但更为核心的问题在于机器幻觉和合规风险。 机器幻觉是指大模型在学习海量数据后,可能会根据对前文内容的理解“编造”出一些“无中生有”的内容。在容错率较低的金融领域,这种幻觉会直...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...Llama 3.1 405B: 推理方面,官方表示重点关注减少模型“幻觉”,Mistral Large 2能够识别自己在找不到解决方案或缺乏足够信息提供确信答案时的情况。由此模型在数学基准测试中的表现相比之前有了不小提升。在GSM8K(8-shot)和MAT...……更多
2024年最重要的趋势,可能影响你的工作
...个重大的技术挑战。(图/unsplash)第二个重大的困境是AI幻觉。因为AI是一种概率模型,所以它不可避免地会出现幻觉。这种幻觉既是好事,也是坏事。好事就是它代表了AI具有想象力和融合性,有组合式创新和增量式创新的能力...……更多
...外金融领域数字特别重要,一般模型碰到数字问题会产生幻觉,而自研模型会针对金融领域的特殊问题进行特殊设计,这也决定了垂类大模型需要有一支比较高水平的研发队伍才能做好。孙茂松预测,随着大模型技术的成熟,将...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
...》杂志上。基于人工智能的工具(例如LLM)有时受制于“幻觉”,导致作出看似合理但实际是错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得利用LLM应对复杂问题成为可能。这些问题一般需要可验证且...……更多
...AI回答的可靠性。大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。但...……更多
儿童电话手表出现错误问答 360创始人周鸿祎公开致歉
...智能,而且人工智能全世界公认的一个难题就是它会产生幻觉,也就是它有的时候会胡说八道,这个是大模型的本身固有的特性。如何能够最大限度的减少幻觉,我们一直在做努力,比如说我们试图通过跟搜索的内容对比,来减...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...且通过回应训练和客观信息非幻觉对抗训练,可以实现高精度、高情绪反馈的客户响应。西湖心辰展出的另一款小天心理疏导大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...信息。知识增强技术:为缓解大模型在结果生成过程中的幻觉问题,引入知识增强技术与外部知识库进行交互,以补充和约束模型的输出,从而提高信息的准确性和完整性。长文本建模技术:通过长文本建模和切片方式突破大模...……更多
汉王科技发布天地大模型:适用于古文、法律、教育等多个领域
...汉语大模型杜绝了通用大模型最容易产生的代词错乱甚至幻觉的场景,完成了开放式问答的任务。法律大模型的演示环节,通过劳动问答、婚姻问答、法考问答三个领域的开放性问答演示,结果表明,法律大模型不仅具备专业知...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。图片来自岩芯数智...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具难度。例如,大语言模型通常会生成冗长的回...……更多
2023金融大模型报告|重塑金融科技
...用对业务进行实际支持。 在消费金融领域,通用大模型精度不够、金融专业知识缺失,以及难以满足消费场景中大量定制化需求等问题,成为当前亟待解决的难题。对此,招联消费金融与中山大学联合研发推出开源金融大模“...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...用户查询的指标和相关维度。为了增强问数服务层的数据精度与效能,浩鲸科技的BI大模型团队聚焦于构建一套全面的BI知识数据管理体系。该体系深刻涵盖了业务术语、同义词汇、原子术语、关键指标、多维数据以及库表模型...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...准高效:集成前沿 NLP 算法与模型,实现文档处理速度与精度的双重飞跃。抽取精度高达 98%,问答响应准确率超越 80%,让信息获取更加智能、便捷。 格式兼容,全面广泛:拥抱多样化文档生态,支持超过 30 种文件格式,特别...……更多
2023金融大模型报告|智能风控:荆棘中有玫瑰
...场风险管理的准确性和全面性”。由于保险业对信息的高精度的要求和严苛的数据合规要求,元保保险经纪(北京)有限公司负责人也同样指出,大模型可以协同进行更总结性的监控,判断异常的交易频率规模,判断是否存在内...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型...……更多
...侵权案件追根溯源,揭开恶意取证真相,打破人工智能“幻觉”,确保司法公正不被技术操纵——法院,帮AI大模型“反诈”见多了“李逵”诉“李鬼”,没想到还会碰到“李鬼”诉“李逵”……2024年3月,上海市青浦区人民法...……更多
首个职教行业大模型发布,粉笔AI老师助力高效学习
...感慨,为实现这一目标,团队克服了诸多瓶颈,其中,「幻觉」是棘手难题之一。作为大模型在落地过程中普遍缺陷,AI 幻觉目前难以被根除。这导致大模型会给出一些看似合理但错漏百出的答案,而这对教育尤为「致命」。为...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...,大模型的输出标准相对比较模糊,当前阶段存在模型'幻觉',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛盾。针对此难点有两点建议:第一,建议大模型与小模型搭配,运用行业专业领域数据结合基...……更多
...切入口。AI时代,是触手可及的未来,还是望山跑死马的幻觉?未来的问题,要回到现实寻找答案。比预想中更快的,是大模型的整体竞争,已经走向应用与落地的新赛段。我们需要找到一个链接现实与数字世界的载体,作为未...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
谷歌“ai摘要”功能生成奇怪结果
...伊此前在接受采访时承认,这些“AI摘要”功能产生的“幻觉”是大型语言模型(LLM)的“固有缺陷”,而大型语言模型正是“AI摘要”功能的核心技术。皮查伊今年5月曾表示,此问题“尚无解决方案”(isstillanunsolvedproblem)。 ……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...迭代更新;在推理技术方面,京东采用了端到端低比特高精度量化技术,有效降低了模型体积,同时提升了推理性能,显存节约高达70%;在语音领域,言犀大模型通过迭代优化,实现了跨语种的语音合成,仅需3-6秒的语音样本即...……更多
更多关于科技的资讯:
画里有话|充电宝容量岂能“充水”
今年8月,消费者王先生在淘宝某品牌官方旗舰店购买了一款电芯容量为10000毫安的充电宝,背面小字标示的额定容量仅有6000毫安
2025-10-23 08:37:00
厦门网讯(厦门日报记者 杨霞瑜)“AI凑单比价”“AI万能搜”“AI帮我挑”……今年“双11”大促已经开始,AI在电商平台中被广泛使用
2025-10-23 08:42:00
荣耀与比亚迪达成深度战略合作 共绘智慧出行\
10月21日,荣耀与比亚迪在深圳签署战略合作协议。双方将依托荣耀车联解决方案与比亚迪 DiLink的全新一代智慧生态,以"人"为核心
2025-10-23 08:46:00
Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴,以创新和品质突破行业边界
10月16日,创新工具品牌Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴。此次合作基于双方理念的高度契合,Fanttik以“高性能
2025-10-23 09:16:00
宁波银行南京分行携手高德地图共筑南京餐饮数字化增长新生态
10月22日,高德到店助力餐饮行业经营发展(南京专场)活动在南京圆满落幕。该活动由宁波银行南京分行与高德地图联合主办,吸引众多餐饮企业家代表参与
2025-10-23 09:44:00
近年来,民生银行石家庄分行坚持“以客户为中心”的服务理念,将支付业务作为全行战略性基础业务之一,紧跟市场发展趋势和客户需求
2025-10-23 10:02:00
沐曦发布首款全国产通用GPU芯片“中国芯”,浦口造□南京日报/紫金山新闻记者肖凡 通讯员吴晓倩IP设计、晶圆制造、封装测试全流程国内生产
2025-10-23 07:46:00
10月22日从中北大学获悉,第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛日前在全国各地拉开帷幕
2025-10-23 07:49:00
聚焦雄安新区|首颗“雄安造”卫星完成生产下线
雄安新区空天信息产业从布局迈向实质性产出阶段首颗“雄安造”卫星完成生产下线河北日报讯(记者解丽达、曹铮 见习记者李畅)10月22日
2025-10-23 07:55:00
10月22日,安平国际会展中心。当天开幕的第25届中国·安平国际丝网博览会,用满场的“智造”活力,改写着人们对丝网的老印象
2025-10-23 07:59:00
试水市场化,VR博览会迸发新活力
会展作为经济发展的“晴雨表”和“风向标”,不仅是经济发展的助推器,更是展示经济活力的重要窗口。如今,世界VR产业大会成为南昌乃至江西的一张名片
2025-10-23 06:29:00
AI赋能医院病案内涵质量提升
鲁网10月22日讯(记者 魏萱)为深入推进健康中国建设,进一步深化医药卫生体制改革,全面提升医疗质量安全水平,建设有特色的医疗质量管理体系
2025-10-22 14:27:00
胡海建眼中的“末端决胜论”,跨越速运陆运体系如何做到“快、准、稳”?
在跨越速运的“陆空协同”运力体系中,陆运网络是连接航空枢纽与客户的关键环节。董事长胡海建深知,末端服务的“最后一公里”直接影响客户体验
2025-10-22 14:37:00
布蕾克咖啡携\
近日,布蕾克咖啡携新品「云南有机瑰夏礼盒」等多款咖啡产品登陆高端超市品牌Ole'精品超市,通过优质渠道将高品质咖啡呈现给广大咖啡爱好者
2025-10-22 14:37:00
AI驱动 数据赋能丨浪潮云领跑中国城市可信数据空间市场
近日,艾瑞咨询正式发布《2025年中国城市可信数据空间行业研究报告》,从城市可信数据空间的发展驱动因素和核心价值出发,对其总体架构
2025-10-22 17:06:00