• 我的订阅
  • 头条热搜
谷歌人工智能聊天机器人正在使用bard
...型的一些存在已久的问题,比如他们有编造东西或“产生幻觉”的倾向。但我最担心的是,正如我今年早些时候所写的那样,它们可能带来安全和隐私灾难。科技公司正在将这项存在严重缺陷的技术交到数百万人的手里,并允许...……更多
...19日发表的一项研究报道了一种能检测大语言模型(LLM)幻觉(hallucination)的方法,该方法能够测量生成回答的含义的不确定性,或者用于提升LLM输出的可靠性。像ChatGPT和Gemini这样的LLM是能够阅读和生成自然人类语言的人工智...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...强大模型理解能力,减少幻觉,对齐人类意图,将大模型精度提升至80%。持续的数据监控和质量控制是保证训练结果可靠性的关键。在专利大模型领域,目前市场上还没有比较全面、专业、完整的评估体系。智慧芽率先建立了Pat...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...常提到的技术挑战固然重要,但更为核心的问题在于机器幻觉和合规风险。 机器幻觉是指大模型在学习海量数据后,可能会根据对前文内容的理解“编造”出一些“无中生有”的内容。在容错率较低的金融领域,这种幻觉会直...……更多
OpenAI叫板搜索霸主谷歌:摆脱“AI幻觉”困扰,我的SearchGPT已抢先一步
...”,不过目前还没有看到相关案例演示。 谷歌曾因“AI幻觉”大翻车OpenAI为此采用成本更高昂的办法OpenAI首席执行官奥尔特曼7月25日在社交媒体上发文称:“我们一直认为搜索引擎还有很大的发展空间,因此我们推出了SearchGPT...……更多
...外金融领域数字特别重要,一般模型碰到数字问题会产生幻觉,而自研模型会针对金融领域的特殊问题进行特殊设计,这也决定了垂类大模型需要有一支比较高水平的研发队伍才能做好。孙茂松预测,随着大模型技术的成熟,将...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...Llama 3.1 405B: 推理方面,官方表示重点关注减少模型“幻觉”,Mistral Large 2能够识别自己在找不到解决方案或缺乏足够信息提供确信答案时的情况。由此模型在数学基准测试中的表现相比之前有了不小提升。在GSM8K(8-shot)和MAT...……更多
2024年最重要的趋势,可能影响你的工作
...个重大的技术挑战。(图/unsplash)第二个重大的困境是AI幻觉。因为AI是一种概率模型,所以它不可避免地会出现幻觉。这种幻觉既是好事,也是坏事。好事就是它代表了AI具有想象力和融合性,有组合式创新和增量式创新的能力...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
...》杂志上。基于人工智能的工具(例如LLM)有时受制于“幻觉”,导致作出看似合理但实际是错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得利用LLM应对复杂问题成为可能。这些问题一般需要可验证且...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。但...……更多
...AI回答的可靠性。大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言...……更多
儿童电话手表出现错误问答 360创始人周鸿祎公开致歉
...智能,而且人工智能全世界公认的一个难题就是它会产生幻觉,也就是它有的时候会胡说八道,这个是大模型的本身固有的特性。如何能够最大限度的减少幻觉,我们一直在做努力,比如说我们试图通过跟搜索的内容对比,来减...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...且通过回应训练和客观信息非幻觉对抗训练,可以实现高精度、高情绪反馈的客户响应。西湖心辰展出的另一款小天心理疏导大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...信息。知识增强技术:为缓解大模型在结果生成过程中的幻觉问题,引入知识增强技术与外部知识库进行交互,以补充和约束模型的输出,从而提高信息的准确性和完整性。长文本建模技术:通过长文本建模和切片方式突破大模...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及,行业对于高效能、低能耗AI大模型的需求正不断增长。图片来自岩芯数智...……更多
汉王科技发布天地大模型:适用于古文、法律、教育等多个领域
...汉语大模型杜绝了通用大模型最容易产生的代词错乱甚至幻觉的场景,完成了开放式问答的任务。法律大模型的演示环节,通过劳动问答、婚姻问答、法考问答三个领域的开放性问答演示,结果表明,法律大模型不仅具备专业知...……更多
2023金融大模型报告|重塑金融科技
...用对业务进行实际支持。 在消费金融领域,通用大模型精度不够、金融专业知识缺失,以及难以满足消费场景中大量定制化需求等问题,成为当前亟待解决的难题。对此,招联消费金融与中山大学联合研发推出开源金融大模“...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具难度。例如,大语言模型通常会生成冗长的回...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...用户查询的指标和相关维度。为了增强问数服务层的数据精度与效能,浩鲸科技的BI大模型团队聚焦于构建一套全面的BI知识数据管理体系。该体系深刻涵盖了业务术语、同义词汇、原子术语、关键指标、多维数据以及库表模型...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...准高效:集成前沿 NLP 算法与模型,实现文档处理速度与精度的双重飞跃。抽取精度高达 98%,问答响应准确率超越 80%,让信息获取更加智能、便捷。 格式兼容,全面广泛:拥抱多样化文档生态,支持超过 30 种文件格式,特别...……更多
2023金融大模型报告|智能风控:荆棘中有玫瑰
...场风险管理的准确性和全面性”。由于保险业对信息的高精度的要求和严苛的数据合规要求,元保保险经纪(北京)有限公司负责人也同样指出,大模型可以协同进行更总结性的监控,判断异常的交易频率规模,判断是否存在内...……更多
首个职教行业大模型发布,粉笔AI老师助力高效学习
...感慨,为实现这一目标,团队克服了诸多瓶颈,其中,「幻觉」是棘手难题之一。作为大模型在落地过程中普遍缺陷,AI 幻觉目前难以被根除。这导致大模型会给出一些看似合理但错漏百出的答案,而这对教育尤为「致命」。为...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型...……更多
...侵权案件追根溯源,揭开恶意取证真相,打破人工智能“幻觉”,确保司法公正不被技术操纵——法院,帮AI大模型“反诈”见多了“李逵”诉“李鬼”,没想到还会碰到“李鬼”诉“李逵”……2024年3月,上海市青浦区人民法...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...,大模型的输出标准相对比较模糊,当前阶段存在模型\'幻觉\',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛盾。针对此难点有两点建议:第一,建议大模型与小模型搭配,运用行业专业领域数据结合...……更多
...切入口。AI时代,是触手可及的未来,还是望山跑死马的幻觉?未来的问题,要回到现实寻找答案。比预想中更快的,是大模型的整体竞争,已经走向应用与落地的新赛段。我们需要找到一个链接现实与数字世界的载体,作为未...……更多
更多关于科技的资讯:
2023年12月签约,2024年3月开业,截至目前营收已突破3亿元。小米汽车太原交付中心落地山西转型综改示范区不到一年
2025-01-27 07:49:00
厦门网讯 (厦门日报记者 沈彦彦)春节前夕,一场由政府“买单”的消费福利给厦门带来节前好“市”——今年元旦起,厦门市延续家电以旧换新和汽车报废更新补贴政策
2025-01-27 08:08:00
杭州要把机器人送上月球了 中国民营企业首次以主体身份参与探月工程项目
国际月球科研站效果图 浙江大学航空航天学院供图近日,地卫二空间技术(杭州)联合浙江大学、土耳其中东科技大学宣布,三方共同提出的“具身智能机器人”方案正式入选国家航天局主导的嫦娥八号国际合作项目
2025-01-27 08:30:00
起跑2025 | 这些“第一”见证外贸向“新”而行
本文转自:人民网人民网记者 孙红丽海外抢订单,今年特别早。新岁伊始,全国各地的外贸从业者们早早开启了“空中飞人”模式,他们忙碌奔波于海内外
2025-01-27 09:16:00
“您有新的外卖订单……”每到饭点,不少餐饮门店都会接连响起这样的提示音。在广东省广州市,财记隆江猪脚饭也不例外。“堂食只能覆盖附近两三公里
2025-01-27 10:01:00
中新经纬1月27日电 据农业农村部网站27日消息,农业农村部、金融监管总局、公安部、市场监管总局发布关于进一步防范“云养经济”领域欺诈风险的提示
2025-01-27 10:40:00
大皖新闻讯 1月26日,正值岁末,在一片辞旧迎新的氛围中,福建联特智能装备公司与歙县开投集团正式签署联特无人机项目合作协议书
2025-01-27 09:55:00
银座电器:16年芳华积厚成器,执于用好“新”与“心”
白雪飞花春又生,成立于春天的本土“电”商银座电器已近16年芳华,经历过藏器待时,在济南,在山东,家电江湖里坚守,从容绽放
2025-01-27 09:49:00
买手机也补贴!临沂“以旧换新”补贴上线两日销售5000余万元
齐鲁晚报·齐鲁壹点 姜曼1月26日,记者从2025“乐购临沂”迎新春消费季发布会上获悉,今年,临沂市家电以旧换新扩围至12大类
2025-01-27 09:49:00
运营不到3年 腾讯代理《黑色沙漠》手游国服今日停运
快科技1月27日消息,2024年11月27日,腾讯《黑色沙漠》手游突然发布停服公告,根据公告,腾讯将于今天11点正式停止《黑色沙漠》手游在中国大陆地区的运营
2025-01-27 00:36:00
东南网1月26日报道(福建日报记者 廖丽萍 见习记者 傅韬旭)平均每22秒产出一块电视大屏;借助AI助手的“火眼金睛”
2025-01-27 04:31:00
本文转自:人民日报海外版王慧琼《人民日报海外版》(2025年01月27日第 05 版)当下,短视频成为大众休闲消遣的热门选择
2025-01-27 05:45:00
本文转自:人民日报韩文榕《人民日报》(2025年01月27日第 02 版)车间里,机器人操作井然有序;集控室,全厂数据尽收眼底
2025-01-27 05:45:00
本文转自:人民日报陈  凌《人民日报》(2025年01月27日第 05 版)近段时间,两个“小城故事”令人关注。一个是胖东来
2025-01-27 05:47:00
7英寸带屏HomePod今年登场:苹果押宝智能家居
快科技1月27日消息,知名苹果记者Mark Gurman表示,一款7英寸的带屏HomePod会在今年正式推出,屏幕由国产供应商天马提供
2025-01-27 07:36:00