• 我的订阅
  • 头条热搜
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但...……更多
支付宝在AI大模型时代
...质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模型,解决特定金融任务的能力,其从真实场景中萃取了超过60万条以上的专属...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
...生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型还积极探索前沿领域应用,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。目前,星辰大模...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...共享专家路由策略,共享专家负责处理共享的通用能力和知识,特殊专家负责处理任务相关的特殊能力;2)回收路由策略,有效激活每个专家的能力,使每个专家保持相对均衡的负载,充分利用训练数据,保证模型的训练稳定...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...报告等文件,并从中提取数据。▲Claude 3的多模态能力在准确率方面,Claude 3大幅改善了幻觉问题,对没有把握的答案会进行标明,而不是直接给出错误答案。 ▲Claude 3幻觉降低在应用场景上,Claude 3可以适用于代码辅助、内容...……更多
遥遥领先!讯飞首次实现三人同时语音转写:确率度极高 互不干扰
...个人的语音都被讯飞星火准确识别,且同步转写成文字,准确率度极高,且互不干扰。此外,讯飞星火还会自动将三人划分为发言人1、发言人2、发言人3,可实现三人语音转文字同时精准记录。发布会上,科大讯飞发布讯飞星火...……更多
解锁私域增长新范式,腾讯企点推出新举措
...讯企点分析·AI助手。在产品功能上,一直在耐心打磨,准确率持续在提升。甚至有些成绩客户认为已经超过预期。在客服场景中,依托AI大模型的新一代企点智能客服,在对话交互、人工辅助和知识构建三个层面进行了全面提升...……更多
朱啸虎:AI的赚钱风向,彻底变了!
...的逻辑需要多步推理,如果每一步都只能做到 90% - 95% 的准确率,那多步迭代后其准确率可能就到 50% 以下了。而中国企业用私有数据化训练模型,就可以很大程度上降低幻觉、增加正确率,关键是你有没有能积累足够多的高质...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...是,通用模型虽然有全领域能力,但是很多具有独特专业知识的行业和场景却无法直接应用。比如在大模型落地工业场景上,施耐德电器数字化就提出了这样的「两难问题」——制造业企业的数据、知识、经验无法分享,导致数...……更多
...等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍。”(蓝鲸记者 黄心怡) ……更多
...,ECMWF又推出了新的AIFS版本,水平分辨率提升到28公里,准确率较老版本也有了新的提升,该版本产品已同传统模式 IFS的产品一起对外发布,供用户使用。我们也应该认识到,AI技术在构建天气气候预报模型方面虽然取得了重要...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...注意下,因为有一个好的干净的数据才能保证问答系统的准确率和召回率等指标。数据整理时需要注意的点:第二步:模型设计研究和开发如今LLM应用技术栈中的模型(例如GPT-4)就相当于其中的CPU,开发框架(例如LangChain或Dify...……更多
AIGC工具测评:生成式AI的产品表现如何
...使用感受 PopAI在阅读 PDF 并生成摘要和图表上表现优异,准确率以及处理速度都不错;PopAi 还可以帮助您制作演示幻灯片或用于其他目的的草稿文本,并且提供了一些PPT、Word等类型模板供用户选择,并且能帮助用户优化生成ppt、...……更多
...存在的问题1.对选择题的各种解法掌握不熟,解题速度与准确率都存在问题。2.运算能力差,缺乏运算的恒心、信心,一遇到问题就只想讨论,不想独立思考。3.解题步骤不全,细节注意不到位,卷面不规范,导致会做的题得不到...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...文资料,千亿级医疗文本语料库,以及千万级高质量医疗知识图谱,其学习深度与广度均达到业界领先水平,甚至在中英文医疗考试与基准测试中展现出与GPT-4相媲美甚至超越的性能。这一多模态医疗大模型的应用场景极为广泛...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...估了模型的性能,结果显示相比现有方法,RecDiff在推荐准确率方面取得了显著提升。未来,RecDiff团队计划将RecDiff拓展到更多推荐场景中,并结合多模态信息,进一步探索该模型的潜力和应用价值。论文:http://github.com/HKUDS/RecDif...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...测试进入新的基准。据了解,这两项国际标准是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成,主要应用于大模型及生成式AI应用方面的安全测试标准。其中《大语...……更多
...语言大模型、视觉大模型和多模态大模型。让大模型通过知识学习和技能学习,快速应用于用户的业务场景中。民生证券最新研报指出,昇腾AI一体机是国内AI软硬件技术的黄金交点。乐观预计,2027年G端昇腾一体机市场规模超450...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...模型适用范围,推动核心方言引擎的布局,提高方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头...……更多
...证,针对多样式回单识别场景,该大模型对图片字段识别准确率超过99%,图片信息综合识别匹配准确率超过95%,召回率比传统模型提高近20%。 今日观点: 崔东树:9月新能源汽车出口欧洲暂时放缓,随后应该还能回升向上36氪获...……更多
点亮合同管理未来 江西移动率先发布合同解析大模型
...统通过大数据技术提高了合同文本识别的准确性,将识别准确率提升至92%,并能智能提取56个合同关键要素,增强了合同解析的适用性和灵活性。这一成果体现了双方在优化合同管理流程中的实质性进步,并预示着企业合同管理...……更多
... Labs团队研发的最新迭代人工智能模型AlphaFold3,能以较高准确率预测蛋白质与其他生物分子相互作用的结构,其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...点。实验结果显示,耦合方法使模型性能大幅提升,理解准确率提高 19.48%,生成准确率提高 26.07%,且数据效率更高。在语言方面,耦合系统的有效词汇增加,与人类语言更相似,词汇漂移减少。 杰出论文再来看看杰出论文的...……更多
古早费曼论文手写公式也能转LaTeX,马斯克Grok功能上线就火了
...有难度。而 Grok 可以把它们转化成如此工整的结果,而且准确率令人惊叹。图源:https://x.com/luismbat/status/1850925670408544355这个帖子吸引了众多研究人员的关注,整个帖子的浏览量已经突破 100 万。还有人晒出了自己用 Grok 识别出的...……更多
百度智能云升级7款大模型应用产品,让每个企业拥有新质生产力
...业私域知识、第三方服务与能力,进一步提升模型生成的准确率和操作的丰富度,高效满足企业定制化需求,助力企业低成本打造自己的智能代码助手。通过AutoWork新能力,可深度解读企业与个人私域代码库,不仅能直接询问与...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...所涵盖的体系框架。本综述旨在提供具身智能的全面背景知识、研究趋势和技术见解。本综述整体架构2. 具身机器人具身智能体积极与物理环境互动,涵盖了广泛的具身形态,包括机器人、智能家电、智能眼镜和自动驾驶车辆等...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00