• 我的订阅
  • 头条热搜
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但...……更多
支付宝在AI大模型时代
...质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模型,解决特定金融任务的能力,其从真实场景中萃取了超过60万条以上的专属...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
...生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型还积极探索前沿领域应用,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。目前,星辰大模...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...共享专家路由策略,共享专家负责处理共享的通用能力和知识,特殊专家负责处理任务相关的特殊能力;2)回收路由策略,有效激活每个专家的能力,使每个专家保持相对均衡的负载,充分利用训练数据,保证模型的训练稳定...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...报告等文件,并从中提取数据。▲Claude 3的多模态能力在准确率方面,Claude 3大幅改善了幻觉问题,对没有把握的答案会进行标明,而不是直接给出错误答案。 ▲Claude 3幻觉降低在应用场景上,Claude 3可以适用于代码辅助、内容...……更多
遥遥领先!讯飞首次实现三人同时语音转写:确率度极高 互不干扰
...个人的语音都被讯飞星火准确识别,且同步转写成文字,准确率度极高,且互不干扰。此外,讯飞星火还会自动将三人划分为发言人1、发言人2、发言人3,可实现三人语音转文字同时精准记录。发布会上,科大讯飞发布讯飞星火...……更多
解锁私域增长新范式,腾讯企点推出新举措
...讯企点分析·AI助手。在产品功能上,一直在耐心打磨,准确率持续在提升。甚至有些成绩客户认为已经超过预期。在客服场景中,依托AI大模型的新一代企点智能客服,在对话交互、人工辅助和知识构建三个层面进行了全面提升...……更多
朱啸虎:AI的赚钱风向,彻底变了!
...的逻辑需要多步推理,如果每一步都只能做到 90% - 95% 的准确率,那多步迭代后其准确率可能就到 50% 以下了。而中国企业用私有数据化训练模型,就可以很大程度上降低幻觉、增加正确率,关键是你有没有能积累足够多的高质...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...是,通用模型虽然有全领域能力,但是很多具有独特专业知识的行业和场景却无法直接应用。比如在大模型落地工业场景上,施耐德电器数字化就提出了这样的「两难问题」——制造业企业的数据、知识、经验无法分享,导致数...……更多
...等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍。”(蓝鲸记者 黄心怡) ……更多
...,ECMWF又推出了新的AIFS版本,水平分辨率提升到28公里,准确率较老版本也有了新的提升,该版本产品已同传统模式 IFS的产品一起对外发布,供用户使用。我们也应该认识到,AI技术在构建天气气候预报模型方面虽然取得了重要...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...注意下,因为有一个好的干净的数据才能保证问答系统的准确率和召回率等指标。数据整理时需要注意的点:第二步:模型设计研究和开发如今LLM应用技术栈中的模型(例如GPT-4)就相当于其中的CPU,开发框架(例如LangChain或Dify...……更多
AIGC工具测评:生成式AI的产品表现如何
...使用感受 PopAI在阅读 PDF 并生成摘要和图表上表现优异,准确率以及处理速度都不错;PopAi 还可以帮助您制作演示幻灯片或用于其他目的的草稿文本,并且提供了一些PPT、Word等类型模板供用户选择,并且能帮助用户优化生成ppt、...……更多
...存在的问题1.对选择题的各种解法掌握不熟,解题速度与准确率都存在问题。2.运算能力差,缺乏运算的恒心、信心,一遇到问题就只想讨论,不想独立思考。3.解题步骤不全,细节注意不到位,卷面不规范,导致会做的题得不到...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...文资料,千亿级医疗文本语料库,以及千万级高质量医疗知识图谱,其学习深度与广度均达到业界领先水平,甚至在中英文医疗考试与基准测试中展现出与GPT-4相媲美甚至超越的性能。这一多模态医疗大模型的应用场景极为广泛...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...估了模型的性能,结果显示相比现有方法,RecDiff在推荐准确率方面取得了显著提升。未来,RecDiff团队计划将RecDiff拓展到更多推荐场景中,并结合多模态信息,进一步探索该模型的潜力和应用价值。论文:http://github.com/HKUDS/RecDif...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...测试进入新的基准。据了解,这两项国际标准是由OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成,主要应用于大模型及生成式AI应用方面的安全测试标准。其中《大语...……更多
...语言大模型、视觉大模型和多模态大模型。让大模型通过知识学习和技能学习,快速应用于用户的业务场景中。民生证券最新研报指出,昇腾AI一体机是国内AI软硬件技术的黄金交点。乐观预计,2027年G端昇腾一体机市场规模超450...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...模型适用范围,推动核心方言引擎的布局,提高方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头...……更多
...证,针对多样式回单识别场景,该大模型对图片字段识别准确率超过99%,图片信息综合识别匹配准确率超过95%,召回率比传统模型提高近20%。 今日观点: 崔东树:9月新能源汽车出口欧洲暂时放缓,随后应该还能回升向上36氪获...……更多
点亮合同管理未来 江西移动率先发布合同解析大模型
...统通过大数据技术提高了合同文本识别的准确性,将识别准确率提升至92%,并能智能提取56个合同关键要素,增强了合同解析的适用性和灵活性。这一成果体现了双方在优化合同管理流程中的实质性进步,并预示着企业合同管理...……更多
... Labs团队研发的最新迭代人工智能模型AlphaFold3,能以较高准确率预测蛋白质与其他生物分子相互作用的结构,其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...点。实验结果显示,耦合方法使模型性能大幅提升,理解准确率提高 19.48%,生成准确率提高 26.07%,且数据效率更高。在语言方面,耦合系统的有效词汇增加,与人类语言更相似,词汇漂移减少。 杰出论文再来看看杰出论文的...……更多
古早费曼论文手写公式也能转LaTeX,马斯克Grok功能上线就火了
...有难度。而 Grok 可以把它们转化成如此工整的结果,而且准确率令人惊叹。图源:https://x.com/luismbat/status/1850925670408544355这个帖子吸引了众多研究人员的关注,整个帖子的浏览量已经突破 100 万。还有人晒出了自己用 Grok 识别出的...……更多
百度智能云升级7款大模型应用产品,让每个企业拥有新质生产力
...业私域知识、第三方服务与能力,进一步提升模型生成的准确率和操作的丰富度,高效满足企业定制化需求,助力企业低成本打造自己的智能代码助手。通过AutoWork新能力,可深度解读企业与个人私域代码库,不仅能直接询问与...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...难的智力基准,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 聘请了拥有博士学位的专家来回答 GPQA Diamond 基准问题。实验结果表明:o1 超越了人类专家的表现,成为第一个在该基准测试中做...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...所涵盖的体系框架。本综述旨在提供具身智能的全面背景知识、研究趋势和技术见解。本综述整体架构2. 具身机器人具身智能体积极与物理环境互动,涵盖了广泛的具身形态,包括机器人、智能家电、智能眼镜和自动驾驶车辆等...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00