• 我的订阅
  • 头条热搜
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA 3.1 405B(准确率为 62.6%)。在更具挑战性的“Mystery Blocksworld”加密版本中,传统模型几乎全部失败,而……更多
洞察者融合DeepSeek大模型,打造航天测控智能化基石
...,辅助工程师快速诊断和解决航天器故障,提高故障诊断准确率。借助DeepSeek强大的知识推理功能,星图测控在航天测控数据分析、智能定轨、任务规划、故障诊断、决策辅助等多个关键环节实现智能化升级,这不仅将提升服务...……更多
\
...四题MathGPT均能够准确将公式与数学符号转化为文字。在准确率上,四题答案均正确,并且解题过程完整,包含了分析题干、详解题目,也提炼出了题目所考核的知识点,但其中两题的分析过程语言出现了英文。 但在解方程时,...……更多
国内第一款AI搜索来了!首发实测:0广告、自动总结成文
...ievalAugmentedGeneration),用外部数据提高大模型回答问题的准确率、减少幻觉。比直接用提示词提供上下文支持的数据量更多、质量更高,又比重新训练或微调大模型的成本低。△来自fiddler.ai 一个经典用法是接入企业本地数据作...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...的推理过程。如上图中的红色实线所示,模型所能达到的准确率与所给定的推理长度呈正相关。且相比于传统的多次采样 + 投票(Majority Voting),模型思维链长度增加展现出了更高的效率。最惊艳的是,发布即上线:所有用户均...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个十分尴尬的地位。作者在推文中表示...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
近日,OpenAI用一场26分钟的线上直播展示了GPT-4o带来的惊艳交互能力,将新一轮AI争霸带入了“Her 时代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只..……更多
...的全过程。经过4次强降雨的实测对比,数据模型的推演准确率在75%以上,能为城市防洪防内涝安全提供有效指导。武汉还采用数字孪生的理念,全过程串联规划设计、审批管理、建设实施和城市运营等各阶段。汉口滨江国际商...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型中,LLaMA 3.1 405B 在常规 Blocksworld 测试中表现最佳,准确率达到 62.6%。然而模型在 Mystery Blocksworld 的表现却远远落后——没有一个 LLM 在测试集上达到 5%,并且在一个领域上的性能并不能清楚地预测另一个领域的性能。这种结...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...本可下降多达50%。目前,零一万物Infra能力实现故障预测准确率超过90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...问题,OmniSearch的表现显著优于GPT-4V结合启发式mRAG方法,准确率提升了近88%。 多模态知识需求:OmniSearch能够有效地结合图像和文本进行检索,其在需要额外视觉知识的复杂问题上的表现远超现有模型,准确率提高了35%以上。 ...……更多
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...出来高时效的信息和内容,从而大幅度提升事实性问题的准确率。此外,李彦宏表示文心一言能够连续三次内容创作生成,这是基于庞大数据规模而发生的“智能涌现”。据介绍,文心一言大模型的训练数据包括万亿级网页数据...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...AI 原生 App “支小宝” 采用这套框架,在政务问答场景的准确率提升到了 91%,医疗问答垂直的指标解读准确率可达 90% 以上。梁磊还透露,KAG 框架会进一步向社区开放,并在开源框架 OpenSPG (https://github.com/OpenSPG/openspg) 中原生支..……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...推理能力:在GSM8K数据集上,Q*帮助Llama-2-7b提升至80.8%的准确率,超越了ChatGPT;在MATH数据集上,Q*帮助DeepSeek-Math-7b提升至55.4%的准确率,超越了Gemini Ultra;在MBPP数据集上,Q*帮助CodeQwen1.5-7b-Chat提……更多
携手鼎捷 老板电器以AI大模型赋能企业管理决策
...验收标准:1、无人工干预下,连续3个月全国M+1平均预测准确率达成76%,连续3个月全国M+0平均准确率达成82%;2、需求预测、补货计划、供应计划模块客户需求功能在线化,且达到正常使用条件。 “鼎捷雅典娜预测透镜”数智驱...……更多
...备高精度的意图理解,个性化的沟通风格,金融意图识别准确率达到95%,金融事件分析推理能力不逊于真人行业专家,能够进行多回合的高质量对话。至于支小助,是金融行业从业者的好助手,包含“服务专家版”“投研专家版...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...。在 MATH 数据集上,Q * 帮助 DeepSeek-Math-7b 提升至 55.4% 的准确率,超越了 Gemini Ultra。Q * 算法论文地址:https://arxiv.org/abs/2406.14283可以看出,昆仑万维的技术已经达到了业界的领先水平,在竞争激烈的生成式 ……更多
CVPR最佳论文:大模型成就端到端自动驾驶|焦点分析
...是预测和规划效果远超之前最好方案。其中,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移和规划的误差则分别降低了38%和28%。在晴天直行场景中,UniAD 可以感知左前方等待的黑色车辆,预测其未来轨...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...据集ImageNet上,该模型仅基于公开数据便达到了90.1%的Top-1准确率。这是除谷歌与微软之外,唯一准确率超过90.0%的模型,值得一提的是,谷歌与微软均未公开模型及额外数据集。“书生2.5”同时也是世界上开源模型中ImageNet准确...……更多
汇付天下AI应用丨LLM在投诉风险管控中的应用实践
...明确、有备选答案且可选项有限,追求可控、可解释、高准确率为目标的业务方案。 开放式方案:通常应用于探索未知领域,无预设答案,无既定流程,目标也可以不用提前明确,需要进行发散思考,在反复试错、验证后最终...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...推理问题。刚刚发布时,人类在HellaSwag上能达到超过95%的准确率,SOTA分数却始终难以超过48%。但这种情况并没有持续很久。各个维度的分数持续猛涨,2023年3月,GPT-4在HellaSwag上的各项得分就逼近,甚至超过了人类水平。 https://...……更多
效率提升数十倍!保险业逐浪大模型,新一轮“装备竞赛”开启?
...全线上销售机器人”项目中完成应用探索,信息抽取任务准确率提升15%,意图识别和智能问答准确率均有明显提升。除了险企,AI大模型浪潮下亦有外部科技公司加快在保险领域的大模型布局。蚂蚁的大模型产品近日露出真容,...……更多
新华网举行“生成式人工智能内容安全与模型安全检测平台”(AIGC-Safe)邀请测试发布会
...流音频合成算法。AIGC-Safe平台内容安全功能检测速度快、准确率高、易于部署,有效降低产业安全技术投入成本,提高安全保护效率,可广泛应用于虚假新闻、AI换脸诈骗、活体攻击、版权内容保护和学术诚信等多种检测场景,...……更多
中国AI专利最多的5个公司!华为第5,平安第3,腾讯第1
...些复杂的分析和千人千面的方案都是AI秒级生成的,解析准确率高达98%。AI赋能的效果已初步显现。平安家医业务中,患者对在线问诊的五星好评率达到98%,电子病历甲级率高达99.8%,用药合规准确率是100%。 NO.4 国家电网人工智...……更多
古早费曼论文手写公式也能转LaTeX,马斯克Grok功能上线就火了
...有难度。而 Grok 可以把它们转化成如此工整的结果,而且准确率令人惊叹。图源:https://x.com/luismbat/status/1850925670408544355这个帖子吸引了众多研究人员的关注,整个帖子的浏览量已经突破 100 万。还有人晒出了自己用 Grok 识别出的...……更多
...项目面积大、位置偏远、银行网点和人员不足、人工观察准确率不高等客观情况,银行在贷前资产价值评估或者贷后定期风险监管环节存在痛点,进而导致介入力度受限。而空天数据,尤其是卫星遥感数据具有地理覆盖面广、客...……更多
盘古矿山大模型,首次!山东能源云鼎科技!
...眼睛,能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%,同时,全时段的巡检也能进一步帮助工作人员及时地发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。 在掘进场...……更多
春节流量给支付宝留下了什么?
...是能做的。”陈亮认为,当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能,不仅难以保持高准确率,而且维护困难,导致项目难以持续,大模型技术的引入给LUI提供了更多的可能。基于大模...……更多
更多关于科技的资讯:
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00
陕西数字贸易闪耀第四届数贸会 数字贸易合作成果丰硕
9月29日,为期5天的第四届全球数字贸易博览会(以下简称“数贸会”)在浙江杭州大会展中心圆满落下帷幕。此次盛会,陕西代表团表现亮眼
2025-10-01 18:58:00
高德扫街榜国庆提醒:全国十大吃货友好高铁站看这里
2025年国庆节与中秋节叠加,全国铁路预计发送旅客2.19亿人次。赶高铁如何吃饱吃好?今天,高德扫街榜发布“十大吃货友好高铁站”
2025-10-01 20:19:00
能效提升15%,山东港口日照港顺岸式全自动化码头再迎新突破
9月29日,在山东港口日照港全自动化集装箱码头,随着A23自动化轨道吊精准将集装箱吊起、转运,标志着日照港研发的新一代双悬臂轻量化轨道吊投产试运行
2025-10-01 23:08:00
健康之旅,“媒”好同行!爱康集团烟威区域媒体开放日圆满结束
为构建与公众的沟通桥梁,让烟威人民更好地了解爱康的医疗品质及优质体检服务,9月25日下午爱康集团烟威区域媒体开放日活动于爱康莱山区分院成功举办
2025-10-01 20:51:00
人工智能不仅能分析人脸情绪,还能读取脑电波信号,为人定制香氛;恐龙变为AI数字虚拟形象,成为人们的“萌宠”——这不是科幻电影
2025-09-30 08:09:00