• 我的订阅
  • 头条热搜
OpenAI升级o3-mini模型思维链:提升AI推理过程透明度
...非凡实力。在软件基准测试SWE-bench Verified中,o3以71.7%的准确率傲视群雄,较其前辈o1模型性能提升超20%。在编程竞技领域,o3于Codeforces竞赛中的评分高达2727分,直逼OpenAI内部顶尖程序员的水平。更令人瞩目的是,在AIME数学竞赛...……更多
春节流量给支付宝留下了什么?
...是能做的。”陈亮认为,当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能,不仅难以保持高准确率,而且维护困难,导致项目难以持续,大模型技术的引入给LUI提供了更多的可能。基于大模...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...可能会掣肘大模型落地应用;需求尽快找到大模型落地与知识产权保护、数据隐私保护之间的平衡点;大模型幻觉问题仍未得到“根治”;大模型从“可用”到“好用”,需要供需双方协同发力,联合研发;部分领域应用积极响...……更多
蚂蚁数科SOFAStack发布全栈AI服务,助力企业用好大模型
...站式模型工作台,并实现可视化研发、管理多种具备行业知识库的Agent(智能体)应用,助力企业跑完企业AI应用业务落地的最后一公里。“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...中,AI会不断试错并打磨答案,从而显著提高生成结果的准确率和质量。有趣的是,点开AI思考的过程,还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认,这里展示的并不是原...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
... 作为备选。最终的报告结果将基于得分转换为 0 到 100 的准确率指标。未来也可以在我们动态更新的榜单里查看多模态模型在每个月动态更新的最新评测数据,以及在榜单上的最新评测的结果。 ……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...分数提高了 13.6/100(与基线比),在 MGSM 的数学任务中将准确率提高了 14.4%。此外,在跨域迁移后,它们在 GSM8K 和 GSM-Hard 数学任务上的准确率分别比基线提高了 25.9% 和 13.2%。与手工设计的解决方案相比,本文算法表现出色,这...……更多
支付宝进军大模型医疗应用,技术一号位:我们有4个切入点
...准等方面都建立了很深度的链接。目前我们在北上杭这块准确率,基本上能做到百分之八九十,还在继续优化中。第二个是全科医生。医疗领域面临一个主要问题是,AI目前还无法替代专业医生进行诊断。因此我们更多地将AI定...……更多
...AI智能分派助手”,分派响应时间压缩至秒级,工单分派准确率达90%以上。同步开发自动分派插件,非工作时间自动流转至对应部门,提升基层服务效能。日常工作中,可同时处理数十条市民诉求,1秒内响应并自动匹配至对应处...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...效率提升了25%。在智能办公领域,大模型目前的意图识别准确率已达到97%。奇富科技则透露,通过AIGC的强大赋能,在电销系统中,语义分析和线索挖掘帮助提升电销线索识别准确率高达98%,同时将转化率提高超过5%。在智能营销...……更多
...考”“思考多少”。在多个数学数据集上,AutoThink实现了准确率与效率平衡,既提升性能又节省算力,展示出较强的适应性和实用性。营造更合理的AI创新环境国际劳工组织5月20日发布一份有关生成式AI与就业的报告表示,全球...……更多
中兴通讯携手上海移动开展业界首个基于大模型的短信反诈治理探索
...、语义等根源维度上进行治理,有效提升诈骗短信的识别准确率、拦截率和召回率。自该系统上线后,境外涉诈案件数量明显降低,为减少人们财产损失、维护社会和谐做出贡献。基于大模型的短信反诈治理主要包括AI实时推理...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...于 Python、C++、J等多种语言。在HumanEval基准测试中,它的准确率为53% ,接近于GPT-4的67% 。Mistral CEO确认新模型性能接近GPT-42月1日,Mistral联合创始人兼CEO Arthur Mensch在X上表示,引发众多猜测的“miqu-1-70b”是……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...知、检索增强式生成(RAG)和自适应生成能力,研发问答准确率超过 90%。据统计,通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时,随着通义大模型在语义理解、代码生成、开发工作流等方面全面进化,通义灵码的...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...中,Gemini 1.5 Pro能够在长达100万token的文本块中,以99%的准确率找出隐藏有特定信息的文本片段。 图源:Gemini 1.5 Pro官方测试数据这个上下文长度使Gemini 1.5 Pro可以自如地处理22小时的录音、超过十倍的完整的1440页的书(587,287字..……更多
蚂蚁集团井贤栋:恪守科技伦理,推动AI向善而行
...严谨产业,业界普遍认为面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。而垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...建立规则,使得相同信息覆盖面上比基于传统规则的方法准确率提高62%。同时,作者还与2位临床专家合作对100个样本的标签进行了全面的评估,进一步 帮助微调LLM。基于该数据集,作者提出了一种新的基于图(Graph)的可解释...……更多
...跳声,与数据库中的海量数据进行比对,“它让基层筛查准确率提升60%、复杂先心病诊断准确率提升至95.3%。”舒强说。CHANGE是怎么诞生的?CHANGE大模型并非一蹴而就,它的背后,是浙江近30年新生儿救护经验的积累,以及救护...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...的推理过程。如上图中的红色实线所示,模型所能达到的准确率与所给定的推理长度呈正相关。且相比于传统的多次采样 + 投票(Majority Voting),模型思维链长度增加展现出了更高的效率。最惊艳的是,发布即上线:所有用户均...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...e given problem about geometric shapes.」可以看到,性能并不好,准确率只有 36%,应该有很大的改进空间。不过,在使用 APE 之前,让我们先尝试下一种提示技术:思路链(CoT)推理;这种技术虽然对原始提示词修改不多,但事实证明却...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...深度信息获取、远近关系比较的任务上,可以达到 99%+ 的准确率。2. 针对空间理解任务,作者公布了 SpatialBench 榜单。通过精心设计和标注 QA,测试模型深度理解能力。SpatialBot 在榜单上展示了和 GPT-4o 接近的能力。模型如何理解...……更多
从“政务助手”到“故障预言家”,人工智能可以赋能哪些场景?
...,自动化分析公文内容,比对归档规则,输出归档结果,准确率达到90%以上,分类归档工作效率提升近80%。未来,该智能体将持续迭代更新,通过实际使用搜集语料,进一步提升模型分析准确度。在衢州,浙江移动衢州分公司成...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...理能力,并证实了我们的训练策略的有效性。除了更高的准确率外,我们的模型实现的推理速度比 LLaMA-AdapterV2 和 ManipLLM 快 7 倍,这可以归因于 Mamba 语言模型的内容感知推理能力和效率。图 4. RoboVQA 上与机器人相关的推理对比...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...识别数据图上的信息,并按要求以图表的形式重新呈现,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的正确率高于原正确率(图4) 正确率提升与自我评估的准确率高度相关(图4(c):),甚至呈线性关系(图5(a))。 采用不同的评价方式效果依次提升:仅使用对/错评价 < 自然语言评价 < 包含 CoT 的对/错评价。这是因为 C...……更多
协同发展,生态聚合丨1024程序员节暨「源聚一堂」开源技术沙龙(北京站)成功举办
...于开发者的节日里,开发者们在美食节、精彩节目、开源知识有奖问答、互动魔术与游戏,现场K歌等精彩互动中尽情狂欢。让开发者卸下代码和工作,参与线下的狂欢盛宴,领略开发者的多彩风格!广大开发者们以极客精神,...……更多
银行业拥抱DeepSeek:可用于哪些场景?如何保障数据安全?
...据的挖掘与分析,重塑金融服务模式,实现金融语义理解准确率与业务效率双突破。据该公众号介绍,江苏银行于2023年研究并开发出大语言模型服务平台“智慧小苏”,此次通过引入DeepSeek大语言模型,“智慧小苏”在复杂多模...……更多
刘庆峰透露“星火X1”7月份再升级
...在案件要素抽取、诉请答辩分析、法律法规推荐等场景的准确率,都超过了DeepSeek R1模型。”据了解,今年4月,科大讯飞助力的安徽省检察院AI辅助办案系统已上线运行。刘庆峰透露,在高考和世博会等场合表现不俗的星火X1,...……更多
中国财税GPT迎来最准确的大模型:小竹财税AI问世
...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型,小竹财税AI将不断提升其逻辑推理和上下文理解能力,以更好地满足用户的需求,努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多
AI搜索助手心流正式上线
...户的复杂问题。“心流在长文本评测实验中达到超过99%的准确率,具有非常优秀的长文本阅读能力。”据心流的技术人员介绍,在语义理解方面,心流的直接理解能力优于当前市场上的主流模型,间接理解能力(包含复杂推理)...……更多
更多关于科技的资讯:
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00
鲁网11月26日讯近日,莱商银行郓城西城小微支行迎来了一位熟悉的客户李大爷。他手持莱商银行新换发的金融IC卡,脸上却写满了困惑与焦虑
2025-11-26 11:13:00
鲁网11月26日讯近年来,莱芜农商银行雪野旅游区公司业务营销中心认真贯彻落实“五篇大文章”,聚焦科技型企业发展,创新“转型全周期”服务模式
2025-11-26 11:17:00
摘下体外诊断“皇冠上的明珠” 一个国产医疗器械企业的逆袭之路
大河网讯(记者 申华 赵檬)十多年前,国内医学实验室流水线市场70%以上都被国际大公司垄断,我国连一台能自主生产的流水线设备都没有
2025-11-26 11:34:00