• 我的订阅
  • 头条热搜
...与没有“动作域获取”影响的情况下执行相同任务相比,准确率分别提高了59%和89%。研究人员希望在可预见的未来为“动作域获取”找到其他家务用途。能够解决问题“语言引导的抽象”框架也让机器人能够像人一样更好地理解...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...知、检索增强式生成(RAG)和自适应生成能力,研发问答准确率超过 90%。据统计,通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时,随着通义大模型在语义理解、代码生成、开发工作流等方面全面进化,通义灵码的...……更多
百度文心大模型4.0技术进展
...确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有...……更多
高途深度整合DeepSeek,全面升级AI赋能教育模式
...时,在用户产品侧,以DeepSeek为技术核心的高中数学测评准确率提升了15%,高中AI选科规划服务借由AI助力也实现了质量的提高。高途教育科技集团联合创始人罗斌表示:“以DeepSeek-R1为代表的技术创新,将大模型技术在教育场景...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
...语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中人机协作的巨大潜力。在现代化工具的帮助下,...……更多
...客服场景已运行5个月,实测数据显示,大模型意图理解准确率达91%,已接近于人,相较于传统AI的68%有较大提升。不仅如此,天镜能同时在多个文档的文字、图表等多模态文本中找到并融合答案,充分理解后将其组织为人更容易...……更多
我在百度大模型应用升级里,找到了企业增收提效的最佳路径
...面,甄知将传统被动式的搜索知识转变为主动获取知识,准确率高达90%。 喻友平现场演示了基于甄知平台构建的参会小助手,其可以以自然语言方式交互,为用户解答会议相关地点、报名等问题,提供产品最新升级知识信息点...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...中,深度研究所使用的模型在专家级问题上达到了26.6%的准确率,刷新之前的18.2%的纪录。 相比之下,DeepSeek的R1模型的准确率是9.4%。这一测试由全球众多领域专家共同开发,目的是评估人工智能在广泛学科领域的表现,被视为...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于英语。在大语言模型(LLMs)不断发展的背景下,如何评估这些模型在多轮对话和多语言环境下的指...……更多
大模型能省钱了:国内首个“AI评标师”已上岗
...审系统通过运用AI技术进行采购场景创新,使得智能评审准确率大幅提升。据了解,国家能源集团的智能无人评审系统实现了非招标采购全类别(物资、工程和服务)、全评审方式(询价通知单、最低价、综合评估法)全覆盖。...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...学场景。 所有数据和代码、模型均已开源。MMedBench 上的准确率,图 d 展⽰了在 MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...时音频文件,5分钟转录完毕,提炼仅需1分钟,角色分离准确率超95%;提供销售、访谈等12种场景模板,转录准确率超96%,总结准确率超90%。帮助企业及其员工在每一次交流中,都能快速挖掘到宝贵的信息价值。 星火投标 专业...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...模型消耗的运算资源非常大。为了解决大模型应用效率和准确率问题,刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...理能力,并证实了我们的训练策略的有效性。除了更高的准确率外,我们的模型实现的推理速度比 LLaMA-AdapterV2 和 ManipLLM 快 7 倍,这可以归因于 Mamba 语言模型的内容感知推理能力和效率。图 4. RoboVQA 上与机器人相关的推理对比...……更多
钉钉自己挤上牌桌
...比不同模型和工作流程得出结果的性能:仅用GPT-3.5模型准确率为48%,仅用GPT-4模型准确率为67%,GPT-3.5+Agent效果高于GPT-4模型的表现,GPT-4+Agent的效果则远高于GPT-4模型。 AI Agent市场的快速发展也超出很多人的预估。MarketsandMa……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义在于,有望在更广泛的领域应用,例如,药物发现、材料科学、编程、高等数学和物理等。o1 实...……更多
海信星海大模型接入DeepSeek
...景做试点应用。以数据自动化标注为例,DeepSeek R1(32B)准确率相较其他同参数模型准率提升3%,准确率达到99.67%,从过去半自动化标注全面过渡到全自动化标注,人工投入极大降低。海信星海大模型于2024年9月位列C-Eval评测榜单...……更多
聚焦2024数博会|城市拥堵存难题?百度有新解
...交通流量的变化规律,进行交通流量的五分钟短时预测,准确率在80%以上,进一步保障信控优化效果。同时,百度通过利用百度地图+百度大模型的整合技术优势,利用交通大模型的推荐策略,可以实现个性化精准提示,让市民...……更多
浪潮数字商业发布基于大模型的 数字员工3.0解决方案 -- 金叶智系列 数字化转型解决方案
...烟草行业特定图像识别任务中,提高模型训练效率和识别准确率,满足大规模门店巡查和实时数据分析需求。自然语言处理与交互:基于自然语言处理技术,构建智能交互对话系统,运用语音识别技术将用户语音指令准确转化为...……更多
...了多次实战应用,经灾后对比核实,全省总受灾人口预测准确率达96%,为省级和各地方应急部门的台风风险研判和指挥调度提供了科学量化的决策参考。2024年,上海发布《上海市加快推进韧性安全城市建设的意见》,提出全面...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...更显得“有理有据”了。新模型现身竞技场,网友第一波实测最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...多路径召回的文本内容,进行重排序,进一步提升回答的准确率。 其中,“界面识别模型” 强化了对用户手册中最常见软件界面的支持,主要得益于很多用户都喜欢使用截图来对知识库进行提问。该模型训练数据提取自浩鲸科...……更多
医疗大模型激战正酣,京东健康锋芒再露
...求。”数据显示,京东健康皮肤医院基于大模型的AI辅诊准确率超过95%,皮肤医院开发的专病随访服务患者付费转化率已达20%。准确性数据的背后是一个个真实的辅诊案例,中国医科大学附属第一医院皮肤科郭昊医生就曾分享过...……更多
荣耀Magic V5发布,一文看懂YOYO到底有多强大
...息和自动执行任务方面表现出色,例如,MagicGUI模型操作准确率高达91.5%,MagicVL-Nano端侧模型可在保护用户隐私安全基础上实现低功耗图像理解;此外,荣耀构建的三款云端大语言模型,可实现个性化推理、精准理解用户意图;...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...有正确答案的问题),百融云创大模型在回答非IDK问题时准确率达到67.7%左右,回答IDK问题时的准确率达到33.3%,整体准确率达到50.5%,略高于ChatGPT3.5的50.3%。孔子曰,知之为知之,不知为不知,是知也,一个“聪明”的大模型也...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...突破,最高的测试成绩达到了类人水平。o3软件工程测试准确率比o1高近47% 竞赛数学高15% 人类博士专家级生化物高近13%今年9月,OpenAI 发布o1的预览版o1 preview时称,o1是第一个具备真正通用推理能力的大模型,它的核心能力推理...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非依靠理解和推理的情况下就能得出正...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...调模型。经过测试,人类在该基准上可以达到至少82.1%的准确率,但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类,分别只有64.7%和59.9%。 目前全部数据已经上传至HuggingFace仓库。仓库地址:https://huggingface.co/da……更多
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
...行业巨头如GPT-4——便在测试数据集上实现了28.18%的答案准确率提升和13.89%的工具使用精度提高。这挑战了AI开发中的一个惯有想法:更大的模型必然能带来更好的结果。教会AI在使用外部工具和依赖内部知识之间进行判断——就...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但...……更多
更多关于科技的资讯:
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00