• 我的订阅
  • 头条热搜
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
...GPT-4o和Gemini-1.5-pro表现最佳,分别达到了56.1%和55.2%的平均准确率。在所有细分领域中,GPT-4o在摩擦和加速度方面表现优越。相比之下,Gemini-1.5-pro在理解与重力、弹性、反射、吸收与透射、颜色和刚性相关的物理常识方面表现更...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...OpenAI于8月推出的SWE-bench Verified代码生成评估基准中,o3的准确率为71.7%,比o1高出了22.8个百分点。o3还在2024年美国AIME数学竞赛中取得了96.7%准确率的高分,只缺了一道题,并在GPQA Diamond(一套研究生水平的生物、物理和化学试题)...……更多
ChatGPT击败50名人类医生!疾病诊断准确率达90%
用ChatGPT诊断疾病,准确率已经超过了人类医生?!斯坦福大学等机构进行了一轮随机临床试验,结果人类医生单独做出诊断的准确率为74%。在ChatGPT的辅助之下,这一数字提升到了76%。有意思的是,如果完全让ChatGPT“自由发挥...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...测试效果GPT-4o 和 Llama-3.1-70B 模型在 ExploreToM 数据集上的准确率分别只有 9% 和 0%,凸显了现有 LLM 在处理复杂 ToM 推理方面的不足。在 ExploreToM 数据上进行微调后,模型在经典 ToMi 基准测试中的准确率提高了 27 个百分点,证明……更多
山东省电力气象技术创新中心获批成立
...荷预测气象服务平台,10-11月助力聊城全网用电负荷预测准确率提升1个百分点,已在全省推广。智慧电力气象技术支撑平台“融合分析”界面在作业保障方面,聚焦作业窗口期预报、作业风险预警等方向,初步实现了气象实况和...……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...模型AI视觉算法应用于针织生产环节,帮助企业提升验布准确率及速度,增强产品品质把控度,大幅度实现降本增效。并通过ERP重构升级,统一部署针织、经编和染整系统,助力企业实现生产、销售、采购、库存等各个环节的数...……更多
...功能网络视图。大量实验显示,其多阶段诊断和风险预测准确率分别达74.2%和84.5%,比当前已有的先进诊断方法平均高出10个百分点。日前,该研究成果发表于《IEEE模式分析与机器智能汇刊》(IEEE TPAMI)。“码农”能为精准医疗...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...提升测试结果显示,经过CodeDPO优化后,代码模型的生成准确率和效率,都获得了一定提升。★代码准确性实验研究团队在HumanEval(+),MBPP(+)和DS-1000三个数据集上进行了广泛实验,涵盖8种主流代码生成模型,包含Base模型和SF...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值,后者则涵盖全部53个任务。与虽然使用的数据不是最多,但与其...……更多
国网河南电力:研发新能源气象监测与功率预测平台
...映天气变化过程对整个区域的影响,且不同程度存在预测准确率低、预测周期短、预测自主性弱等问题。今年2月,国网河南电力组织科研团队研发新能源气象监测与功率预测平台以及相关技术,该平台集成了D5000、中央气象台、...……更多
OpenAI开发ChatGPT「反作弊神器」,99.9%超高命中率!但没发布
...OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个AI工具网页几乎成了当代大学生标配。学生热衷于在ChatGPT的帮...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...AI 原生 App “支小宝” 采用这套框架,在政务问答场景的准确率提升到了 91%,医疗问答垂直的指标解读准确率可达 90% 以上。梁磊还透露,KAG 框架会进一步向社区开放,并在开源框架 OpenSPG (https://github.com/OpenSPG/openspg) 中原生支..……更多
生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature
...候的准确性以及效率。论文显示,NeuralGCM在1到15天的预报准确率与ECMWF不相上下,而ECMWF拥有全世界最先进的传统物理天气预报模型;加入海平面温度后,NeuralGCM的40年气候预测结果与从ECMWF数据中得到的全球变暖趋势一致;NeuralG...……更多
人脸识别智能门锁销量激增126%!终端市场均价下降近5成
...的售价同步降低。另外,人脸识别方案已从2D升级为3D,准确率进一步提高。2D人脸识别为最早期的人脸识别技术,主要通过图像识别,成本相对更低,但受光照、表情、角度等因素的影响,准确率也较低。3D人脸识别引入了深度...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...显示,微软云Azure的收入增长达到31%,其中人工智能增长7个百分点。国内,万兴科技2023年财报显示,公司全年实现营业收入14.81亿元,同比增长25.49%;归母净利润8620.57万元,同比增长113.20%,扣非净利润8968.31万元,同比大增817.45%。公司投入...……更多
机器学习助力预测全球变暖趋势:30秒完成22天大气模拟
...依次向前推进系统。图片来自谷歌研究NeuralGCM的气候模拟准确率与最好的机器学习和物理方法相当。该模型对1-15天预报的准确率能媲美欧洲中期天气预报中心(ECMWF,最好的传统物理天气模型之一)的预测结果。对于最多提前10...……更多
谷歌推出ai气象模型gencast,预测准确度超越ens
...测试,GenCast在1320种不同变量和提前时间的组合测试中,准确率超过ENS的97.2%,在提前36小时以上的预测中,准确率更是高达99.8%。此外GenCast在预测极端高温、低温和强风等方面持续优于ENS,并能更准确地预测台风/飓风的路径,...……更多
...的。但在大多数基准测试中,Gemini Ultra只比GPT-4高出几个百分点。换句话说,谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果Gemini Ultra真如谷歌所说那样在明年1月初发布,那么可能不会在顶级人工...……更多
钢铁与算法:当AI用在工业界,到底能有多强大
...凌晨时段巡检的艰辛作业,还大幅提升了检测效率和检测准确率。一个大模型就能覆盖8大类型、350多种故障,而且故障识别率已经提高到了99%以上。当这种模拟能力被用在设计领域,简直就是个神器。比如建筑设计,曾经是极...……更多
全面AIGC时代,豆包模型家族准备好了
...用级联模型方法,即先进行语音识别再进行机器翻译。但准确率低,实时性差,且翻译的声音体验不好。而豆包·同声传译模型采用了端到端模型架构,让翻译更加精准、质量更高、时延更低。同时会模拟说话人的真人发音,媲...……更多
...术,应用企业的平均开采回采率、选矿回收率均提升9个百分点,综合利用率提升15个百分点,矿业产值增加超过3700亿元。 ……更多
高技术产业蓬勃发展 中国经济向前“进”
...“跑出”的增速,这个增速比全部投资增速还要高出6.9个百分点,投资“新引擎”的地位日渐凸显。分领域来看,一季度高技术制造业投资同比增长10.8%,高技术服务业投资同比增长12.7%。这组高速增长的数据意味着有更多企业...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...e given problem about geometric shapes.」可以看到,性能并不好,准确率只有 36%,应该有很大的改进空间。不过,在使用 APE 之前,让我们先尝试下一种提示技术:思路链(CoT)推理;这种技术虽然对原始提示词修改不多,但事实证明却...……更多
大模型成了“服装设计师”
...图案对AI模型进行训练,开发出的大模型能以高达95.7%的准确率重现原始缝纫图案。英国皇家艺术学院副校长奈伦·巴菲尔德表示,从构思和概念阶段到原型制作,再到制造、分销、回收,AI对服装业的影响将是“革命性的”。与...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
...滑的主要原因是国内需求疲软,去年第四季度收缩了0.3个百分点,相比之下净出口则增加了0.2个百分点。“最拖后腿的是消费,已经连续下滑了三个季度,特别是服务业消费(下降0.6%,上一季度增长0.3%)自2022年第一季度来首次...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。 文心一言、豆包、天工、智谱清言、商量因为...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM...……更多
DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型
...进步,通过机器学习赶上了并超越了基于物理的模型。 准确率超最强传统方法传统天气预报基于数值天气预报(NWP)算法实现,核心是对模拟大气动力学的方程求近似解。不过,相比于单一确定性的预测,气象机构越来越依赖...……更多
中国式现代化数字政府应用场景河北典型案例⑤:保定市行政审批局让政务服务在网上更有温度
...减少到6%,降低6个百分点,大大提高了事项申报成功率和准确率。在保定市定兴县,保定致宁医药销售有限公司一分公司负责人张园,通过视频导办帮办系统完成药品经营许可证增加许可项目现场勘验后,对服务赞不绝口。“不...……更多
数字驱动,产业风起势来
...能力,年吞吐量3042万件,年订单处理能力107万件,出库准确率99.99%,能够保证药物24小时内配送到山东省内各基层医疗机构。“数字平台投用后,出库准确率、运输安全性明显提升,而物流成本明显下降。”山东九州通医药有限...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00