• 我的订阅
  • 头条热搜
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
...GPT-4o和Gemini-1.5-pro表现最佳,分别达到了56.1%和55.2%的平均准确率。在所有细分领域中,GPT-4o在摩擦和加速度方面表现优越。相比之下,Gemini-1.5-pro在理解与重力、弹性、反射、吸收与透射、颜色和刚性相关的物理常识方面表现更...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...OpenAI于8月推出的SWE-bench Verified代码生成评估基准中,o3的准确率为71.7%,比o1高出了22.8个百分点。o3还在2024年美国AIME数学竞赛中取得了96.7%准确率的高分,只缺了一道题,并在GPQA Diamond(一套研究生水平的生物、物理和化学试题)...……更多
ChatGPT击败50名人类医生!疾病诊断准确率达90%
用ChatGPT诊断疾病,准确率已经超过了人类医生?!斯坦福大学等机构进行了一轮随机临床试验,结果人类医生单独做出诊断的准确率为74%。在ChatGPT的辅助之下,这一数字提升到了76%。有意思的是,如果完全让ChatGPT“自由发挥...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...测试效果GPT-4o 和 Llama-3.1-70B 模型在 ExploreToM 数据集上的准确率分别只有 9% 和 0%,凸显了现有 LLM 在处理复杂 ToM 推理方面的不足。在 ExploreToM 数据上进行微调后,模型在经典 ToMi 基准测试中的准确率提高了 27 个百分点,证明……更多
...发法律纠纷、监管处罚,导致严重财务损失。合同质检的准确率与合规性保障,也直接影响了客户对银行的信任程度。而通过大语言模型的应用,合同质检的准确率能够显著提升。DeepSeek-VL2多模态模型的细粒度文档理解能力,解...……更多
山东省电力气象技术创新中心获批成立
...荷预测气象服务平台,10-11月助力聊城全网用电负荷预测准确率提升1个百分点,已在全省推广。智慧电力气象技术支撑平台“融合分析”界面在作业保障方面,聚焦作业窗口期预报、作业风险预警等方向,初步实现了气象实况和...……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...模型AI视觉算法应用于针织生产环节,帮助企业提升验布准确率及速度,增强产品品质把控度,大幅度实现降本增效。并通过ERP重构升级,统一部署针织、经编和染整系统,助力企业实现生产、销售、采购、库存等各个环节的数...……更多
...功能网络视图。大量实验显示,其多阶段诊断和风险预测准确率分别达74.2%和84.5%,比当前已有的先进诊断方法平均高出10个百分点。日前,该研究成果发表于《IEEE模式分析与机器智能汇刊》(IEEE TPAMI)。“码农”能为精准医疗...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...提升测试结果显示,经过CodeDPO优化后,代码模型的生成准确率和效率,都获得了一定提升。★代码准确性实验研究团队在HumanEval(+),MBPP(+)和DS-1000三个数据集上进行了广泛实验,涵盖8种主流代码生成模型,包含Base模型和SF...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值,后者则涵盖全部53个任务。与虽然使用的数据不是最多,但与其...……更多
国网河南电力:研发新能源气象监测与功率预测平台
...映天气变化过程对整个区域的影响,且不同程度存在预测准确率低、预测周期短、预测自主性弱等问题。今年2月,国网河南电力组织科研团队研发新能源气象监测与功率预测平台以及相关技术,该平台集成了D5000、中央气象台、...……更多
OpenAI开发ChatGPT「反作弊神器」,99.9%超高命中率!但没发布
...OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个AI工具网页几乎成了当代大学生标配。学生热衷于在ChatGPT的帮...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...AI 原生 App “支小宝” 采用这套框架,在政务问答场景的准确率提升到了 91%,医疗问答垂直的指标解读准确率可达 90% 以上。梁磊还透露,KAG 框架会进一步向社区开放,并在开源框架 OpenSPG (https://github.com/OpenSPG/openspg) 中原生支..……更多
生成一周大气模拟仅需9.2秒,谷歌气候模型登Nature
...候的准确性以及效率。论文显示,NeuralGCM在1到15天的预报准确率与ECMWF不相上下,而ECMWF拥有全世界最先进的传统物理天气预报模型;加入海平面温度后,NeuralGCM的40年气候预测结果与从ECMWF数据中得到的全球变暖趋势一致;NeuralG...……更多
机器学习助力预测全球变暖趋势:30秒完成22天大气模拟
...依次向前推进系统。图片来自谷歌研究NeuralGCM的气候模拟准确率与最好的机器学习和物理方法相当。该模型对1-15天预报的准确率能媲美欧洲中期天气预报中心(ECMWF,最好的传统物理天气模型之一)的预测结果。对于最多提前10...……更多
人脸识别智能门锁销量激增126%!终端市场均价下降近5成
...的售价同步降低。另外,人脸识别方案已从2D升级为3D,准确率进一步提高。2D人脸识别为最早期的人脸识别技术,主要通过图像识别,成本相对更低,但受光照、表情、角度等因素的影响,准确率也较低。3D人脸识别引入了深度...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...显示,微软云Azure的收入增长达到31%,其中人工智能增长7个百分点。国内,万兴科技2023年财报显示,公司全年实现营业收入14.81亿元,同比增长25.49%;归母净利润8620.57万元,同比增长113.20%,扣非净利润8968.31万元,同比大增817.45%。公司投入...……更多
谷歌推出ai气象模型gencast,预测准确度超越ens
...测试,GenCast在1320种不同变量和提前时间的组合测试中,准确率超过ENS的97.2%,在提前36小时以上的预测中,准确率更是高达99.8%。此外GenCast在预测极端高温、低温和强风等方面持续优于ENS,并能更准确地预测台风/飓风的路径,...……更多
钢铁与算法:当AI用在工业界,到底能有多强大
...凌晨时段巡检的艰辛作业,还大幅提升了检测效率和检测准确率。一个大模型就能覆盖8大类型、350多种故障,而且故障识别率已经提高到了99%以上。当这种模拟能力被用在设计领域,简直就是个神器。比如建筑设计,曾经是极...……更多
...的。但在大多数基准测试中,Gemini Ultra只比GPT-4高出几个百分点。换句话说,谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果Gemini Ultra真如谷歌所说那样在明年1月初发布,那么可能不会在顶级人工...……更多
全面AIGC时代,豆包模型家族准备好了
...用级联模型方法,即先进行语音识别再进行机器翻译。但准确率低,实时性差,且翻译的声音体验不好。而豆包·同声传译模型采用了端到端模型架构,让翻译更加精准、质量更高、时延更低。同时会模拟说话人的真人发音,媲...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...e given problem about geometric shapes.」可以看到,性能并不好,准确率只有 36%,应该有很大的改进空间。不过,在使用 APE 之前,让我们先尝试下一种提示技术:思路链(CoT)推理;这种技术虽然对原始提示词修改不多,但事实证明却...……更多
...术,应用企业的平均开采回采率、选矿回收率均提升9个百分点,综合利用率提升15个百分点,矿业产值增加超过3700亿元。 ……更多
高技术产业蓬勃发展 中国经济向前“进”
...“跑出”的增速,这个增速比全部投资增速还要高出6.9个百分点,投资“新引擎”的地位日渐凸显。分领域来看,一季度高技术制造业投资同比增长10.8%,高技术服务业投资同比增长12.7%。这组高速增长的数据意味着有更多企业...……更多
大模型成了“服装设计师”
...图案对AI模型进行训练,开发出的大模型能以高达95.7%的准确率重现原始缝纫图案。英国皇家艺术学院副校长奈伦·巴菲尔德表示,从构思和概念阶段到原型制作,再到制造、分销、回收,AI对服装业的影响将是“革命性的”。与...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。 文心一言、豆包、天工、智谱清言、商量因为...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
...滑的主要原因是国内需求疲软,去年第四季度收缩了0.3个百分点,相比之下净出口则增加了0.2个百分点。“最拖后腿的是消费,已经连续下滑了三个季度,特别是服务业消费(下降0.6%,上一季度增长0.3%)自2022年第一季度来首次...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM...……更多
DeepMind大模型再登Nature:8分钟预测15日天气,超顶尖物理模型
...进步,通过机器学习赶上了并超越了基于物理的模型。 准确率超最强传统方法传统天气预报基于数值天气预报(NWP)算法实现,核心是对模拟大气动力学的方程求近似解。不过,相比于单一确定性的预测,气象机构越来越依赖...……更多
中国式现代化数字政府应用场景河北典型案例⑤:保定市行政审批局让政务服务在网上更有温度
...减少到6%,降低6个百分点,大大提高了事项申报成功率和准确率。在保定市定兴县,保定致宁医药销售有限公司一分公司负责人张园,通过视频导办帮办系统完成药品经营许可证增加许可项目现场勘验后,对服务赞不绝口。“不...……更多
更多关于科技的资讯:
本报讯 (记者 闫 利)罐头行业是我国传统的出口产业,罐头产品也是目前食品工业重要的出口产品。从大家熟知的桃罐头、橘子罐头到蘑菇罐头
2025-02-27 11:14:00
享受以旧换新优惠 消费者“扎堆儿”买手机
本报讯 (记者 史晓菲 文/摄)今年开始,购买手机等3C产品享受以旧换新优惠政策,截至目前,新政策实施两个月,手机等产品销售火爆
2025-02-27 11:14:00
本报讯 (记者 解 磊) 2月20日—22日,由中国眼镜协会、中国中轻国际控股有限公司主办的第23届中国上海国际眼镜业展览会在上海浦东举行
2025-02-27 11:15:00
腾讯元宝入驻微信“九宫格”:便捷下载,深度体验
2月27日消息,腾讯对腾讯元宝的推广又加了大力度。日前有媒体报道称,腾讯内部已协调部署,微信“九宫格”正在灰度测试给腾讯元宝提供下载入口
2025-02-27 11:21:00
国网山东信通公司:视频赋能配电室,智能守护电力安全
在电力系统运维领域,配电室的安全稳定运行至关重要。国网山东信通公司不仅凭借创新建设配电室视频监测系统,为配电室的安全运行带来全方位保障和质的飞跃
2025-02-27 11:22:00
【鲸创焕新】五载深耕积淀,社区家装生态再升级
【鲸创焕新】五载深耕积淀,社区家装生态再升级2019年诞生于常州,我们以革新存量房改造为己任。面对行业长期存在的"改造周期长
2025-02-27 11:34:00
小米SU7 Ultra第三款配色来了:“鹦鹉绿”实车公布
快科技2月27日消息,小米SU7 Ultra将在今晚7点正式发布,刚刚官方公布出了全新配色——鹦鹉绿。自此,小米SU7 Ultra已经公布出了三款配色
2025-02-27 11:36:00
价值48元 《王者荣耀》今天免费送皮肤了
快科技2月27日消息,《王者荣耀》今天上线戈娅新皮肤“玫蓝誓约”,参与游戏内【玫蓝誓约】活动,可免费获取。该限时活动在2月27日版本更新后逐步开启
2025-02-27 11:36:00
造谣对比测试时迈巴赫轮胎被放气 尊界法务:已关注、均充分取证
快科技2月27日消息,近日尊界S800和迈巴赫S级对比测试一事闹得沸沸扬扬,节奏四起。其中有人称迈巴赫S级在测试中被动了手脚——轮胎被放气
2025-02-27 11:36:00
佰维推出全球首款双档EXPO配置内存!DDR5-8000/6400 CL34/28可选
快科技2月27日消息,佰维宣布其DW100 OCLAB联名内存即将上市,这款内存条专为AMD X870 (E)、B850平台优化
2025-02-27 11:36:00
仅限主力薅羊毛!京东外卖开启补贴政策:最高减20元!
快科技2月27日消息,今日,京东外卖宣布推出了“餐补优惠活动”。据了解,京东推出的这一优惠政策包含:“满15元减10元”
2025-02-27 11:36:00
5000只海鸥入侵英国小镇 鸟屎满天飞还高空抛骨头
阿尔弗雷德·希区柯克执导的恐怖电影《群鸟》,电影中鸟群攻击人类的场景,如今照进现实,在英国一小镇上演。据报道,至少有5000只海鸥“入侵”了该地区
2025-02-27 11:36:00
对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发
搜狐科技高端访谈栏目《1号位》与知名企业家、公司高管展开深度对话,本期我们邀请到商汤科技联合创始人&首席科学家
2025-02-27 11:36:00
衢州联通引领智慧医疗新篇章:DeepSeek人工智能系统成功接入当地三甲医院
近日,衢州联通携手衢州市人民医院及生态公司,积极响应国家关于人工智能与医疗健康深度融合的战略部署,成功将DeepSeek人工智能系统全面接入衢州市人民医院(温州医科大学附属衢州医院)
2025-02-27 11:36:00
园区“法人服务总入口”开启公测
从能办可办到好办易办,苏州工业园区以行政审批的“颗粒度”提升企业无感直达体验度。全国首创“AI服务总入口”、在全国率先打造“Person in Enterprise”(PIE)用户体系
2025-02-27 11:39:00