• 我的订阅
  • 头条热搜
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA 3.1 405B(准确率为……更多
ui自动化测试技术发展历程
...时,执行机的脚本执行监控与管理尤为重要,例如自动化任务中的脚本分发情况、任一设备的脚本执行进度、实时画面,这些对自动化测试的故障排查、设备资源合理分配起到重要作用。民生银行开发了APP、WEB、PC执行机旁观者...……更多
本周(4.8-4.14)AI界发生了什么?
...,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11日,据彭博社,为了提振低迷的电脑业务,苹果正准备借助AI功能,彻底改造整个Mac产品线。新版Mac将配置具备AI功能的M4芯片,预计首批最...……更多
【多彩新论】 “AI预测考题”本质是偷换概念
高考迎来冲刺,考生和家长厉兵秣马,社交平台也分外热闹。不少自媒体称,可以利用AI预测考题,包括语文作文题、数学压轴题等;甚至有自媒体打出“命中率98%”的旗号。这是真的吗?6月5日,中国互联网联合辟谣平台发布...……更多
ChatGPT重磅升级GPT-4.1:编程专家模型登场
...体表现上表现出色。OpenAI声称,该模型特别擅长处理编程任务,能精确遵循指令,避免不必要的冗长输出。在实际测试中,GPT-4.1比GPT-4o更注重效率,不再过度聊天,这让它在专业场景中更可靠。同时,其整体性能与最新版GPT-4o...……更多
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...数据收集和推理过程中的所有计算都在一台消费级笔记本电脑上进行,该笔记本电脑配有英伟达3070ti GPU (8gb VRAM)和英特尔i7-12800H。物料单中高价值量的部件英伟达“网红研究员”、OpenAI第一个实习生Jim Fan此前乐观预测,2024年...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...i-2.5-Pro。同时,在主流开源模型中,Qwen3-235B-A22B也在通用任务、数学和科学任务、多语言任务和代码任务上,全面超越Meta在4月初发布的LLaMA-4-Maverick和DeepSeek-V3模型,成为目前最强大的开源模型。值得一提的是,Qwen3-235B-A22B相对……更多
ColorOS 14评测:让用户更省心的智慧手机系统
...多的工作可以在手机上来完成,但是仍有部分工作需要在电脑等专业设备上来完成,这时如何将我们在手机上的数据与工作任务无缝迁移到电脑上便成为了一大难题。为了解决这个难题,ColorOS 14带来了PhoneLink功能,通过与微软...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...本。相较于ChatGLM2新增的1.5B版本,已经能够部署在笔记本电脑、手机和汽车上。CEO张鹏介绍,ChatGLM3主要在4四个方面进行了性能提升:接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力。接入了代码增强模块 Code Interp...……更多
全新七彩虹将星x17promax首发评测
...笔记本市场开始热闹了起来。同时,眼下AIPC正成为个人电脑市场的新趋势,英特尔的14代酷睿家族也正是AIPC的排头兵,在此趋势下,各大PC品牌也都在努力打造具备顶级AI算力的产品,比如七彩虹就在1月9日带来了旗舰算力产品...……更多
懒人狂喜,会洗衣做饭的家务机器人来了
...来扩展系统。整个设置包括网络摄像头和带有消费级GPU的电脑,价格约为32,000美元,比现成的双手动机器人便宜得多,后者价格高达20万美元。ALOHA集成了移动基地和全面的远程操作界面,以实现全身控制。该系统旨在模拟复杂...……更多
三星Galaxy W25开启系统测试,或与S25系列同期发布
...将同期亮相。 参考相关爆料,三星 Galaxy Tab S10系列平板电脑将带来标准版、Plus版和Ultra版三款机型,均将搭载天玑9300+ 处理器。其中Galaxy Tab S10 Ultra的外观设计与S9 Ultra 基本保持一致,但是厚度减少了0.05mm;仍将采用14.6 英寸……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...的文本,则展示了娴熟而准确的技能应用。表6呈现了,新论文所提出的方法,在4个案例中实现了最高准确率。总之,作者提出一个LLM提取元认知知识框架,其形式是根据解决问题所需的概念,对数学数据集中的问题进行分类的...……更多
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
...越了包括GPT-4o在内的一众知名AI模型,仅在MMLU(大规模多任务语言理解)和MATH(数理)数据集上略逊于GPT-4o,且优于自家此前最强的模型Claude 3 Opus。来源:Anthropic在Anthropic此前发布的Claude 3系列模型中,小型模型叫做Haiku,Sonne……更多
【多彩新论】幼儿园“AMC班”引争议:超前教育何时休?
近日,上海某幼儿园计划开设“AMC班”的消息引起广泛关注。尽管园方称课程仍在研发中,但招生咨询已透露其“超前”与“应试”的教育倾向,似已触及国家明令禁止的“超前教育”红线,且其每月8800元的费用也引发敛财质...……更多
如何查看电脑的硬盘读取速度
电脑的硬盘读取速度是指硬盘在读取数据时的速度,通常以数据的传输速率表示。硬盘读取速度的快慢直接影响到电脑系统的响应速度、数据处理效率和用户体验。在实际使用电脑的过程中,了解硬盘的读取速度可以帮助用户...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...经济的解决方案,但由于需要大量的人力(尤其是对复杂任务),在模拟环境中增加任务多样性仍面临挑战。这就导致典型的人工模拟基准通常仅能包含数十到数百个任务。如何解决呢?近年来,大语言模型在自然语言处理及各...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...奇迹」,因为不久前这些模型还很难完成竞赛中最简单的任务,但现在却达到了不容忽视的高度。他表示,「我们有理由相信,这种进步会持续下去,AI 可能会在编程竞赛领域继续取得新的突破。」陶哲轩实测后续除了 Codeforces...……更多
【多彩新论】深化国企改革增强核心竞争力
国有企业是中国特色社会主义的重要物质基础和政治基础,是党执政兴国的重要支柱和依靠力量。自《国有企业改革深化提升行动方案(2023-2025年)》印发以来,新一轮国企改革进程过半,各地国资国企认真按照改革要求,特...……更多
【多彩新论】强化“幼有善育”的法治保障
今天,《贵州省学前教育条例》政策解读新闻发布会举行。作为学前教育法颁布后率先出台的省级地方性法规,《条例》为学前教育法在贵州落地落实提供法治保障,回应了群众“上好园”的期盼。学前教育事关千家万户,是...……更多
榜样的力量·身边的业务尖兵|董森:做好金融风险守门人
...想,不鹜于虚声。多年来,董森“要数据,来找我”“修电脑,我过去”“写材料,请给我”“现场检查,请选我”这样的声音仍未停止,他仍在坚持做好每一件小事、完成每一项任务、履行每一项职责、担当每一份责任,仍然...……更多
...数据,虽然覆盖了移动、抓取、放下这些移动场景中很多任务,但是场景非常单一,只是在谷歌的厨房里。这一模型在他们的厨房里执行任务的成功率相当高,数据显示,在这个场景中,它执行任务的成功率高达97%。但一旦出了...……更多
微软发布首批AI电脑,配专用Copilot按钮,暂不卖给个人用户
...间周四,微软发布了首批配备专用Copilot按钮的Surface个人电脑,可以快速访问人工智能聊天机器人,这实现了该公司今年1月份的承诺。在键盘的箭头键左侧新增了一个专用按钮,标志着数十年来电脑键盘设计的重大变革。尽管微...……更多
智启新元年:PC成为AI落地首选终端
...AI市场颇有些“无AI 不产品”的感觉,但手机、PC、平板电脑、智能穿戴设备等多种终端,到底哪个能够最大化释放AI能力呢?首先,我们必须明确一个合格的AI终端需要具备哪些特征。从算力角度看,万亿级参数大模型的训练任...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大...……更多
笔记本市场需要新故事,Ryzen AI开了个好头
...构Strategy Analytics此前发布的调查数据,2021年全球笔记本电脑的出货量同比增长19%,达到创纪录的2.68亿台。不过2022年,全球笔记本电脑市场表现逐渐低迷。根据Canalys发布的数据,2022年第四季度全球笔记本电脑出货量下降30%,至5...……更多
想要购买AI电脑?需要考虑的几个关键参数
你的笔记本电脑是否跟不上你的工作量?也许是时候升级了。AIPC现在流行起来,也是功能强大的机器,旨在处理苛刻的任务,但正确选择AI电脑我们要关注哪些方面呢?检查AIPC的CPU任何人工智能电脑的核心都是它的处理器或CPU。...……更多
DeepSeek,大消息
...系统性能而设计的并行计算方案。这些策略通过合理分配任务、协调资源利用和减少通信开销,实现在多核、分布式或异构系统中的高效并行执行。最近,DeepSeek动作不断。此前,该公司宣布将DeepEP向公众开放。在宣布后的约20...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
Sora终于要来了?OpenAI放出“王炸”,奥尔特曼透露:AI智能体有望明年实现,AGI的到来将比大多数人预期的早
...来的时间会比世界上大多数人想象的要早,能够完成复杂任务的AI智能体将在明年成为现实。图片来源:X平台 Sora、满血o1要来了?OpenAI的消息一出,网友们炸开了锅,纷纷开始猜测OpenAI的“圣诞大礼包”里到底装了些什么。“S...……更多
更多关于科技的资讯:
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00