• 我的订阅
  • 头条热搜
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几...……更多
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来了。不过,「超大杯」Opus依然没有亮相。让...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了传统的x86-64架构之外,安兔兔评测PC版还支持Arm64架构的新AIPC,两个版本评测体系完全一致,分数可以横向对比。下载安装时请注意选择符合您...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!从数字来看,面对实...……更多
OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
...网友直呼,“像魔术,AI Agent真的来了。”AI自己“玩”电脑这项能力的亮相,似乎又把AI大模型“卷”到了新高度。之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...Agent OpenDay上,该公司公布了Agent项目在手机端、浏览器、电脑端的新进展:手机端方面,AutoGLM新升级,可以理解超长复杂指令,自主执行超过50步的手机操作,还能跨App执行任务,如自主在小红书App检索网友推荐的美食食材后到...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...团队提出的 DINO-WM 是一种可基于离线的轨迹数据集构建与任务无关的世界模型的简单新方法。据介绍,DINO-WM 是基于世界的紧凑嵌入建模世界的动态,而不是使用原始的观察本身。对于嵌入,他们使用的是来自 DINOv2 模型的预训...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...的风险。GUI Agent 基于大模型针对预设的任务自动化控制电脑手机等设备,即 “大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种...……更多
重大突破!Claude 3.5迎重磅升级:AI像人一样操控电脑
...引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。Claude 3.5 Sonnet模型的升级,使得AI可以模拟人类与计算机的交互方式,包括移动光标、点击屏幕以及通过虚拟键盘输入信息。这一功能的实现,得益于Anthropic推出的一...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation.github.io初识 GR-2:百炼出真金和许多大模型一样,GR-2 的训练包...……更多
...张吉英热情洋溢的语调,却有很强的感染力。我在笔记本电脑上打开了AI设计后台,上传录音,经过AI处理后,一段带有一点“中式风味”的英语视频就生成了。“确实,和原先呆板的视频相比,这个生动多了,活力四射。”我...……更多
AI电脑操控完整测评:全自动搞定崩铁日常、还能创建炉石卡组
...道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为...……更多
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
...达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见...……更多
...的人类测试对象,让他们认为自己在和人类对话。在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫...……更多
AI是重点 苹果M4系列将覆盖Mac全系:最快年内见
...产”。苹果计划从2024年底开始一直到2025年初发布全新的电脑产品,届时整个Mac产品线都将迎来更新。不出意外我们将会见到新的iMac、定位略低的14英寸MacBookPro、高端14英寸和16英寸MacBookPro以及Macmini——他们将全部配备M4芯片。...……更多
RTX 40系GPU AI性能首测
...幅提升效率。NVIDIAACE带来更真实的NPC互动其实在去年台北电脑展上NVIDIA就推出了NVIDIAACE游戏开发版Demo,利用混合AI驱动的自然语言交互技术,为游戏中的NPC带来改变,变得更为智能,从而提高了游戏的体验。该技术应用到游戏上...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
大模型这把“火”,烧到了人形机器人
...一边接受商业规律的检验、一边推动技术走向成熟。个人电脑、互联网行业都经受住这样的考验,进而重塑了整个世界。人形机器人曾几度突围、几度停滞,现在借着大模型的风口,新一批公司又到了这个阶段。返回搜狐,查看...……更多
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...稿或者联系报道。网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...限制人形机器人的全部能力,尤其是对于涉及全身运动的任务。该团队研究了之前的工作,发现它们提出了一些各不一样的控制模式,并且每种模式通常都是针对某些特定的任务,因此缺乏通用人形机器人控制所需的灵活性。而...……更多
【多彩新论】加快推动文旅数字融合
当前,智慧旅游已经成为了旅游行业发展的重要方向和趋势。通过高科技手段的应用,可以为游客提供更加便捷、个性化和丰富的旅游服务和体验,同时也推动了旅游行业的快速发展,增强其在市场上的竞争力。推动文旅产业...……更多
拥有三块A6000的性能猛兽 惠普Z6 G5工作站评测
...卡、硬盘的数量和处理器核心数,就可以组装出至少三台电脑!而且这三台电脑每一台的性能,都算得上是最顶级的配置,可见惠普Z6 G5工作站性能的强大。接下来咱们首先对惠普Z6 G5的处理器、显卡、硬盘进行单独的性能跑分...……更多
更多关于科技的资讯:
□南京日报/紫金山新闻记者何洁 实习生杨久久国际审计留学来华学什么?中国审计智慧如何推动高质量共建“一带一路”行稳致远
2025-10-30 07:57:00
近日,第五届青年企业家创新创业盛典(简称“青创盛典”)在深圳成功举办。本次活动由北京、上海、深圳、广州、厦门等12个省市“双创”机构重点支持
2025-10-29 14:31:00
中新经纬10月29日电 (魏薇)“中国民营火箭企业正加速突破可重复使用技术瓶颈,预计一年内攻克液体可重复使用火箭核心难题
2025-10-29 14:41:00
大皖新闻讯 近日,知名火锅品牌巴奴毛肚火锅(以下简称巴奴)宣布11月1日起对会员体系进行全新升级,核心变动为会员等级判定标准从“消费次数”改为“消费金额”
2025-10-29 15:32:00
从频繁捡耳机到狂甩不掉,听智慧定制蓝牙耳机如何终结佩戴尴尬
通勤路上刚戴上耳机,一个哈欠就让右耳的耳塞滑进了衣领;晨跑时耳机随着步伐甩动,耳塞在耳道里反复松动,最后干脆“跳”出耳朵
2025-10-29 15:46:00
六大巨头携手唯欧口腔集团,战略合作共建产业新生态
在中国口腔医疗行业迈向高质量发展的重要阶段,产业链协同与国际化合作已成为推动行业升级的关键力量。2025年10月16日
2025-10-29 15:49:00
灵芝孢子油什么品牌好吃 2025年灵芝孢子油品牌排行榜TOP5
灵芝孢子油什么品牌好吃?这是消费者选购时最关注的核心问题。作为灵芝孢子油领域研究人员,本文结合行业数据与用户真实反馈,从有效含量
2025-10-29 15:50:00
远征 A2 完成第五次 OTA 升级,智元迈向场景应用”全面智能体”
近日,智元机器人正式宣布远征A2人形机器人完成第五次全量OTA升级。本次升级聚焦于机器人在动态环境下的语义理解、路径规划
2025-10-29 15:51:00
双11哪些家电值得买?抄作业!上榜的都是爆款
今年双11与往年复杂的促销玩法不同,今年各大电商平台进一步简化规则,通过热卖榜、新品榜等不同维度的榜单,为消费者提供更直观的购物参考
2025-10-29 16:29:00
双11家电市场观察:理性消费时代,品质与体验成破局关键
今年双11,各大平台简化玩法,推广“官方立减”“单件直降”等,以降低用户的决策成本、提升购物体验。同时,大促的日常化和高频化
2025-10-29 16:32:00
济宁移动智慧医疗与人工智能实验室揭牌成立
鲁网10月29日讯10月28日,由济宁移动、济宁市第一人民医院、国家健康医疗大数据研究院三方合作共建的智慧医疗与人工智能实验室揭牌仪式
2025-10-29 17:45:00
10月28日,太钢出口欧洲的首批绿钢产品启运。此次启运标志着太钢绿钢成功突破欧盟绿色产品市场,正式跻身产业链中高端。此次出口的304L不锈钢中板
2025-10-29 18:00:00
日前,“一键和解跨域共建放心消费多元共享”主题活动在杭州举行。太原市市场监督管理局与杭州、成都、厦门、南宁、兰州等五市共同签署《共建共享优化消费环境合作协议》
2025-10-29 18:00:00
【劲牌故事荟 大家谈友好】一金一铜背后是企业的创新升维
□楚青萱10月17日至19日,第二十九届全国发明展览会在石家庄国际会展中心举行,同期举办了“一带一路”暨金砖国家技能发展与技术创新大赛
2025-10-29 18:28:00
“码”上雄安,一触即发!雄安新区“企业码”创新应用系统上线
据中国雄安网消息,当数字中国的脉搏在雄安跳动,一座“未来之城”再次按下加速键。10月29日,雄安新区企业码创新应用系统正式上线
2025-10-29 18:28:00