• 我的订阅
  • 头条热搜
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几...……更多
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来了。不过,「超大杯」Opus依然没有亮相。让...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了传统的x86-64架构之外,安兔兔评测PC版还支持Arm64架构的新AIPC,两个版本评测体系完全一致,分数可以横向对比。下载安装时请注意选择符合您...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!从数字来看,面对实...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
...网友直呼,“像魔术,AI Agent真的来了。”AI自己“玩”电脑这项能力的亮相,似乎又把AI大模型“卷”到了新高度。之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...团队提出的 DINO-WM 是一种可基于离线的轨迹数据集构建与任务无关的世界模型的简单新方法。据介绍,DINO-WM 是基于世界的紧凑嵌入建模世界的动态,而不是使用原始的观察本身。对于嵌入,他们使用的是来自 DINOv2 模型的预训...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...的风险。GUI Agent 基于大模型针对预设的任务自动化控制电脑手机等设备,即 “大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种...……更多
重大突破!Claude 3.5迎重磅升级:AI像人一样操控电脑
...引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。Claude 3.5 Sonnet模型的升级,使得AI可以模拟人类与计算机的交互方式,包括移动光标、点击屏幕以及通过虚拟键盘输入信息。这一功能的实现,得益于Anthropic推出的一...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation.github.io初识 GR-2:百炼出真金和许多大模型一样,GR-2 的训练包...……更多
...张吉英热情洋溢的语调,却有很强的感染力。我在笔记本电脑上打开了AI设计后台,上传录音,经过AI处理后,一段带有一点“中式风味”的英语视频就生成了。“确实,和原先呆板的视频相比,这个生动多了,活力四射。”我...……更多
...的人类测试对象,让他们认为自己在和人类对话。在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
AI电脑操控完整测评:全自动搞定崩铁日常、还能创建炉石卡组
...道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为...……更多
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
...达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见...……更多
AI是重点 苹果M4系列将覆盖Mac全系:最快年内见
...产”。苹果计划从2024年底开始一直到2025年初发布全新的电脑产品,届时整个Mac产品线都将迎来更新。不出意外我们将会见到新的iMac、定位略低的14英寸MacBookPro、高端14英寸和16英寸MacBookPro以及Macmini——他们将全部配备M4芯片。...……更多
【多彩新论】加快推动文旅数字融合
当前,智慧旅游已经成为了旅游行业发展的重要方向和趋势。通过高科技手段的应用,可以为游客提供更加便捷、个性化和丰富的旅游服务和体验,同时也推动了旅游行业的快速发展,增强其在市场上的竞争力。推动文旅产业...……更多
RTX 40系GPU AI性能首测
...幅提升效率。NVIDIAACE带来更真实的NPC互动其实在去年台北电脑展上NVIDIA就推出了NVIDIAACE游戏开发版Demo,利用混合AI驱动的自然语言交互技术,为游戏中的NPC带来改变,变得更为智能,从而提高了游戏的体验。该技术应用到游戏上...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
大模型这把“火”,烧到了人形机器人
...一边接受商业规律的检验、一边推动技术走向成熟。个人电脑、互联网行业都经受住这样的考验,进而重塑了整个世界。人形机器人曾几度突围、几度停滞,现在借着大模型的风口,新一批公司又到了这个阶段。返回搜狐,查看...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...稿或者联系报道。网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操...……更多
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...限制人形机器人的全部能力,尤其是对于涉及全身运动的任务。该团队研究了之前的工作,发现它们提出了一些各不一样的控制模式,并且每种模式通常都是针对某些特定的任务,因此缺乏通用人形机器人控制所需的灵活性。而...……更多
拥有三块A6000的性能猛兽 惠普Z6 G5工作站评测
...卡、硬盘的数量和处理器核心数,就可以组装出至少三台电脑!而且这三台电脑每一台的性能,都算得上是最顶级的配置,可见惠普Z6 G5工作站性能的强大。接下来咱们首先对惠普Z6 G5的处理器、显卡、硬盘进行单独的性能跑分...……更多
更多关于科技的资讯:
2024平板电脑市场变天了:小米大增73%
市场调研机构Canalys公布了2024年全球平板电脑市场统计数据。最新数据显示,2024年第四季度全球平板电脑出货量达到3990万台
2025-02-08 17:15:00
软弹耐磨 鸿星尔克凌跃2.0跑鞋110元大促 吊牌299元
天猫【鸿星尔克官方旗舰店】鸿星尔克凌跃 2.0 跑鞋日常售价为 219 元,下单领取 70 元优惠券,首次购买用户叠加 7~10 元首购礼金
2025-02-08 17:15:00
韶音发布OpenFit 2 开放式耳机,开启舒适听音新时代
在2025年初举办的首届ShokzDay交流会上,作为开放式耳机、专业运动耳机赛道推动者的韶音,正式推出了新一代韶音舒适圈OpenFit2
2025-02-08 17:45:00
OPPO Find N5真机出炉:折痕最浅 机身全球最薄
快科技2月8日消息,今天下午,OPPO周意保晒出了Find N5折叠屏真机照。这款折叠屏不仅做到了全球最薄,折痕也是行业最浅
2025-02-08 17:45:00
小米回应春节期间夺手机第一:在不擅长的线下打败友商
快科技2月8日消息,据华尔街见闻援引供应链数据,2025年W5(1.27-2.2)春节期间,小米新机激活量达130万台
2025-02-08 17:45:00
七彩虹笔记本大升级!“虹光AI”智能助手接入满血DeepSeek
快科技2月8日消息,继联想“小天”之后,七彩虹科技升级全新“虹光AI”智能模型助手,正式将满血版DeepSeek R1模型引入
2025-02-08 18:15:00
2025年第一款双潜望旗舰!OPPO Find X8 Ultra 3月登场
快科技2月8日消息,博主数码闲聊站暗示,OPPO Find X8 Ultra会在3月份正式发布。对比上代Find X7 Ultra
2025-02-08 18:15:00
荣耀MagicBook Pro 14配置抢先曝光:酷睿Ultra 200H系列处理器 可流畅运行《黑神话:悟空》
快科技2月8日消息,2025年刚开年,荣耀就给了所有打算换本的同学一个大惊喜。昨晚,荣耀 PC 产品线总经理@朱臣才-荣耀 在微博上放出了新品笔记本荣耀MagicBook Pro 14的一段实测演示视频
2025-02-08 18:15:00
走出去 创未来丨亮晶晶:借数字化之力,破解潍企出海“密码”
大众网记者 杨晓玲 潍坊报道外贸是拉动经济增长的重要引擎,也是联结国内国际双循环的重要枢纽,跨境电商则是城市外贸经济的重要推动力
2025-02-08 18:38:00
胖东来:全村的希望
正月初五,胖东来蛇年营业第一天,不出意外的给其所在的小城——河南许昌,带来了一场市内“春运”。胖东来许昌地区门店每日总客流量超过30万人
2025-02-08 18:45:00
王腾包场请REDMI团队看《哪吒2》:大家都说REDMI和哪吒气质很像
快科技2月8日消息,今天,REDMI王腾包场请团队成员去看电影《哪吒2》。他表示,组织大家一起学习怎么打造优秀的产品,很多视觉效果对我们做设计和视觉都有借鉴意义
2025-02-08 18:45:00
ColorOS将全面接入DeepSeek:比友商方案更高效
快科技2月8日消息,ColorOS陈希宣布,本月底ColorOS将全面接入DeepSeek,小布助手将是首个和DeepSeek深度融合的系统智能助理
2025-02-08 18:45:00
提升购物体验,增加商业价值——揭秘电梯安装对购物中心
在繁华的都市中,购物中心如同一颗颗璀璨的明珠,吸引着无数消费者的目光。而电梯,作为购物中心的重要组成部分,其安装不仅提升了建筑的垂直交通效率
2025-02-08 19:25:00
2025年春节国际和港澳台漫游来访业务快速提升
本文转自:人民网人民网北京2月8日电 (记者申佳平)据工业和信息化部官网消息,2025年春节,得益于我国过境免签政策适用范围不断扩大
2025-02-08 19:38:00
负债千亿!苏宁系公告破产重整
快科技2月8日消息,苏宁系宣布破产!全国企业破产重整案件信息网发布苏宁电器集团有限公司、苏宁控股集团有限公司、 苏宁置业集团有限公司破产重整案件信息与一债会公告
2025-02-08 19:45:00