• 我的订阅
  • 头条热搜
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几...……更多
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来了。不过,「超大杯」Opus依然没有亮相。让...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了传统的x86-64架构之外,安兔兔评测PC版还支持Arm64架构的新AIPC,两个版本评测体系完全一致,分数可以横向对比。下载安装时请注意选择符合您...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!从数字来看,面对实...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
...网友直呼,“像魔术,AI Agent真的来了。”AI自己“玩”电脑这项能力的亮相,似乎又把AI大模型“卷”到了新高度。之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...Agent OpenDay上,该公司公布了Agent项目在手机端、浏览器、电脑端的新进展:手机端方面,AutoGLM新升级,可以理解超长复杂指令,自主执行超过50步的手机操作,还能跨App执行任务,如自主在小红书App检索网友推荐的美食食材后到...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...团队提出的 DINO-WM 是一种可基于离线的轨迹数据集构建与任务无关的世界模型的简单新方法。据介绍,DINO-WM 是基于世界的紧凑嵌入建模世界的动态,而不是使用原始的观察本身。对于嵌入,他们使用的是来自 DINOv2 模型的预训...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...的风险。GUI Agent 基于大模型针对预设的任务自动化控制电脑手机等设备,即 “大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种...……更多
重大突破!Claude 3.5迎重磅升级:AI像人一样操控电脑
...引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。Claude 3.5 Sonnet模型的升级,使得AI可以模拟人类与计算机的交互方式,包括移动光标、点击屏幕以及通过虚拟键盘输入信息。这一功能的实现,得益于Anthropic推出的一...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation.github.io初识 GR-2:百炼出真金和许多大模型一样,GR-2 的训练包...……更多
...的人类测试对象,让他们认为自己在和人类对话。在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
...张吉英热情洋溢的语调,却有很强的感染力。我在笔记本电脑上打开了AI设计后台,上传录音,经过AI处理后,一段带有一点“中式风味”的英语视频就生成了。“确实,和原先呆板的视频相比,这个生动多了,活力四射。”我...……更多
AI电脑操控完整测评:全自动搞定崩铁日常、还能创建炉石卡组
...道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为...……更多
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
...达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见...……更多
【多彩新论】加快推动文旅数字融合
当前,智慧旅游已经成为了旅游行业发展的重要方向和趋势。通过高科技手段的应用,可以为游客提供更加便捷、个性化和丰富的旅游服务和体验,同时也推动了旅游行业的快速发展,增强其在市场上的竞争力。推动文旅产业...……更多
AI是重点 苹果M4系列将覆盖Mac全系:最快年内见
...产”。苹果计划从2024年底开始一直到2025年初发布全新的电脑产品,届时整个Mac产品线都将迎来更新。不出意外我们将会见到新的iMac、定位略低的14英寸MacBookPro、高端14英寸和16英寸MacBookPro以及Macmini——他们将全部配备M4芯片。...……更多
RTX 40系GPU AI性能首测
...幅提升效率。NVIDIAACE带来更真实的NPC互动其实在去年台北电脑展上NVIDIA就推出了NVIDIAACE游戏开发版Demo,利用混合AI驱动的自然语言交互技术,为游戏中的NPC带来改变,变得更为智能,从而提高了游戏的体验。该技术应用到游戏上...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
大模型这把“火”,烧到了人形机器人
...一边接受商业规律的检验、一边推动技术走向成熟。个人电脑、互联网行业都经受住这样的考验,进而重塑了整个世界。人形机器人曾几度突围、几度停滞,现在借着大模型的风口,新一批公司又到了这个阶段。返回搜狐,查看...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...稿或者联系报道。网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...限制人形机器人的全部能力,尤其是对于涉及全身运动的任务。该团队研究了之前的工作,发现它们提出了一些各不一样的控制模式,并且每种模式通常都是针对某些特定的任务,因此缺乏通用人形机器人控制所需的灵活性。而...……更多
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、...……更多
更多关于科技的资讯:
Roxtec电缆和管道密封技术赋能济南地下管廊 为城市生命线安全 “护航”
随着城市化的快速发展,地下综合管廊已成为城市运转不可或缺的“隐形动脉”,承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多
2025-01-03 19:52:00
华为鸿蒙next5.0来袭,新增应用锁功能
每次提到手机系统的时候,原生鸿蒙就被提及,原因是其证明了中国人独立自主、自力更生的强大精神力量,这也是华为品牌影响力能够得到很大幅度提升的关键
2025-01-03 19:58:00
中新经纬1月3日电 题:电商运营模式差异决定补贴受益程度作者 司东海 巨丰投顾高级投资顾问1月3日上午,国务院新闻办公室举行“中国经济高质量发展成效”系列新闻发布会
2025-01-03 20:57:00
得物App开放日活动,身临其境体验正品保障全流程
如今,线上购物已成为人们日常生活不可或缺的一部分,而如何在海量商品中甄选出真正值得信赖的正品,成为了每一位消费者关注的焦点
2025-01-03 21:14:00
挥杆结缘品味清雅: 国缘V9高尔夫赛事成功营销案例复盘
近日,白酒行业在经济复苏与消费场景恢复的推动下稳步发展,高端白酒市场竞争愈发激烈。在此背景下,今世缘酒业的国缘V9凭借独特的高尔夫赛事营销项目成功突围
2025-01-03 21:49:00
又一位安徽餐饮老板要IPO,老乡鸡9个月收入近50亿,有望成“中式快餐第一股”
快餐的生意越来越不好做。 紧随小菜园,又一安徽餐饮品牌冲击港交所,这次是老乡鸡。撤回上交所主板上市申请近1年半后,1月3日
2025-01-03 22:14:00
美国科研新突破:抗老“神器”PSSOPP诞生,掀起社会热议浪
长生不老,这一人类亘古以来的梦想,正逐渐在科学的助力下变为现实。全球顶尖的研发机构纷纷投入大量的人才和资源,致力于寻找青春永驻的秘诀
2025-01-03 17:01:00
与拜耳分手自建销售团队,糖尿病市场老将陆宇加盟华领医药,华堂宁未来怎么卖?
华领医药组建销售团队。 2025年开年,华领医药(02552.HK)组建销售团队有了新进展。1月1日,华领医药对外宣布
2025-01-03 17:13:00
7000mAh超大电池!真我Neo7限时回归首销价:2099元起
快科技1月3日消息,在今天下午的不良人限定版发布会上,真我Neo7宣布限时重回首销价,2099元起。这是目前2K档最热门的机型之一
2025-01-03 17:14:00
国漫典藏级定制!真我Neo7《画江湖之不良人》限定礼盒发布:2899元
快科技1月3日消息,今天下午,真我Neo7《画江湖之不良人》限定版礼盒正式发布,售价2899元(16GB+512GB)
2025-01-03 17:14:00
老外评PS5十大年度游戏:《宇宙机器人》强势夺冠 《黑神话》第六
PushSquare之前曾开启过“2024年十大PS5游戏”的用户投票,每名玩家最多可以为五款游戏投票,共计12652有效票数
2025-01-03 17:14:00
499元配置良心!王腾:REDMI 14C没做任何宣传的情况下爆火了
快科技1月3日消息,日前,REDMI百元入门新机——REDMI 14C发布,起售价仅499元,新机配置十分良心,不仅有120Hz高刷新率屏幕
2025-01-03 17:15:00
男子利用小程序Bug逃匿28万加油费:获刑4年
1月3日消息,日常生活中确实会有不少“聪明人”,善于发现利用一些漏洞来为自己谋私利,然而这种行为往往会给自己带来严重的后果
2025-01-03 17:15:00
近日,国家医疗保障局(以下简称“国家医保局”)在北京举办“五年筑基 智启未来”医保码五周年活动,渤海银行股份有限公司(以下简称“渤海银行”)受邀参加并荣获“医保码优秀合作伙伴”证书
2025-01-03 17:20:00
本文转自:人民网人民网北京1月3日电 (记者王震)2024年12月29日,由国家制造强国建设战略咨询委员会指导,中国工业经济联合会联合十多家全国性行业联合会(协会)共同举办
2025-01-03 17:36:00