• 我的订阅
  • 头条热搜
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几...……更多
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来了。不过,「超大杯」Opus依然没有亮相。让...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了传统的x86-64架构之外,安兔兔评测PC版还支持Arm64架构的新AIPC,两个版本评测体系完全一致,分数可以横向对比。下载安装时请注意选择符合您...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!从数字来看,面对实...……更多
OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
...网友直呼,“像魔术,AI Agent真的来了。”AI自己“玩”电脑这项能力的亮相,似乎又把AI大模型“卷”到了新高度。之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...团队提出的 DINO-WM 是一种可基于离线的轨迹数据集构建与任务无关的世界模型的简单新方法。据介绍,DINO-WM 是基于世界的紧凑嵌入建模世界的动态,而不是使用原始的观察本身。对于嵌入,他们使用的是来自 DINOv2 模型的预训...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...的风险。GUI Agent 基于大模型针对预设的任务自动化控制电脑手机等设备,即 “大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种...……更多
重大突破!Claude 3.5迎重磅升级:AI像人一样操控电脑
...引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。Claude 3.5 Sonnet模型的升级,使得AI可以模拟人类与计算机的交互方式,包括移动光标、点击屏幕以及通过虚拟键盘输入信息。这一功能的实现,得益于Anthropic推出的一...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation.github.io初识 GR-2:百炼出真金和许多大模型一样,GR-2 的训练包...……更多
...张吉英热情洋溢的语调,却有很强的感染力。我在笔记本电脑上打开了AI设计后台,上传录音,经过AI处理后,一段带有一点“中式风味”的英语视频就生成了。“确实,和原先呆板的视频相比,这个生动多了,活力四射。”我...……更多
...的人类测试对象,让他们认为自己在和人类对话。在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫...……更多
AI电脑操控完整测评:全自动搞定崩铁日常、还能创建炉石卡组
...道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为...……更多
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
...达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见...……更多
AI是重点 苹果M4系列将覆盖Mac全系:最快年内见
...产”。苹果计划从2024年底开始一直到2025年初发布全新的电脑产品,届时整个Mac产品线都将迎来更新。不出意外我们将会见到新的iMac、定位略低的14英寸MacBookPro、高端14英寸和16英寸MacBookPro以及Macmini——他们将全部配备M4芯片。...……更多
RTX 40系GPU AI性能首测
...幅提升效率。NVIDIAACE带来更真实的NPC互动其实在去年台北电脑展上NVIDIA就推出了NVIDIAACE游戏开发版Demo,利用混合AI驱动的自然语言交互技术,为游戏中的NPC带来改变,变得更为智能,从而提高了游戏的体验。该技术应用到游戏上...……更多
【多彩新论】加快推动文旅数字融合
当前,智慧旅游已经成为了旅游行业发展的重要方向和趋势。通过高科技手段的应用,可以为游客提供更加便捷、个性化和丰富的旅游服务和体验,同时也推动了旅游行业的快速发展,增强其在市场上的竞争力。推动文旅产业...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
大模型这把“火”,烧到了人形机器人
...一边接受商业规律的检验、一边推动技术走向成熟。个人电脑、互联网行业都经受住这样的考验,进而重塑了整个世界。人形机器人曾几度突围、几度停滞,现在借着大模型的风口,新一批公司又到了这个阶段。返回搜狐,查看...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...稿或者联系报道。网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下...……更多
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,本文发现当 RoboMamba 具备强大的推理能力后,我们可以通过极低的训练成本使得 RoboMamba 掌握多种操...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...限制人形机器人的全部能力,尤其是对于涉及全身运动的任务。该团队研究了之前的工作,发现它们提出了一些各不一样的控制模式,并且每种模式通常都是针对某些特定的任务,因此缺乏通用人形机器人控制所需的灵活性。而...……更多
拥有三块A6000的性能猛兽 惠普Z6 G5工作站评测
...卡、硬盘的数量和处理器核心数,就可以组装出至少三台电脑!而且这三台电脑每一台的性能,都算得上是最顶级的配置,可见惠普Z6 G5工作站性能的强大。接下来咱们首先对惠普Z6 G5的处理器、显卡、硬盘进行单独的性能跑分...……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...AI画风”。 图片来源:微博截图与手机对标的场景是PC(电脑)。1月,联想已经发布了AIPC产品,其在内嵌大模型后,有更强的算力支撑能力、人机交互更为智能、应用生态也更加开放。而金山办公(688111.SH)推出的WPS AI就是可...……更多
更多关于科技的资讯:
本文转自:人民网推进中国式现代化,科学技术要打头阵,科技创新是必由之路。2025年全国两会期间,科创无疑是最受关注的热词之一
2025-03-11 00:06:00
发现没法干翻苹果后 手机厂商开始强行兼容苹果
经常关注数码圈的差友应该都知道,各家厂商拿自家手机对标 iPhone,早就不是什么新鲜事儿了,从性能参数上的正面硬刚,再到外观设计上的争锋相对
2025-03-11 00:18:00
11999元起!华为Mate 70 RS非凡大师全系现货供应
快科技3月11日消息,去年11月,华为Mate 70 RS非凡大师正式发布,汇集了华为目前各方面最顶级的技术。此前该机一直供应不充足
2025-03-11 00:18:00
二次元AI新玩具破圈走红!短短几个月100万MAU
二次元圈子突然冒出了个AI新玩具,最近有点小火你可能在小破站、小红薯频频刷到一些精美的二次元图,belike:有的图非常复杂
2025-03-11 00:18:00
10毫秒直达大湾区!贵州算力“高速路”跑出品牌加速度|贵州有“数”
人眨眼一次是100~400ms,而从贵阳到杭州的数据传输,只需16ms,到广州、深圳仅需10ms。2023年,贵州建成全球首条400G算力通道
2025-03-11 00:26:00
等等党又赢了 今年可能会是智驾最卷的一年
想不到啊,在国内的新势力们卷了 N 年智驾之后,真正让智驾火出圈的,竟然是一直被说智驾不灵的比亚迪。靠着一手七万多就能用上的高阶智驾
2025-03-11 00:48:00
欧洲小青年,爱上中国“老头乐” | 出海 New Land
全球商业处于动荡和剧变之中,出海成为许多中国公司当下无法回避的命题。海外65亿人口,分散在近200个发展极不平衡的国家和地区
2025-03-11 05:56:00
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
2025年2月,如果不是长期从事人口研究的中国人民大学教授李婷的公开辟谣,很多人都真诚地相信了一组数据——“中国80后累计死亡率为5
2025-03-11 05:56:00
国产机器人,挺进欧美庭院
最近欧美消费圈曝出了一个大新闻——困扰欧美家庭多年的积雪,被来自中国的机器人解决了!各地网友纷纷秀出“壮汉十八,不如自家铲雪机器人微挖”的精彩表演
2025-03-11 05:56:00
想做企业级智能体的「AutoAgents」,获数千万元天使轮融资 | 涌现好项目
一句话介绍: 基于自研Multi-Agent架构,为企业提供部署到生产环节的智能体服务商。团队介绍:杨劲松(CEO):原达摩院产品/商业化总监
2025-03-11 05:56:00
消费热点洞见|OPPO Find N5:折叠屏赛道技术破局与市场博弈
2月20日晚,OPPO以一场充满未来感的技术盛宴,揭开了折叠屏赛道的新篇章——全新旗舰OPPO Find N5正式亮相
2025-03-11 05:56:00
中国AI情趣娃娃,成了全球抢手货
“成人用品”四个字,本身具有神秘的禁忌力量。在中国如果问“你用过吗”,答案多半是“我没有”。然而市场逐年上涨的消费额却侧面证明了这个市场——前景良好
2025-03-11 05:57:00
2025具身智能机器人发展大会在天津成功举办
2025年3月7日,2025具身智能机器人发展大会在天津国家会展中心隆重举行。本次大会以“智创未来——具身智能机器人产业发展与创新”为主题
2025-03-11 05:57:00
加速布局前置仓,京东要打怎样的一仗?| 氪金·大事件
作者 | 谢芸子 编辑 | 郑怀舟 近日,36氪从多处信源获悉,京东旗下自营超市“京东七鲜”正加速布局仓店,计划于今年6月底在天津新增20家仓店
2025-03-11 05:57:00
让一副眼镜“成精”,杭州“第七龙”藏不住了
全国每卖出10台消费级AR眼镜,就有3台是他家的,连天宫一号航天员也戴着他发明的眼镜在太空巡逻,做实时交互。他就是祝铭明
2025-03-11 05:57:00