• 我的订阅
  • 头条热搜
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几...……更多
o1带火的CoT到底行不行?新论文引发了论战
To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来了。不过,「超大杯」Opus依然没有亮相。让...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了传统的x86-64架构之外,安兔兔评测PC版还支持Arm64架构的新AIPC,两个版本评测体系完全一致,分数可以横向对比。下载安装时请注意选择符合您...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力,但对于AI Agent(包括当前王牌选手Claude)来说,情况变得更糟了!从数字来看,面对实...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
...提供迈向 AGI 所需的广度和通用性。下图为 Imagen 3 生成的电脑游戏图像,提示词为「一张电脑游戏图片,展示了一个粗糙的石洞或矿井内部场景。观看者的位置是第三人称视角,位于玩家头像上方,向下看向头像。玩家头像是一...……更多
OpenAI劲敌甩大招!Claude 3.5模型升级,能力反超GPT-4o,训练AI自己操控电脑
...网友直呼,“像魔术,AI Agent真的来了。”AI自己“玩”电脑这项能力的亮相,似乎又把AI大模型“卷”到了新高度。之前各大厂商为了提升模型逻辑推理能力,可谓是下了不少功夫。但在“执行”和“操作”能力方面,一直还是...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...Agent OpenDay上,该公司公布了Agent项目在手机端、浏览器、电脑端的新进展:手机端方面,AutoGLM新升级,可以理解超长复杂指令,自主执行超过50步的手机操作,还能跨App执行任务,如自主在小红书App检索网友推荐的美食食材后到...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...团队提出的 DINO-WM 是一种可基于离线的轨迹数据集构建与任务无关的世界模型的简单新方法。据介绍,DINO-WM 是基于世界的紧凑嵌入建模世界的动态,而不是使用原始的观察本身。对于嵌入,他们使用的是来自 DINOv2 模型的预训...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...的风险。GUI Agent 基于大模型针对预设的任务自动化控制电脑手机等设备,即 “大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种...……更多
重大突破!Claude 3.5迎重磅升级:AI像人一样操控电脑
...引人注目的就是Claude 3.5 Sonnet模型,可以像人类一样操控电脑。Claude 3.5 Sonnet模型的升级,使得AI可以模拟人类与计算机的交互方式,包括移动光标、点击屏幕以及通过虚拟键盘输入信息。这一功能的实现,得益于Anthropic推出的一...……更多
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模
...出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。GR-2 官方项目页面:https://gr2-manipulation.github.io初识 GR-2:百炼出真金和许多大模型一样,GR-2 的训练包...……更多
...张吉英热情洋溢的语调,却有很强的感染力。我在笔记本电脑上打开了AI设计后台,上传录音,经过AI处理后,一段带有一点“中式风味”的英语视频就生成了。“确实,和原先呆板的视频相比,这个生动多了,活力四射。”我...……更多
...的人类测试对象,让他们认为自己在和人类对话。在一篇新论文中,来自加利福尼亚大学圣迭戈分校的认知科学研究人员发现,在超过一半的时间里,人们会把GPT-4写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫...……更多
AI电脑操控完整测评:全自动搞定崩铁日常、还能创建炉石卡组
...道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成...……更多
【多彩新论】 绘好“六大产业基地”工笔画
习近平总书记指出,新时代新征程,以中国式现代化全面推进强国建设、民族复兴伟业,实现新型工业化是关键任务。今年以来,全省坚持把新型工业化作为高质量发展的首要任务,大抓工业、大兴工业、大干工业,着力打造...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...德拉开场先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为...……更多
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
...达芬奇,是否可以通过模仿学习,来学习外科手术的操作任务呢?经过实验后,他们成功了!组织操作、针头处理和打结这三项基本的手术任务,达芬奇都可以自己独立完成了。首先是需要医学生苦练指法的缝合打结技术,只见...……更多
AI是重点 苹果M4系列将覆盖Mac全系:最快年内见
...产”。苹果计划从2024年底开始一直到2025年初发布全新的电脑产品,届时整个Mac产品线都将迎来更新。不出意外我们将会见到新的iMac、定位略低的14英寸MacBookPro、高端14英寸和16英寸MacBookPro以及Macmini——他们将全部配备M4芯片。...……更多
RTX 40系GPU AI性能首测
...幅提升效率。NVIDIAACE带来更真实的NPC互动其实在去年台北电脑展上NVIDIA就推出了NVIDIAACE游戏开发版Demo,利用混合AI驱动的自然语言交互技术,为游戏中的NPC带来改变,变得更为智能,从而提高了游戏的体验。该技术应用到游戏上...……更多
【多彩新论】加快推动文旅数字融合
当前,智慧旅游已经成为了旅游行业发展的重要方向和趋势。通过高科技手段的应用,可以为游客提供更加便捷、个性化和丰富的旅游服务和体验,同时也推动了旅游行业的快速发展,增强其在市场上的竞争力。推动文旅产业...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
大模型这把“火”,烧到了人形机器人
...一边接受商业规律的检验、一边推动技术走向成熟。个人电脑、互联网行业都经受住这样的考验,进而重塑了整个世界。人形机器人曾几度突围、几度停滞,现在借着大模型的风口,新一批公司又到了这个阶段。返回搜狐,查看...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...稿或者联系报道。网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算,它可以帮你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下...……更多
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
继Anthropic之后,OpenAI也要接管人类电脑了?!就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员)”,为用户自动执行任务。配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、...……更多
更多关于科技的资讯:
2025“星耀巴南·菁储行未来星”人才计划首站走进重庆科技大学
3月7日,巴南软件园&重庆数字经济人才市场巴南市场携手巴南优质软信和数字经济企业开启2025“星耀巴南·菁储行未来星”人才计划首站——重庆科技大学
2025-03-10 23:08:00
蔚来李斌:别人家孩子都已经上大学了 我们还在复读
快科技3月10日消息,据36氪汽车报道,今年2月25日,一名即将离职的蔚来员工发长文吐槽,提出十条建议,呼吁公司应尽快从务虚转化为务实
2025-03-10 23:18:00
李想亮相湖南卫视节目:我比所有做汽车的更懂互联网
在湖南卫视近日播出的《夺金2025》创业节目中,六名青年创客抵达了北京理想汽车总部,开展了多维度的研学实践。作为理想汽车CEO
2025-03-10 23:18:00
深圳机器人跑步惊呆歪果仁 与人类无异 网友:北马见
国产机器人,再次惊呆了歪果仁。这一次,靠的是像极了人类的跑步姿势,来感受一下这个feel:这便是深圳众擎机器人最新发布的视频
2025-03-10 23:18:00
劳力士手表价格暴跌 有人卖块表赔了一台保时捷
快科技3月10日消息,据报道,二手劳力士手表价格近期正在持续下跌。“熊猫迪”已从40万元跌到19万元,一些型号更是跌破了劳力士发行的公价
2025-03-10 19:48:00
182.3米世界坝体最高!江苏句容抽水蓄能电站3号机组并网发电
快科技3月10日消息,据央视新闻报道,今天位于江苏句容市的国网新源江苏句容抽水蓄能电站3号机组正式并网发电。至此,该站首批3台机组已全部投运
2025-03-10 19:48:00
出色影像加持,华为nova 13 Pro氛围感照片触手可得
在这个时代,一张好看的照片胜过千言万语。你是否曾经因为拍不出美照而错失记录生活的机会?是否曾因为不会给女朋友拍照而被嫌弃
2025-03-10 19:48:00
网友买到三只松鼠发霉面包要求道歉 客服:赔偿2000元 道歉信没有
近日,据媒体报道,有网友买到三只松鼠发霉面包。该网友称,该发霉面包是从三只松鼠电商旗舰店购得,入口后闻到臭味,发现面包发霉现象
2025-03-10 19:48:00
网友脑洞大开!华为Pura 80鬼才设计图曝光
快科技3月10日消息,有网友放出了一张华为Pura 80的“鬼才设计图”,其最大看点是镜头模组是四分之一圆,四台手机组合在一起就能拼成一个完成的圆形
2025-03-10 19:48:00
对话全国政协委员、康希诺朱涛:疫苗出海需创新与差异化,国家免疫规划扩容是必然趋势
“我们不可能一天就把免疫计划扩容到跟发达国家一样多的品种。随着国内企业在疫苗供给、疫苗质量和技术水平方面的逐步提高,国家免疫规划扩容必然会来临
2025-03-10 19:54:00
秒“算”神机,西部大山为“哪吒”生出澎湃算力|贵州有“数”
据网络平台数据:《哪吒之魔童闹海》(《哪吒2》)全球电影票房(含预售及海外)超越《复仇者联盟3:无限战争》进入全球票房榜前6名
2025-03-10 20:15:00
13万就有激光雷达智驾!零跑B10搭同级唯一高通8650智驾芯片
快科技3月10日消息,零跑汽车今日晚间举办零跑B10预售发布会。零跑汽车介绍,B10为13万级首搭激光雷达高阶智驾的车型
2025-03-10 20:18:00
“县城贵妇”们开始纷纷加入二手经济
快科技3月10日消息,近日,转转集团发布2024女性二手消费洞察。数据显示,2024年转转平台女性用户同比增长70%,女性用户在高价值品类的交易中占比显著提升
2025-03-10 20:18:00
10倍长!微信正式官宣:朋友圈可以发5分钟视频了
快科技3月10日消息,微信,作为我们日常生活中不可或缺的社交工具,一直在不断创新和优化,为用户带来更加丰富的使用体验。以往
2025-03-10 20:18:00
鲁网3月10日讯(记者 陈珊珊 通讯员 韩巧苓)在人工智能技术飞速发展的当下,楼宇经济作为城市产业的关键支撑,正面临着数字化
2025-03-10 20:43:00