• 我的订阅
  • 头条热搜
Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
【新智元导读】AI接管人类电脑,未来已来!Claude自主操控电脑,从编程到科研无所不能,代表着万能API。另一边,OpenAI内部加急研发多智能体AI,已经有了雏形。AI像人一样操作电脑,已然成为下一个前沿。两天前,Anthropic进...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
【新智元导读】太科幻了,深夜上线的Claude,可以像人类一样使用计算机了?查看屏幕、移动光标、点击按钮、输入文本,还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...序员」是能独立自主完成研发任务的 AI 智能体,可承接人类指派的软件研发生命周期中的各类任务。它目前预置了三个使用场景:缺陷修复、需求 0-1 实现、研发问答。我们可以合理地认为,这是三个针对不同任务配置了不同系...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更为复杂的任务,且比此前的GPT-4o有显著提升。奥特曼发...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。 其次,o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在...……更多
通义灵码AI编程能力再进化,说几句话就能开发网页
...内最受欢迎的辅助编程工具。全新升级的通义灵码模拟了人类程序员的能力,可完成更复杂、更全面的任务;通义灵码还可以脱离专业IDE软件,在web端直接执行缺陷修改、需求分析、代码实现、问题排查等任务工作流,兼具架构...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。OpenAI招外包大军,教AI学人类思考会编程的AI,几家硅谷大厂都在做。DeepMind的AlphaCode,据说「吊打72%人...……更多
限定120分钟科研挑战,o1和Claude表现超越人类
2小时内,Claude和o1就能超过人类专家平均科研水平。甚至AI还会偷摸儿“作弊”(doge)。事情是这样的——人类 VS AI科研能力大比拼,也有新的评估基准了。代号“RE-Bench”,由非营利研究机构METR推出,目的是搞清:当前AI智能...……更多
...字。依靠强大的压缩能力,大模型几乎把所有互联网上的人类知识都压缩到了一个模型之中,让其变得无所不知。而且这种压缩功能不是简单的信息抽象化和符号化,大模型能从海量信息里发掘潜在规律,从而更好的预测下一个...……更多
中小学如何做好人工智能课程建设
...人工智能未来发展的过程,也是培养学生掌控人工智能与人类世界关系的责任感和使命感的过程。依据核心素养明确课程目标当前,我国中小学人工智能教育处于探索阶段,存在着课程价值取向不明确、课程内容与人工智能领域...……更多
Agent调用能力取得重大突破!阿里开源最强编程模型Qwen3-Coder
7月23日清晨,阿里开源全新的通义千问AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,比肩全球最强的编程模型Claude4。千问3编程模型在代码能力及Agent调用能力方面取得重大突破。借助Qwen3-Coder,刚入行的程序员一天...……更多
...本是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。“大规模多任务语言理解”结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试人工智能掌握知识和解决问题的能力。而在大型语言模型 (LL...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...对 / 张彦君▲随着相关技术的突飞猛进,AI也在加速介入人类的现实生活。图/新华社微软的AI程序员尚在演示(DEMO)阶段,国内首个AI(人工智能)程序员已经宣布正式上岗。据报道,国内某大模型企业近期正在内部推行AI编程...……更多
阿里AI三连发,连夺三项第一
...识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型完全可比肩Gemini-2.5 pro、o4-mini等顶尖闭源模……更多
两个人工智能系统说起“悄悄话”
...“悄悄话”两个AI系统实现相互对话,预示着AI系统将像人类一样进行互动交流。图片来源:slguardian.org科技日报北京3月24日电 (记者张佳欣)瑞士日内瓦大学的一个科学家团队在人工智能(AI)研究方面取得一项突破:他们让两...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...于Genie的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解决现实生活中的软件问题。首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。以解决GitHub Issue为例,先喂给Genie一个r...……更多
一大批人形机器人正被装上“最强大脑”,准备送进车厂打工!
...克认为,将来人形机器人将成为工业主力,数量有望超越人类,预计达到100亿—200亿台。人形机器人发展到什么地步了?是否能真正替代人类完成复杂的任务?技术瓶颈和高昂成本又能否在短期内突破? “一下子多出了几十家...……更多
前瞻2024人工智能四大趋势
...零开始”的方式训练的人工智能。其特点是,智能不来自人类活动的数据,且其有能力修改自身代码以适应更复杂的学习任务。前者使得人工智能能力的发展变得愈发不透明,而后者向来被看作是诞生人工智能“奇点”的必要条...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...AI能和你玩你画我猜……简单来说,越来越像一位真正的人类助手了。Gemini 1.0上下文窗口为32k,基于谷歌自家的TPUs v4 和 v5e进行大规模训练。这次,谷歌顺势推出了新的TPU 系统 Cloud TPU v5p,希望为训练AI模型的客户提供支持。△G...……更多
...理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本最高效,用于智能手机等设备端,执行无...……更多
研发者谈斯坦福家务机器人:泛化能力还不行,暂无商业计划
...些?符梓鹏:我们希望未来智能机器人真的能每天都帮助人类。 澎湃科技:该系统使用名为Action Chunking with Transformers(ACT)的算法。它与Generative Pre-trained Transformers(GPT)相比有何不同?符梓鹏:GPT是自然语言模型……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion。图像-文本模型生成 主要代表作有Flamingo、VisualGPT。Flamingo 是DeepMind推出的小样本学习模型,基于可以分析视觉场景的视觉模型和执...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...到系统的层次结构、模块划分、控制流和数据流等方面。人类架构师统筹起来尚且不容易,而文心快码在拥有了架构师的能力后,可以通过代码解释,快速了解函数在「真实业务背景下的含义」。不仅如此,为了更清楚地洞见编...……更多
江南观察|MCP协议赋能人机协同研究新机遇
...,确保信息从源语言到目标语言的准确传递,使AI能够像人类一样“思考”,快速抓住关键信息,并组织出最符合的语言表达。然而,其生成内容本质上是基于词频概率统计的随机结果,存在固有的“随机性”。AI只能遵从逻辑...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
...Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模型中排名第五。今年6月,字节还发布了AI编程助手豆包MarsCode。据传即由Doubao-Coder模型支撑。目前,豆包MarsCode每月为用户...……更多
LLM取代的第一个编程语言竟是SQL?网友吵翻天
...的第一个编程语言是 SQL,SQL 生成准确率超过 95%,超过了人类 SQL 程序员(准确率为 92%)的平均水平,大多数数据库产品已经提供了一个 chatbox 接口来查询数据」。Bindu Reddy 口中的 Chatbox 是一个开源的桌面端程序,Prompt 的调试...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...息后会先列出相关的知识点,然后逐步进行推理计算,和人类解题的方式非常接近。再来看看另外一个大家都很熟悉的数字游戏24点,模型也能做到先列出相关的计算方法,然后根据最可能成功的思路进行尝试,并在失败时及时...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...先提到微软几十年来有两大梦想:一是能不能让电脑理解人类,而不是人类被迫理解电脑,二是在信息日益增加的世界,电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为,现在这波AI浪潮能为微软找到...……更多
新晋AI编程神器干翻Cursor!首创实时感知无限用,估值12.5亿华人初创震惊AI界
...copilot协作性质和智能体独立的强大能力。 2022年之前,人类和键盘协同工作,代码开发完全是手动完成的。每一行代码都是人工输入的直接结果。2022年,LLM风靡全球,也就有了Copilots。如果你开始一行的编码,它会给出完成的...……更多
更多关于科技的资讯:
中新经纬10月24日电 题:“十五五”时期AI+机器人融合将成产业创新主线作者 张凌燕 赛迪顾问业务总监、先进制造业研究中心总经理中国共产党第二十届中央委员会第四次全体会议公报指出
2025-10-24 18:04:00
豫见开放强音丨洛轴集团:持续拓展国际化进程 建设世界强企
大河网讯 “期待与更多客商积极合作,拓展国际化进程,共同建设世界强企。”10月23日,在国际产业投资合作对接活动·河南站举办期间
2025-10-24 18:57:00
“你好,顺丰快递,来送‘国补’数码产品。”10月21日,市民陈洁收到了网购的手机。这款手机享受“国补”和以旧换新后,比市场价便宜了不少
2025-10-24 08:05:00
集美加快布局新能源商用车赛道
“集链聚能 智驭未来”——2025厦门新能源商用车产业“四链融合”对接会吸引资源对接。(本组图/集美区 提供)企业展示的各类新能源商用车
2025-10-24 08:58:00
第三届“苏颂杯”未来产业技术创新赛圆满收官
大赛组委会为一等奖项目颁奖。台下,选手们仔细聆听台上评委点评。 海外嘉宾发来视频点评本届“苏颂杯”大赛。(本组图/市科技局 提供)厦门网讯(厦门日报记者 李晓平 通讯员 庄佩贞)经过激烈角逐
2025-10-24 08:58:00
珍爱网受邀参与“清朗网络守护者”启动大会 筑牢网络安全坚实屏障
在数字化快速发展的今天,网络安全已成为国家安全的重要组成部分。近日,由政府相关部门指导,深圳广播电影电视集团主办的以“聚焦网络空间治理 护航社会高质量发展”为主题的“清朗网络守护者”启动大会在深圳正式举行
2025-10-24 08:59:00
90 载科学传承:GNC 以城市环游诠释运动营养真谛
以骑行运动为突破口,GNC加速深耕中国运动健康市场2025年10月23日,首届环贵州公园省国际公路自行车赛圆满落幕。GNC健安喜作为铂金赞助商及官方唯一指定营养补充剂品牌
2025-10-24 08:59:00
“微米”社交APP以线下实名社交破局
近日,一款名为“微米(WEMET)”的创新型社交应用正式面世,其以“地图社交+线下实体联动”为核心模式,围绕“真实、附近
2025-10-24 08:59:00
全国首例!吉大中日联谊医院成功植入超百通道侵入式柔性脑机接口
10月22日,记者从吉林大学中日联谊医院获悉,神经外科高宇飞、张金男团队与北京智冉医疗科技有限公司联手,在全国率先成功完成首例超百通道侵入式柔性脑机接口的临床植入手术
2025-10-24 11:08:00
客如云AI碰碰贴“商业增长引擎”,让营销触手可及
在数字经济深度融入实体经济的当下,实体门店正面临“营销落地难、用户互动低效、场景覆盖有限”的共性挑战——传统推广依赖人工操作与分散物料
2025-10-24 11:20:00
继感知位置后!海尔空调将发布可感知呼吸的新品,可自适应送风
曾经,手动调节、躲避直吹是使用空调时的日常烦恼;如今,随着“主动感知”成为可能,空调正变得真正“懂你”。继10月21日首发可感知人体位置的海尔麦浪舒适风空调后
2025-10-24 11:22:00
“今天查,明天做”ICL晶体云柜正式落户福州普瑞眼科 高清视界无需等待
廿载耕耘,瞩目焕新!在普瑞眼科成立20周年之际,福州普瑞眼科迎来又一重大技术升级——正式启用EVOICL官方授权“云柜系统”
2025-10-24 11:29:00
厦门新能源商用车应用场景清单发布东南网10月24日讯(海峡导报记者 康泽辉)厦门市新能源商用车应用场景清单发布,聚焦5类道路场景43个应用场景项目
2025-10-24 11:30:00
全球首个百亿级人类基因组基础模型Genos发布!
在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战
2025-10-24 13:21:00
鲁网10月24日讯作为支撑信息通信网络稳定运行的“核心枢纽”,通信机房承载着海量高功耗数据设备,其温度精准控制直接关系到网络畅通与服务质量
2025-10-24 13:47:00