• 我的订阅
  • 头条热搜
国家科学技术进步一等奖,为何给了这家AI国家队
...由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖...……更多
AI脸逼真分不清?有人提出用天文学方法
...眼反射图,奥沃拉比称在图像真假识别中大约能保持70%的正确率。最终,研究人员发现,该方面基尼指数比CAS系统更实用。深度伪造图片中的眼睛(左)反射图案不一致(右)。图片来源:阿德朱莫克·奥沃拉比的硕士论文内页...……更多
...的资料观看时长、讨论区发言频次与情感倾向、作业测试正确率,以及线下课堂的互动参与度、实践活动出勤率等。可以借助大数据技术,尝试构建“认知—情感—行为”三维数据采集框架,实现对学生学情的系统描绘。建立动...……更多
LLM取代的第一个编程语言竟是SQL?网友吵翻天
...开源的桌面端程序,Prompt 的调试与管理工具,支持 OpenAI 模型、Claude、Google Gemini 等。从大模型出现以来,改变的不仅是文字、图片生成领域,还有编程领域。这些 AI 助手给句提示就能自主学习新技术、构建和部署应用程序、以...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
...下游等5个类别,建立图片训练集和测试集,然后搭建大模型框架,让大模型对训练集中的青铜鼎图片进行学习,以达到高精度的辨识归类效果。在测试中,这个程序demo正确识别了21张青铜鼎图片中的16张,准确率约为76%。如果通...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...模型在该网页/片段下尝试回答该样本,根据模型回答的正确率进行打分。基于这样的伪标注方法,研究人员构造了~80w样本用于训练。最后一步,人为验证。构造测试集时,研究者对第3步得到的视觉问答样本进行了人为筛选,确...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
... 0.3 时,新模型也优于 Pass@20 指标的基线模型,其中绝对正确率增加到 61.9%。在两种评估方案下,推理轨迹的平均长度随着 p 的增加而下降。同样,对于快速模式下的推理,新模型也实现了更高的正确率。Llama-3-8B 模型也具有类...……更多
AlphaFold 3强势登场,施一公、颜宁:敬畏AI,但人类进步还要靠科学家
...Fold 3推出的免费使用平台)是一个速度和准确度的平衡,正确率不是最好的。我现在手上有三个都是比较奇怪的蛋白,之前我自己搭建的AF2 multimer可以在很低的ranking position找到一两个正确的conformation,这次的server版本测试全军...……更多
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
融合物理知识的大型视频语言模型PhysVLM,开源了!它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。在这项研究之前,想让AI像人类儿童一样,通过观察世界理解基本的...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
AI营销观察《AI角色扮演再进化,清华提出CharacterGLM,支持AI角色高度定制化》CharacterGLM的设计准则:考虑了角色的属性和行为,包括身份、兴趣、观点、经历、成就、社交关系、口头禅、方言、文风特征、个性等。主要方法:...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如...……更多
名师谈生物学高考:重视回归课本 查缺补漏夯实基础
...与题干要求不吻合等。第三,对于选择题有时候还要构建模型,包括物理模型和概念模型。非选择题注重考查“长句表达”“非选择题注重考查考生的‘长句表达’。”郑开翀说,考查考生的表达能力,要求考生能够运用规范和...……更多
...欣顿和两位学生提出Alexnet模型,大幅提升了视觉识别的正确率后,引起了全球科学界震动,才开启了深度学习的热潮。在冯建峰看来,出身学术世家的欣顿是那种典型的为了学问而做学问的人。也正是因此,他在神经网络研究...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主...……更多
ChatGPT击败50名人类医生!疾病诊断准确率达90%
...。有人评价,在这样的案例中,人类的干预,反而是给大模型的表现“拖了后腿”。OpenAI总裁Brockman也转发了这则消息,表示看来AI还有巨大的潜力,但在和人类合作这件事上,还需要再加强。50名医生挑战经典病例研究团队随机...……更多
...s disease bacteria (Casp-14)(军团病细菌(Casp-14)蛋白质的DeepMind模型)基于初代版本,2020年,DeepMind又祭出了AlphaFold2。它能够在广泛领域进行蛋白质结构的预测,已经将两亿多蛋白的三维结构全部都预测出来,在结构生物学中是最重...……更多
...渐冻症导致的重度构音障碍患者已能解码60多个常用词,正确率达到了60%多。”北京脑科学与类脑研究所所长罗敏敏介绍。除了在医学方面的应用,在家庭服务中,人工智能也正逐步进化为“生活搭子”。捏鸡蛋、摊煎饼、穿针...……更多
...学家们发明了一种新的“拼图神器”——内部相似性网络模型。拼图可分为三步:“找边”,先用“边缘等距匹配”算法,沿着碎片边缘仔细搜索,找到形状相似的“咬合”部分,就像拼图时先找边框一样;“合体”,把两块碎...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
chatgpt付费就变快,实测提速超2倍、正确率更高
预告已久的 ChatGPT付费版(Plus),正式上线了!免费版 45秒才能回答完的问题,付费版只需 17秒。官方公告里,ChatGPTPlus版还能在使用高峰期任意访问ChatGPT,之后升级、开放新功能,也是付费用户先体验~价格定在了每月 20美元...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...在示范里推理步骤越多,最后模型做推理题或者逻辑题的正确率越高。这一能力可以解决一些问题,比如大家设计 prompt 的时候不会注意到步骤的问题,而本次方法可以让大家更加规范地设计 prompt,从而提高大模型推理步骤。CoT...……更多
...增加了更多用户交互,实现了多人筛选投票,提高了筛选正确率,降低了脉冲星的筛选流程繁琐程度,且系统提供了对投票池任务列表的数据统计分析,无需人工再进行复杂的数据分析统计工作。利用FAST脉冲星及快速射电暴筛...……更多
...数学能力显著提升;上下文长度支持最高达到 128K tokens。清华系细胞大模型登Nature子刊!能对人类2万基因同时建模,代码已开源:清华、百图生科团队提出单细胞基础大模型 scFoundation,登上 Nature Methods,相关研究成果也被 NeurIP...……更多
真香!智谱大模型,有了首个免费的API
...个姐妹,那么爱丽丝的兄弟有多少个姐妹呢?」问题时,正确率非常低。我们让 GLM-4-Flash 试了试,回答正确。改变了主角性别和亲属关系之后,GLM-4-Flash 同样可以理解,再次回答对了。测试 3:对于多人真假话判断问题,GLM-4-Fla...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...出现。想来想去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码...……更多
世界音乐人工智能大会在央音举办,专家探索音乐与AI跨界融合
...AI,将会产生哪些可能性?10月29日,来自香港科技大学、清华大学、北京大学等多所高校的专家们就音乐与人工智能的发展做了分享。香港科技大学副校长、英国皇家工程院院士郭毅可表示,在过去的几年里,AI开始在艺术创作...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为设计下一代专门用于推理的AI模型提供了概念框架。 清华叉院姚期智、袁洋领衔这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。张伊凡张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学...……更多
清华“双胞胎姐妹花”回国任教,曾因最牛学习计划表火遍全网
据清华大学公众号发布 曾经,她们是清华“双胞胎姐妹花”,以一张“最牛学习计划表”火遍全网,练就“一招制敌”的科研绝技,一起斩获清华本科生特等奖学金。马冬晗(左)、马冬昕(右)在本科毕业典礼如今,她们学...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
... 个问题的更大集合上对模型进行评估,并选择了至少 80% 正确率的任务。这为 7B 模型提供了简单的两步算法(如下表 1 所示),并为 35B 模型求解线性方程中的 x(如下表 9 所示)。研究者确保没有查询需要输出分数。并且,为...……更多
更多关于科技的资讯:
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00
当地时间12月3日,国际权威财经媒体英国《银行家》(The Banker)杂志在伦敦揭晓年度银行榜单,中信银行荣膺“2025年中国年度银行”(Bank of the Year China 2025)大奖
2025-12-04 15:37:00
重新定义测序技术 “金标准”! Sequel® II CNDx三代测序仪正式上市
近日,贝瑞基因与PacBio在京举行三代Sequel® II CNDx基因测序仪上市发布会,正式宣布这款基于三代测序技术平台的产品获得国家药品监督管理局批准的医疗器械注册证
2025-12-04 16:38:00
165无限满帧体验,一加 Ace 6T首销到手价2399元起
2025 年 12 月 3 日,一加正式发布「性能旗舰新选择」一加 Ace 6T。作为一加Ace系列全新力作,一加 Ace 6T全球首发搭载第五代骁龙8移动平台
2025-12-04 19:41:00
“质造+智创”领航户外照明赛道
当前,国内户外照明市场呈现明显的区域集群效应,长三角(江浙沪)与珠三角(广东)形成双核引领格局。其中,高杆路灯作为重要细分品类
2025-12-04 22:41:00
南京作为我国软件产业发展的先行区和重要聚集地,产业规模居全国前列。在迈向高质量发展的过程中,软件企业普遍出现研发周期长
2025-12-04 20:11:00
国内首个AI钢管智能检测模型在中油宝世顺公司投入运用
河北新闻网讯(张辉、李少波)“焊缝影像在屏幕如放电影一样一帧接一帧闪过,1分钟能完成4米钢管检测,两分钟能审核1000张检测影像并标注疑似缺陷的位置
2025-12-04 17:15:00
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00