• 我的订阅
  • 头条热搜
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...分享,欢迎投稿或者联系报道。本文作者来自于港中文、清华和UIC。主要作者包括:余甸之,港中文博士生;张欣妮,港中文博士生;陈焱凯,港中文博士;刘瑷玮,清华大学博士生;张逸飞,港中文博士;Philip S. Yu,UIC教授;...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...码住了。论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。有意思的是,另一位Yao Shunyu,今年刚刚加入隔壁OpenAI。注意别搞混哦,前者是学物理的姚顺宇,后者是学计算机的姚顺雨。(手动狗头)这次加入Ant...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有开...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...京大学教授、中国科学院院士鄂维南;中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太区总裁张祺;远期人工智能研究中心主任曾毅等多位嘉宾...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖,而且能够为智能系...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...iyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大学和卡内基梅隆大学(CMU)。共同一作为清华大学计算机系本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
【新智元导读】LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既...……更多
...愈加清晰。在人才组织层面,清昴智能核心成员主要来自清华大学、华为、阿里等高校和公司。创始人兼CEO关超宇毕业于清华大学计算机系,2021年西尔贝学者奖学金获得者(全球不到百人),并带队研发世界首个自动图学习项...……更多
斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前
...外一个AI团队主导的开源大模型,被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前,团队已经公开道歉,并下架模型。斯坦福AI团队抄袭中国大模型5月29日,一个来自斯坦福的AI团队在网上发布文章《Llama 3-V...……更多
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范式研制出世界首款类脑互补视觉芯片“...……更多
清华光学AI登Nature!物理神经网络,反向传播不需要了
用光训练神经网络,清华成果最新登上了Nature!无法应用反向传播算法怎么办?他们提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,在物理光学系统中直接执行训练过程,克服了传统基于数字计算机模拟的限制。简...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...机遇共存交织的当下,这一领域泰斗 中国工程院院士、清华大学计算机科学与技术系郑纬民,在 MEET2023智能未来大会上,分享了自己的见解和思考。估计未来两年到四年, HPC (高性能计算)+AI+BigData融合 的服务器就会出现。AI ...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为设计下一代专门用于推理的AI模型提供了概念框架。 清华叉院姚期智、袁洋领衔这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。张伊凡张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学...……更多
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算...……更多
哈工大(深圳)成功举办第八届全国青年人工智能创新创业大会
...创业大潮中,充分展现自己的才华。王轩教授致辞最后,清华大学深圳国际研究生院科技处处长、信息学部教授、深圳市计算机学会监事长江勇代表学会致辞。他对学会成立以来组织的人工智能相关活动进行了介绍,并表示十分...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...解决方案,以提高工作效率和满足不同领域的需求。◎ 清华系AI创业公司聆心智能被智谱AI全资收购清华系AI初创公司聆心智能近日传出被智谱AI全资收购的消息,尽管尚未官方宣布,但有内部消息透露该交易的估值达到数亿人民...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
(在2024大湾区科学论坛现场,清华大学教授李宗鹏接受凤凰网财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...局面。本届CCF国际AIOps挑战赛由中国计算机学会(CCF)、清华大学、中国建设银行股份有限公司、南开大学联合主办;CCF互联网专委会、清华大学计算机科学与技术系、中国建设银行股份有限公司运营数据中心、南开大学软件学...……更多
北电数智助力国产芯片发展
...智能领域专家、复旦大学计算机科学技术学院特聘教授、清华大学电子工程系兼职教授窦德景正式担任北京电子数智科技有限责任公司(简称“北电数智”)首席科学家,携手北电数智共同探索与发展人工智能时代基于大算力、...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
AI营销观察《AI角色扮演再进化,清华提出CharacterGLM,支持AI角色高度定制化》CharacterGLM的设计准则:考虑了角色的属性和行为,包括身份、兴趣、观点、经历、成就、社交关系、口头禅、方言、文风特征、个性等。主要方法:...……更多
人形机器人组团“十八金刚”各类AI助手工具百花齐放
...承办的“人工智能创新与治理”分论坛,当时会上邀请了清华大学教授薛澜、周伯文等大咖参会。而今年至少6场论坛的名称与安全、伦理治理相关,包括全球治理主论坛,以及分为上下午两场、需要付费才能参会的前沿人工智...……更多
《麻省理工科技评论》中国智能计算创新人物峰会圆满落幕
...能计算创新人物颁奖仪式”在北京举办,本次活动由北京清华工业开发研究院、之江实验室作为战略合作伙伴共同支持。出席本次活动的领导嘉宾包括了北京清华工业开发研究院副院长付小龙、之江实验室党委委员及副主任陈伟...……更多
清华大学教授李宗鹏:AI将成为未来股民炒股的辅助性工具
...湾区科学论坛在粤港澳三地同步举办。在媒体群访环节,清华大学教授李宗鹏针对目前火热的AI炒股等话题回答了凤凰网财经的提问。李宗鹏指出,生成式AI炒股可能是未来AI与金融结合的一种新思路。据说,有人因为AI炒股还赚...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...加快研发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,...……更多
本文转自:嘉兴日报首次授予中国大陆学者清华大学柔性电子技术实验室张一慧 获美国工程科学学会詹姆斯·莱斯奖章■记者 何金妹 通讯员 徐晓杰本报讯 美国工程科学学会詹姆斯·莱斯奖章,每年只颁给一位在工程科学领域...……更多
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ” 在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...公司、深圳市若芯科技有限公司等企业界技术领袖和来自清华大学、上海交通大学等学术界专家学者分享了各自领域在OpenHarmony生态中结合AI大模型相关技术如何进行技术创新、突破技术难题,并共同探讨了未来AI大模型与终端操...……更多
更多关于科技的资讯:
吉刻现场|硬核登场!吉林选手角逐第三届全国博士后创新创业大赛
10月26日,第三届全国博士后创新创业大赛在福建泉州(晋江)开幕。本届大赛,吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道
2025-10-27 14:09:00
厦心医院实现手术\
厦门网讯(厦门日报记者 楚燕 通讯员 许良友 付磊 刘云芳)10月23日,一项载入医学史册的创新手术在厦门大学附属心血管病医院(以下简称“厦心医院”)圆满完成
2025-10-27 08:11:00
新闻纵深·解码钢铁大模型|邯钢构建六大领域全链条智能大模型:“聪明大脑”带来极致能效
邯钢构建六大领域全链条智能大模型“聪明大脑”带来极致能效编者按当钢铁遇上人工智能,一场“智变”正悄然发生。为生动展现人工智能为钢铁产业生产
2025-10-27 08:12:00
第十一届NJSD软件开发者会议在软件谷举行江苏规模最大,1400名软件工程师在宁“聚会”南报网讯(记者于洁尘通讯员林园园)70多位业界“大咖”登台演讲
2025-10-27 08:20:00
南报网讯(通讯员郑瑞于品华杨刚记者徐宁)近日,南化公司自主研发的橡胶防老剂中间产品RT培司(4-氨基二苯胺)除盐技术取得突破
2025-10-27 08:21:00
南报网讯(通讯员杨淏涵记者张希)日前,南京林业大学与乐惠国际南京基地签署《校企全面合作协议》《产业研究院共建协议》,全面开启校企战略合作
2025-10-27 08:22:00
高效,是都市青年的通行证:InstaShake以“一杯营养”重塑健康生活方式 —— 新锐品牌以“零添加、无预制、纯手工”的坚守,为上海都市人群注入鲜活能量
在生活节奏不断加速的上海,追求健康与追求效率似乎成为一道单选题。然而,新锐健康饮品品牌InstaShake正以其独特的“零添加
2025-10-27 08:39:00
济宁银行锚定金融“五篇大文章” 多维发力赋能区域经济高质量发展
鲁网10月27日讯近年来,济宁银行围绕做好金融“五篇大文章”,深入洞察科技企业、中小微企业以及重点产业链金融需求,以产品创新破解融资难题
2025-10-27 11:07:00
汪昌莲据《经济日报》报道,“两三元就能买品牌饼干薯片”“上百种散装零食任意挑选”……从县城到乡镇,在街角与量贩零食店不期而遇已成逛街“标配”
2025-10-27 11:10:00
受冷空气影响,气温先降后升,27日早晨气温较低。26日夜间到27日白天晴间多云,北风转南风2~3级,最低气温市区4℃左右
2025-10-27 11:28:00
2025青岛虚拟现实创新大会将启,雷神科技聚焦信创生态构建
鲁网10月27日讯虚实无界,智享未来。2025青岛虚拟现实创新大会即将在崂山区拉开帷幕。2017年以来,由崂山区成功承办的虚拟现实创新大会
2025-10-27 11:48:00
长白时评评论员 唐小兰近日,北京一市民反映有陌生男子在她家中无人时,通过指纹解锁智能门锁多次进入她家。当事人焦女士告诉新京报记者
2025-10-27 13:38:00
“生物制药工艺与设备发展新趋势研讨会”于10月16日下午举行,麦济生物、艾捷博雅科技、碧博生物等企业的代表,就生物制药工艺优化与设备选型提供了新思路与新方法。责编:卢思宇、姚凯红
2025-10-27 10:19:00
河北日报讯(记者刘英、刘杰)近日,经省科技厅批准,由廊坊润泽科技发展有限公司牵头组建的省级创新联合体——河北省人工智能创新联合体成立
2025-10-27 08:07:00
厦门网讯 (厦门日报记者 薛尧) “品牌金饰每克突破1100元,自己买工具打首饰能省近一半!”近日,受国际金价持续震荡
2025-10-25 08:13:00