• 我的订阅
  • 头条热搜
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...分享,欢迎投稿或者联系报道。本文作者来自于港中文、清华和UIC。主要作者包括:余甸之,港中文博士生;张欣妮,港中文博士生;陈焱凯,港中文博士;刘瑷玮,清华大学博士生;张逸飞,港中文博士;Philip S. Yu,UIC教授;...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...码住了。论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。有意思的是,另一位Yao Shunyu,今年刚刚加入隔壁OpenAI。注意别搞混哦,前者是学物理的姚顺宇,后者是学计算机的姚顺雨。(手动狗头)这次加入Ant...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有开...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...京大学教授、中国科学院院士鄂维南;中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太区总裁张祺;远期人工智能研究中心主任曾毅等多位嘉宾...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
近期,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖,而且能够为智能系...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...iyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大学和卡内基梅隆大学(CMU)。共同一作为清华大学计算机系本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
【新智元导读】LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既...……更多
...愈加清晰。在人才组织层面,清昴智能核心成员主要来自清华大学、华为、阿里等高校和公司。创始人兼CEO关超宇毕业于清华大学计算机系,2021年西尔贝学者奖学金获得者(全球不到百人),并带队研发世界首个自动图学习项...……更多
斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前
...外一个AI团队主导的开源大模型,被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前,团队已经公开道歉,并下架模型。斯坦福AI团队抄袭中国大模型5月29日,一个来自斯坦福的AI团队在网上发布文章《Llama 3-V...……更多
同一天2篇Nature!清华两团队最新科研突破!
北京时间5月30日清华大学2项最新科研成果同时发表于《自然》(Nature)清华大学依托精密仪器系的类脑计算研究中心施路平教授团队提出一种基于视觉原语的互补双通路类脑视觉感知新范式研制出世界首款类脑互补视觉芯片“...……更多
清华光学AI登Nature!物理神经网络,反向传播不需要了
用光训练神经网络,清华成果最新登上了Nature!无法应用反向传播算法怎么办?他们提出了一种全前向模式(Fully Forward Mode,FFM)的训练方法,在物理光学系统中直接执行训练过程,克服了传统基于数字计算机模拟的限制。简...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...机遇共存交织的当下,这一领域泰斗 中国工程院院士、清华大学计算机科学与技术系郑纬民,在 MEET2023智能未来大会上,分享了自己的见解和思考。估计未来两年到四年, HPC (高性能计算)+AI+BigData融合 的服务器就会出现。AI ...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...为设计下一代专门用于推理的AI模型提供了概念框架。 清华叉院姚期智、袁洋领衔这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。张伊凡张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
(在2024大湾区科学论坛现场,清华大学教授李宗鹏接受凤凰网财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不...……更多
清华大学获芯片领域重要突破!
来源:极目新闻科技日报记者华凌记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算...……更多
哈工大(深圳)成功举办第八届全国青年人工智能创新创业大会
...创业大潮中,充分展现自己的才华。王轩教授致辞最后,清华大学深圳国际研究生院科技处处长、信息学部教授、深圳市计算机学会监事长江勇代表学会致辞。他对学会成立以来组织的人工智能相关活动进行了介绍,并表示十分...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...解决方案,以提高工作效率和满足不同领域的需求。◎ 清华系AI创业公司聆心智能被智谱AI全资收购清华系AI初创公司聆心智能近日传出被智谱AI全资收购的消息,尽管尚未官方宣布,但有内部消息透露该交易的估值达到数亿人民...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...局面。本届CCF国际AIOps挑战赛由中国计算机学会(CCF)、清华大学、中国建设银行股份有限公司、南开大学联合主办;CCF互联网专委会、清华大学计算机科学与技术系、中国建设银行股份有限公司运营数据中心、南开大学软件学...……更多
北电数智助力国产芯片发展
...智能领域专家、复旦大学计算机科学技术学院特聘教授、清华大学电子工程系兼职教授窦德景正式担任北京电子数智科技有限责任公司(简称“北电数智”)首席科学家,携手北电数智共同探索与发展人工智能时代基于大算力、...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
AI营销观察《AI角色扮演再进化,清华提出CharacterGLM,支持AI角色高度定制化》CharacterGLM的设计准则:考虑了角色的属性和行为,包括身份、兴趣、观点、经历、成就、社交关系、口头禅、方言、文风特征、个性等。主要方法:...……更多
人形机器人组团“十八金刚”各类AI助手工具百花齐放
...承办的“人工智能创新与治理”分论坛,当时会上邀请了清华大学教授薛澜、周伯文等大咖参会。而今年至少6场论坛的名称与安全、伦理治理相关,包括全球治理主论坛,以及分为上下午两场、需要付费才能参会的前沿人工智...……更多
《麻省理工科技评论》中国智能计算创新人物峰会圆满落幕
...能计算创新人物颁奖仪式”在北京举办,本次活动由北京清华工业开发研究院、之江实验室作为战略合作伙伴共同支持。出席本次活动的领导嘉宾包括了北京清华工业开发研究院副院长付小龙、之江实验室党委委员及副主任陈伟...……更多
清华大学教授李宗鹏:AI将成为未来股民炒股的辅助性工具
...湾区科学论坛在粤港澳三地同步举办。在媒体群访环节,清华大学教授李宗鹏针对目前火热的AI炒股等话题回答了凤凰网财经的提问。李宗鹏指出,生成式AI炒股可能是未来AI与金融结合的一种新思路。据说,有人因为AI炒股还赚...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...加快研发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,...……更多
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ” 在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术...……更多
本文转自:嘉兴日报首次授予中国大陆学者清华大学柔性电子技术实验室张一慧 获美国工程科学学会詹姆斯·莱斯奖章■记者 何金妹 通讯员 徐晓杰本报讯 美国工程科学学会詹姆斯·莱斯奖章,每年只颁给一位在工程科学领域...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...公司、深圳市若芯科技有限公司等企业界技术领袖和来自清华大学、上海交通大学等学术界专家学者分享了各自领域在OpenHarmony生态中结合AI大模型相关技术如何进行技术创新、突破技术难题,并共同探讨了未来AI大模型与终端操...……更多
更多关于科技的资讯:
【多彩新论】别让“电商专供”成为消费“陷阱”
在当下消费市场,“电商专供”产品似乎陷入了信任危机。卷纸变小、洗衣液变稀、同款产品线下难寻等现象频发,让“电商专供”在许多消费者心中与质量缩水画上了等号
2025-01-28 02:16:00
余承东华为3月重磅新品:别人想不到 全国人民抢购都买得起!
快科技1月28日消息,日前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东开启直播,驾驶享界S9回安徽老家过年
2025-01-28 06:36:00
如不能正常浏览请选用IE浏览器天津北方网讯:潮购津门,乐呵过年。第二届天津电商节年货节,“一站式”购齐年货,欢欢喜喜过大年。#你好天津 #点赞天津……(津云新闻编辑张麒麟)
2025-01-27 15:37:00
AI入口 “爱”的入口
江南时报讯 春节是团圆的盛宴,凝聚着家的灵魂、力量与温暖。南来北往的游子,对于“家”有着更深的情结与眷恋。春运期间,中国电信联合江苏交通文化传媒有限公司在江苏高速阳澄湖
2025-01-27 15:51:00
完美世界再发反腐通报:开除4人,永不录用
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职
2025-01-27 16:03:00
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁)
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁),自动上锁不操心随着春节的脚步日益临近,人们纷纷踏上了归家的旅程
2025-01-27 16:11:00
这种小番茄有剧毒!很多人还把它当观赏植物 快看你家有没有
去年,美国女演员艾丽西亚·西尔维斯通(Alicia Silverstone)发了一个短视频,说自己在路边摘了一个橙色小番茄
2025-01-27 16:36:00
潍坊美的火三月震撼来袭,超绝福利“高能”释出!
3月7日-3月16日,一年一度的美的火三月将火爆开展,作为美的家电每年的核心活动节点,已经传承了17载。它不仅是美的与消费者之间的约定
2025-01-27 16:46:00
厂商官方承认:RTX 50确实货不多!一家都不到100块
快科技1月27日消息,RTX 5090/5090D、RTX 5080都将在1月30日大年初二晚上正式开售,但这次供货之紧张前所未有
2025-01-27 17:06:00
DeepSeek实习生日薪最高达上千元 招人不看经验只看能力
快科技1月27日消息,近日,国产大模型DeepSeek震动美国硅谷,其移动App一举登顶苹果中国和美国应用商店免费APP下载排行榜
2025-01-27 17:06:00
女子帮忙按600斤年猪脸被踢肿 网友:古有四大按不住
1月27日消息,近日,贵州贵阳一女子帮叔叔们一起按住600斤的年猪,年猪不停挣扎,一脚踢到女子脸上。她表示:“脸被踢肿了
2025-01-27 17:06:00
一谈起自动化汽车工厂,人们脑海中常常浮现出这样的场景:机器人手臂在精确装配线上舞动,高效焊接、喷涂车身;智能AGV小车穿梭其间
2025-01-27 17:06:00
Windows 11 24H2新年第一个补丁惹大祸:各种不正常、崩溃
快科技1月27日消息,Windows补丁惹事儿不是新闻,但是作为Windows 11 24H2 2025年的第一个补丁
2025-01-27 17:36:00
最高补贴2000元!青岛以旧换新“加力扩围”至12类
齐鲁晚报·齐鲁壹点 尚青龙青岛市2025年消费品以旧换新活动已于日前正式启动,记者从青岛市商务局、青岛市财政局获悉,为进一步惠及广大消费者
2025-01-27 17:42:00
提到线上“带货”,大家可能都不陌生。不论是食品、服装、电子产品,还是诸如电影票、餐饮券、旅游套餐等生活服务产品,都是我们常见的线上“带货”商品
2025-01-27 18:35:00