• 我的订阅
  • 头条热搜
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...iyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大学和卡内基梅隆大学(CMU)。共同一作为清华大学计算机系本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com陈厚伦,清华大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...码住了。论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...务的提质增效作用,许多机构都有亲身体验。1月24日,由清华大学经济管理学院、度小满、《麻省理工科技评论》中国、清华大学经济管理学院动态竞争与创新战略研究中心联合编写的《2024年金融业生成式人工智能应用报告》...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...分享,欢迎投稿或者联系报道。本文作者来自于港中文、清华和UIC。主要作者包括:余甸之,港中文博士生;张欣妮,港中文博士生;陈焱凯,港中文博士;刘瑷玮,清华大学博士生;张逸飞,港中文博士;Philip S. Yu,UIC教授;...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...解决方案,以提高工作效率和满足不同领域的需求。◎ 清华系AI创业公司聆心智能被智谱AI全资收购清华系AI初创公司聆心智能近日传出被智谱AI全资收购的消息,尽管尚未官方宣布,但有内部消息透露该交易的估值达到数亿人民...……更多
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
【新智元导读】最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。我们都知道,在...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...获得了最佳论文亚军(Best Paper Runner-up):由厦门大学、清华大学、微软研究者共同完成的《Not All Tokens Are What You Need for Pretraining》(并非所有 token 都是预训练所需的), Zhenghao Lin 和 Zhibin……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...京大学教授、中国科学院院士鄂维南;中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太区总裁张祺;远期人工智能研究中心主任曾毅等多位嘉宾...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...AI项目,曾参与大模型六小强之一MiniMax的创立;CTO梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型负责人。成立一年半以来,这家公司动作频频。 首先在今年年初,亮相了自家首个3D大模型Tripo 1.0。Tripo 1.0参数量数十...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...解决,而是需要更系统化的方法。在 NeurIPS 2024 上,来自清华大学和蚂蚁集团的研究者针对人工智能体构建方法的通用性和适应性提出了一个新方案。这个被命名为AMOR(Adaptable MOdulaR knowledge agent)的系统,不仅能低成本地调用专...……更多
当一个清华教授问AI觉得自己革了谁的命
...为此,本刊编辑部开启了一场人与AI的共创实验——邀请清华大学新闻学院教授、跨学科知名学者沈阳围绕“AI革了谁的命”与AI展开对话并予以点评。与AI对话,提问者的提问思路与技巧决定了AI给出答案的质量和深度。沈阳是...……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
...新智元导读】RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。与Transformer相比,RNN模型的一大优势是应对长序列的能力。比如Mamba,内部状态大小始终保持不变,...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如...……更多
浪潮KaiwuDB论文被数据库国际顶会ICDE2024录用
...响力。此次在荷兰召开的ICDE2024大会,吸引到北京大学、清华大学、中国人民大学、浙江大学、MIT、斯坦福等高校及全球知名科技企业参会,共同探讨数据库、数据处理领域的先进技术问题。近年来,数据库研究人员提出了多个...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...究结果的可靠性。实验与讨论为了评估 MLR-Copilot 框架的性能,论文作者设计了一系列实验,涵盖了五个不同领域的机器学习任务。这些任务包括了语义文本关联、情感分析、特征分类以及图像分类等,代表了机器学习研究中的...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
...应用潜力。为了解决这一难题,斯坦福大学、北京大学、清华大学等机构的研究团队联合提出了一种全新的统一算法框架,名为无训练指导(Training-Free Guidance, 简称 TFG)。这一框架无缝整合现有的无训练指导方法,凭借理论创...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...(SAIL)。他在麻省理工学院完成博士学位,本科毕业于清华大学姚班,曾被誉为“清华十大学神”之一。同时,他也是李飞飞创业公司World Labs的顾问。参考链接:[1]https://arxiv.org/abs/2411.04998v1[2]https://www.worldlabs.ai/t……更多
机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍
...不同的任务。DexMimicGen生成的大规模数据集可用于训练高性能的模仿学习策略,并用于不同策略的基准测试。研究团队发现,随着DexMimicGen数据量的增加,策略的性能也随之提升。他们还使用DexMimicGen结合real2sim2real方法生成了真...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
【新智元导读】LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
... | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...的可能性增加,生成不理想输出的概率也随之上升,导致性能出现瓶颈。为解决这一问题,北京大学李戈教授团队与字节跳动合作,CodeDPO因此而生。该框架将偏好学习融入代码模型训练中,利用代码自验证机制,显著提升代码...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友Junfeng He、武大、港中文校友Gang Li。另一篇Generative Image Dynamics更偏理论一些,提出了一种基于图像空间先验的场景运动建模方法,可用于通过静态图像生成无缝循...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...的数据也在增长。因此获取足够的数据对于提升机器人的性能至关重要,但在当前实践中,针对新场景和新任务获取数据是一个从头开始不断重复的手动过程。另一种替代方法则是在模拟环境中训练,从中可以对更多样化的环境...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...的情况下学习和适应,进而根据具体目标最大限度地提高性能(有效性和自动化)。有了结构化推理之后,LLM 智能体可在内部重构自身,通过灵活和内在的(智能体内部的)自我反思功能实现主动推理,并在采取外部行动之前...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...并进行自我训练,模型形成了一个正向反馈循环,实现了性能的持续提升,尤其在较小模型中也展现出强大的潜力。 提升复杂任务解决能力:文中的方法在多种规模的模型上均展现出了显著的性能提升,特别是在解决需要分析...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统监督式机器学习中的...……更多
更多关于科技的资讯:
你借的共享充电宝那么贵 它们公司却穷得快退市了
不断涨价,业绩却越做越差,共享充电宝品牌怪兽充电无奈选择了私有化退市。1 月 6 日,怪兽充电宣布收到来自信宸资本( 中信集团旗下 )和公司管理层联合发出的私有化要约
2025-01-11 15:21:00
甲流高发 医生提醒:奥司他韦不能乱吃!
近期,甲型流感(简称甲流)的发病率有所上升。奥司他韦作为一种常用的抗流感药物,在预防和治疗甲流方面发挥着重要作用。然而
2025-01-11 15:51:00
群晖备份一体机发布:开箱即用 一机即可实现多种备份
快科技1月11日消息,中小企业在业务发展过程中,随着数据量增加和备份设备增多,面临成本增长和运维效率降低的挑战。对此,群晖推出了备份一体机DP7400
2025-01-11 16:21:00
春节新风尚!百果园济南区苏绣春节礼盒发布会,传递健康年味
临近春节,年味渐浓,百果园济南区2025 年春节系列礼盒发布会圆满落幕。发布会上,百果园×非遗苏绣传承人卢建英春节联名系列礼盒惊艳亮相
2025-01-11 16:30:00
华为解决5G最大弊端:不怕演唱会没信号了
快科技1月11日消息,随着5G深入建设,大型体育场馆和演唱会等高容量场景面临覆盖范围和上下行容量的挑战。近日,浙江电信携手华为在宁波完成了FDD Massive MIMO的创新商用测试
2025-01-11 16:51:00
索尼本田联手造了台66万的车 卖这么贵你就给我这个
快到年边了,没想到这位日本新势力抢在年前,给我们拉了坨大的。这次 CES ( 国际消费类电子产品展览会 )上,索尼本田又带着它的 AFEELA 来秀存在了
2025-01-11 16:51:00
搞这么厉害怎么不早点告诉我,ces上极氪展台都挤爆了
有幸围观了一下,不看不知道,极氪展台这是要晋升车界的甜甜圈吗,每个人都想来尝一尝看一看,这么多人,还有外国友人来凑热闹
2025-01-11 17:17:00
奢侈品牌大变动!据称普拉达正在考虑收购范思哲
据媒体周五(1月10日)报道,全球时尚奢侈品集团Capri Holdings计划出售旗下的范思哲(Versace),普拉达(Prada)正在考虑收购
2025-01-11 17:21:00
开门红!2025年电影总票房破10亿
快科技1月11日消息,根据灯塔专业版的数据,截至1月11日14时47分,今年的总票房(含预售)已经突破10亿元大关。其中
2025-01-11 17:21:00
本文转自:人民网-科普中国量子计算机,这一曾被视为科幻的技术奇迹,如今正逐步从理论走向现实,并在不断迭代中展现其颠覆性的计算潜力。
2025-01-11 17:25:00
全球首款骁龙8至尊版折叠屏!OPPO Find N5下周官宣:产品足够惊艳
快科技1月11日消息,今天,OPPO周意保预告,OPPO Find N5会在下周公布发布时间。周意保与网友互动时表示,OPPO Find N5足够惊艳
2025-01-11 17:51:00
辽宁移动旗舰店·沈阳十一纬路店:焕新绽放,重启极致用户体验
本文转自:人民网-辽宁频道近日,辽宁移动旗舰店·沈阳十一纬路店(以下简称“十一纬路旗舰店”)完成了全面的升级改造,以新型智慧营业厅的形象惊艳亮相
2025-01-11 18:18:00
当然有的,主要是以下三个渠道,大家可以根据自己的需要来选择。一、查询中标公告的官方渠道:①政府采购网站:中国政府采购网及其省级和市级分支是最权威的信息来源
2025-01-11 18:18:00
点击查看视频星品入驻,全球共享。旅游零售市场是国产品牌向世界展现东方风土、中国味道的绝佳窗口。本期《每周探店》来到了cdf海口国际免税城——这里正在举行长城五星G家族入驻中免集团的首发仪式
2025-01-11 18:41:00
蚂蚁集团完成收购好大夫:帮8亿用户找到28万好医生
快科技1月11日消息,在今天举办的2025年度好大夫峰会现场,蚂蚁集团和好大夫在线完成收购后首度同台亮相。双方共同宣布
2025-01-11 18:51:00