• 我的订阅
  • 头条热搜
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...iyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大学和卡内基梅隆大学(CMU)。共同一作为清华大学计算机系本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com陈厚伦,清华大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...码住了。论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...务的提质增效作用,许多机构都有亲身体验。1月24日,由清华大学经济管理学院、度小满、《麻省理工科技评论》中国、清华大学经济管理学院动态竞争与创新战略研究中心联合编写的《2024年金融业生成式人工智能应用报告》...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...(INTERN)”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布,并持续联合研发。当前,人工智能技术的发展正面临着大量跨模态任务的挑战,为满足快速增长的各式...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...解决方案,以提高工作效率和满足不同领域的需求。◎ 清华系AI创业公司聆心智能被智谱AI全资收购清华系AI初创公司聆心智能近日传出被智谱AI全资收购的消息,尽管尚未官方宣布,但有内部消息透露该交易的估值达到数亿人民...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...AI项目,曾参与大模型六小强之一MiniMax的创立;CTO梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型负责人。成立一年半以来,这家公司动作频频。 首先在今年年初,亮相了自家首个3D大模型Tripo 1.0。Tripo 1.0参数量数十...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...京大学教授、中国科学院院士鄂维南;中国工程院院士、清华大学信息科学技术学院院长戴琼海;百度CTO王海峰;蚂蚁集团CTO何征宇;微软全球资深副总裁、Microsoft AI亚太区总裁张祺;远期人工智能研究中心主任曾毅等多位嘉宾...……更多
当一个清华教授问AI觉得自己革了谁的命
...为此,本刊编辑部开启了一场人与AI的共创实验——邀请清华大学新闻学院教授、跨学科知名学者沈阳围绕“AI革了谁的命”与AI展开对话并予以点评。与AI对话,提问者的提问思路与技巧决定了AI给出答案的质量和深度。沈阳是...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如...……更多
浪潮KaiwuDB论文被数据库国际顶会ICDE2024录用
...响力。此次在荷兰召开的ICDE2024大会,吸引到北京大学、清华大学、中国人民大学、浙江大学、MIT、斯坦福等高校及全球知名科技企业参会,共同探讨数据库、数据处理领域的先进技术问题。近年来,数据库研究人员提出了多个...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...究结果的可靠性。实验与讨论为了评估 MLR-Copilot 框架的性能,论文作者设计了一系列实验,涵盖了五个不同领域的机器学习任务。这些任务包括了语义文本关联、情感分析、特征分类以及图像分类等,代表了机器学习研究中的...……更多
...思考、具备丰富创意的内容及工作,重要性将更加凸显。清华大学新闻学院教授、元宇宙文化实验室主任沈阳认为,面对ChatGPT带来的改变,至少要加强两种能力:提出问题和优化答案。对这两方面能力要求高的工作,更不易被...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
【新智元导读】LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
... | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友Junfeng He、武大、港中文校友Gang Li。另一篇Generative Image Dynamics更偏理论一些,提出了一种基于图像空间先验的场景运动建模方法,可用于通过静态图像生成无缝循...……更多
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...P 算法工程师陈家泽、Google Cloud 机器学习专家王顺、清华大学 KEG 知识工程实验室研究助理郑勤锴、九合创投投资副总裁王逸飞、稀土掘金江昪一一带来精彩观点,同大家一道迎接“未来已来,将至未至”的 AIGC 时代...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统监督式机器学习中的...……更多
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...示自动应用滤镜和导演模式。????‍????????????聚焦开发者清华系ChatGLM3发布,多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。元象大模型向全...……更多
最新美国国家人工智能科学院院士介绍
...得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学习的重要贡献包括时序差分学习和策略梯度方法。AlinaWheeler,来自康奈尔大学。她的研究重...……更多
生成式AI可训练机器人执行多种任务
...有学过的新任务。与基线技术相比,这种策略组合将任务性能提高了20%。研究人员表示,解决机器人数据集中的异质性就像一个先有鸡还是先有蛋的问题。如果想使用大量数据来训练通用机器人,首先需要可部署的机器人来获取...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 AI 顶会 IJCAI2024 上发起举办,探讨如...……更多
...,能耗仅为先进工艺下专用集成电路系统的1/35。近期,清华大学集成电路学院吴华强教授、高滨副教授基于存算一体计算范式,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,研究成果发表在《科学》(Science)上。...……更多
前瞻2024人工智能四大趋势
...。全模拟光电智能计算芯片效果图。 经长期联合攻关,清华大学研究团队突破传统芯片的物理瓶颈,创造性提出光电融合的全新计算框架,并研制出国际首个全模拟光电智能计算芯片(简称ACCEL) 新华社图趋势一:从AI大模型迈...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...领域微调训练后的模型,在遵循指令和常见问答任务上的性能出现下降。 论文地址:https://arxiv.org/pdf/2009.03300还有很多研究可以佐证,通过预训练获得的通用知识,在后续训练过程中可能会被遗忘。❌ 继续预训练鉴于灾难性的...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本工作由清华大学朱军教授领衔的基础理论创新团队发起。长期以来,团队着眼于目前人工智能发展的瓶颈问题,探索原创性人工智能理论和关键技术,在智能算法的对抗安全理论...……更多
百川智能发布baichuan3稳定语言模型
...和训练框架,并采用“异步CheckPoint存储”机制,可以无性能损失地加大存储的频率,减少机器故障对训练任务的影响,使Baichuan3的稳定训练时间达到一个月以上,故障恢复时间不超过10分钟。训练效率方面,百川智能针对超千亿...……更多
宝德携手清华大学,以高性能计算共筑网络管理与安全新高地
...威胁层出不穷,给学校的网络环境带来了极大的风险。 清华大学作为国内顶尖学府,一直致力于推动信息化建设与智慧校园的发展,对网络管理与网络安全有着极高的要求。面对日益复杂的网络环境和不断升级的安全威胁,清...……更多
更多关于科技的资讯:
微博音频声量报告:今年前三季度音频收听时长增长928%
11月1日,微博发布《微博音频声量报告》(以下简称《报告》),介绍了2024年1月至9月统计周期内,微博音频的发展情况
2024-11-04 12:20:00
创新健康双驱动,百草味斩获第三届中国营养师发展大会双奖
11月1日至3日,以“专业聚力,引动产业新生态”为主题的2024中国营养师发展大会于河北石家庄成功举行。在此次大会上,百草味“本味甄果每日晚安坚果”与“每日坚果5黑款”凭借卓越的营养价值及科学的配方搭配
2024-11-04 12:42:00
北京举办车载视听主题交流活动 助力产业升级
本文转自:人民网-北京频道汽车视听文化市集现场。(主办方供图)人民网北京11月4日电 (记者尹星云)11月1日,第四届中国广电媒体融合发展大会首场活动——车载视听主题交流活动在北京举行
2024-11-04 13:12:00
国产灵巧手,深圳造!能捏鸡蛋擦玻璃,单手可提40kg
机器人前瞻11月1日报道,昨天,普渡机器人推出11自由度五指灵巧手PUDU DH11,能完成握、捏、拧、拉、推、按、抓
2024-11-04 09:49:00
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」
2024-11-04 09:50:00
大模型重塑智能硬件!人手一个智能助手的时代来了?
在生成式AI浪潮的影响下,智能硬件开始出现全新的人机交互体验。AI智能助手更有针对性地实时解答你的“十万个为什么”;AI卡片录音机能帮你实时转写会议内容
2024-11-04 09:52:00
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-04 09:52:00
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
大型语言模型在学习概念时竟然会形成令人惊讶的几何结构,比如代码和数学特征会形成一个「叶(lobe)」,类似于我们在做磁共振功能成像时看到的大脑功能性脑叶
2024-11-04 09:52:00
苹果M4 Pro/M4 Max解析:拨乱反正、开创未来
就在近日,苹果方面正式发布了M4 Pro和M4 Max这两款全新的、更高端定位的芯片,并基于它们一口气推出了多款Mac系列机型的年度改款
2024-11-04 09:52:00
ChatGPT终于变AI搜索引擎!网页手机桌面同时上线,即将人人可用
终于!从今天起,ChatGPT新增搜索功能,摇身一变成AI搜索了!背后支撑该功能的是OpenAI旗舰模型GPT-4o的微调版本
2024-11-04 09:53:00
小米14都打不过,何谈小米15有压力
在小米15没有正式发布之前,行业有人讲今年做小屏的品牌很多,小米15的压力很大。今年肯定不会像去年小米14那样轻松了,因为大家都在发力小屏旗舰
2024-11-04 09:53:00
红米K80Pro真机泄露,外号“小米15 Plus ”
11月3日,红米K80 Pro真机被意外泄露:整机外观设计和站哥此前的爆料吻合,相机模组有点像一加13,细节上应该会有不小的差距
2024-11-04 09:53:00
消息称苹果Vision Pro将在2025年升级为M5处理器
【CNMO科技消息】苹果的Vision Pro头显可能会在2025年升级为M5处理器,但原本计划中的低价版本已经被推迟
2024-11-04 09:54:00
华为三折叠再获重磅大奖 《时代周刊》:华为超越全球竞争对手
【CNMO科技消息】10月31日,《时代周刊》公布2024年度最佳发明榜单,其中华为Mate XT 非凡大师凭借颠覆性三折叠屏手机设计
2024-11-04 09:54:00
售价冲击5万元!索尼全能旗舰相机A1M2爆光:金标没了
快科技11月4日消息,索尼A1系列定位全能旗舰,在各个方面都展现出了卓越的水准。目前该系列只有一款,就是A1,于2021年1月发布
2024-11-04 09:54:00