• 我的订阅
  • 头条热搜
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...答案?为了解决这一问题并推动多模态AI评估的边界,MMMU团队对MMMU基准在健壮性和问题难度上进行提升,新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接:https://arxiv.org/...……更多
大模型这把“火”,烧到了人形机器人
...内部成立了一个机器人部门。早在2017年,OpenAI的机器人团队,就发布过用于模拟机器人控制的开源软件Roboschool。2018年,团队研发出来的机械臂已经能自如地“盘核桃”,即灵活把玩木块。当然,OpenAI机器人团队最著名的研究,...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...起来了~接下来,具体康康获奖论文有哪些~上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance(图像能表达千言万语……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...任务,难以揭示复杂场景中的模型表现。最近,Meta GenAI团队发布了一个全新基准Multi-IF,专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现,包含了4501个三轮对话的多语言指令任务,覆盖英语、中文、法语...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现,GPT 等 LLM 尚无法独立地学习或获得新技能,这意味着它们不会对人类构成生存威胁。他们表示,“涌现能力” 背后的真相或许比科幻电影更富有戏剧性,许多...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...的研究比比皆是。那么,我们该怎么办呢? 最近,微软团队提出了可扩展的智能体框架——AgentInstruct,可自动创建大量多样化、高质量的合成数据。它最大的优势在于,仅只用原始数据源,就能创建完整的提示和回应。论文地...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...上述问题,来自UNC ,芝加哥大学,UMD和罗格斯大学的研究团队提出了Calibrated Self-Rewarding(CSR),多模态大模型的自我增强因为会存在一个真实图像的参照,这会使得self-rewarding的过程更加可靠。论文地址: https://arxiv.org/pdf/2……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...让数据集更能反映实际应用中的难点。‍有趣的是,研究团队发现25%的家具存在多种有效的组装顺序。比如Laiva架子就有8种不同的组装方式!这种多样性真实地反映了现实世界中组装任务的灵活性。 系统的标注流程为了获得高...……更多
字节版Sora火爆24小时,同名论文再次被热议
...值也是拉满了,嗷嗷待哺内测资格!与此同时,字节研究团队一篇PixelDance同名论文,也被扒了出来,再次引发热议。‍‍‍背后论文揭示「PixelDance」原型‍‍字节团队此前入选CVPR 2024的论文,就提出了名为一种PixelDance的模型。...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...程,最终生成用户所需的专业地理图表。展望未来,研究团队将继续深耕地图大模型及地理推理机研发领域,致力于让“坤元”等地理科学语言大模型能够读懂地图、理解地理空间关系。此外,他们还将打造地理科研协作大平台...……更多
90 后华人 CMU 校友回国创业,自研具身智能机器人
...恒地投入,才能打赢关键核心技术攻坚战。\"90 后 \" 创业团队涌现如我们所见,除了相关领域的龙头企业在布局自研人形机器人,国内也有不少年轻的初创团队涌现。例如由 \"90 后 \" 科技博主、前华为 \" 天才少年 \" 彭志辉创办...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代,时序预测已成为众多...……更多
又一华人高管离职,OpenAI总裁提前归队
11月9日,OpenAI安全系统团队负责人Lilian Weng宣布将于当地时间11月15日离职,而3个月前,她刚刚上任OpenAI研究与安全副总裁。Lilian Weng本科就读于北京大学,后在印第安纳大学伯明顿分校取得博士学位,是GPT-4项目的重要贡献者之...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
首位“AI软件工程师”亮相引爆科技圈
...握着十块IOI(国际信息学奥林匹克竞赛)金牌,核心创始团队为3名华人。Devin现处于内测阶段,有意用户可申请提前试用。目前,团队尚未透露更多核心技术细节,但他们表示,Devin源于其长期推理及规划研究的进展。编码只是...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...任务的扩散基础模型,由清华大学人工智能研究院 TSAIL 团队构建。当前,机器人领域公认的卡脖子问题是 “不够智能”。许多模型需要人教几十遍才能完成单个任务,面对没教过的情况则 “束手无策”。而 RDT 正是这个 “智能...……更多
meta推出两款基于ai的图像编辑工具
...过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多样性。据悉,EmuEdit号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务,为视频编辑提...……更多
百度CTO王海峰:文心大模型的底色和成色
...助推剂”。一开场,他就用一句话解答了大家的疑惑:“团队基于更大的算力、更多的数据和更强的算法,训练出来规模更大、效果更好的文心大模型4.0。”升级:算力更大、数据更多、算法更强王海峰坦言,文心大模型4.0的基...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...现实世界中的各种物体进行交互的,由此来自微软的研究团队提出了IGOR。究竟怎样才能学到人类和机器人统一的动作表示呢?IGOR框架解读IGOR框架如下所示,包含三个基础模型:Latent Action Model、Policy Model和World Model。具体来说,...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
国际网络安全团队研发了新型ai蠕虫病毒
3月3日消息,国际网络安全团队近日研发了新型AI蠕虫病毒,能够在生成式人工智能服务之间独立传播、窃取数据并通过电子邮件发送垃圾邮件。伴随着OpenAIChatGPT和GoogleGemini等生成式AI系统的快速发展,AI开始被应用于解决某个...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...从数据接口执行指令到与不同硬件厂商的协同工作。创始团队方面,若愚科技的创始团队出自哈尔滨工业大学(深圳)计算机科学与技术学院,团队拥有多媒体计算、自然语言处理、具身智能和大模型量化压缩等方向的国家级高...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...亟待解决的问题。来自卡内基梅隆大学和清华大学的研究团队提出了 SELF-GUIDE 方法。该方法通过语言模型自身生成任务特定的数据集,并在该数据集上进行微调,从而显著提升模型在特定任务上的能力,无需依赖大量外部高质量...……更多
更多关于科技的资讯:
国产超大规模智算平台“飞星二号”将在今年交付使用首批算力
大皖新闻讯 1月25日,科大讯飞董事长刘庆峰在公司年会现场透露了“飞星二号”的最新进展,表示该平台的首批算力将在2025年交付使用
2025-01-25 22:56:00
李楠点评iPhone 17系列:除了薄没什么意思
快科技1月25日消息,李楠发微博表示,iPhone 17系列不是unibody(一体成型),除了薄没什么意思。此前有博主爆料
2025-01-25 23:05:00
北京佛爷顶开始飘雪花了:今天夜间和明天有降雪
1月25日消息,据气象部门消息,1月25日20时20分降雪开始影响北京西部山区,延庆佛爷顶开始下雪了,近一小时降雪量不足1毫米
2025-01-25 23:05:00
余承东展示科幻一幕:智界新S7自己开过来接他
快科技1月25日消息,今天华为余承东展示了鸿蒙智行强大的智能驾驶功能之一——泊车代驾。视频中,余承东在手机APP上打开这一功能
2025-01-25 19:35:00
三星S25 Ultra在3DMark测试中击败iPhone 16 Pro Max:领先幅度达36%
快科技1月25日消息,三星Galaxy S25 Ultra在3DMark的Steel Nomad Light基准测试中以36%的领先优势击败了苹果iPhone 16 Pro Max
2025-01-25 19:35:00
首发自研芯片 谷歌Pixel 11系列曝光:4剑齐发
快科技1月25日消息,据报道,谷歌将在2026年下半年推出4款Pixel 11系列机型,包含Pixel 11、Pixel 11 Pro
2025-01-25 20:05:00
超百家企业参加新年浙江首批拓市场增订单团组 “千团万企”收获了什么
拓市场,增订单,新年首个工作日,浙江外贸已“开跑”。1月2日下午,浙江省2025年“千团万企拓市场增订单”行动正式启动
2025-01-25 20:17:00
小屏之王!三星Galaxy S25预售:尝鲜价6499元
快科技1月25日消息,三星将在2月11日发布Galaxy S25系列国行版,这次三星同时推出了Galaxy S25、Galaxy S25+和Galaxy S25 Ultra三款机型
2025-01-25 20:35:00
看好自己的物品!南京南站4天捡到1000个身份证
1月25日消息,据媒体报道,南京南站的遗失物品招领处引发关注。据了解,南京南站专门开辟了一个位置用于存放旅客遗失的物品
2025-01-25 20:35:00
零售商员工公然变黄牛!2倍价格倒卖RTX 5090
快科技1月25日消息,RTX 5090/5090D已经性能解禁,很快就会上市,这次供货之紧张绝对前所未有,比如英国顶级零售商OCUK就透露
2025-01-25 20:35:00
春节机票跳水!多条航线大降价:部分跌至百元
快科技1月25日消息,据报道,春节前夕,多条航线降价,部分航线低至百元。去哪儿数据显示,如天津-上海裸票价格最低145元
2025-01-25 20:35:00
最新爆料:苹果调动善战老将整顿AI业务 期盼能打翻身仗
知名科技爆料人马克·古尔曼周五表示,面对AI项目的现状,苹果公司决定先从人事问题下手。知情人士透露,擅长整顿“问题产品”和推动重大项目上市的项目管理副总裁金·沃拉斯(Kim Vorrath)
2025-01-25 21:05:00
中国台湾台南市再发5.1级地震:福建多地有震感 之前致台积电6万块晶圆报废
据中国地震台网正式测定,1月25日19时49分,在台湾台南市(北纬23.31度,东经120.46度)发生5.1级地震,震源深度11千米
2025-01-25 21:05:00
73岁喜当爹!张纪中哄四胎女儿睡觉引围观:网友直呼老当益壮
1月25日消息,近日,杜星霖在网上分享了张纪中哄娃睡觉的视频,引起了不少网友的讨论。张纪中在美国家中哄四胎女儿睡觉,尽管他已73岁
2025-01-25 21:05:00
男子学狗语驯狗:一开口就被咬穿脸
1月25日消息,据媒体报道,胡先生学习说狗语,跟家里的宠物犬交流,没想到刚一开口就被狗咬了。据了解,胡先生家的宠物狗是一条阿拉斯加犬
2025-01-25 21:35:00