• 我的订阅
  • 头条热搜
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...从数据接口执行指令到与不同硬件厂商的协同工作。创始团队方面,若愚科技的创始团队出自哈尔滨工业大学(深圳)计算机科学与技术学院,团队拥有多媒体计算、自然语言处理、具身智能和大模型量化压缩等方向的国家级高...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...亟待解决的问题。来自卡内基梅隆大学和清华大学的研究团队提出了 SELF-GUIDE 方法。该方法通过语言模型自身生成任务特定的数据集,并在该数据集上进行微调,从而显著提升模型在特定任务上的能力,无需依赖大量外部高质量...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
自从 Ilya Sutskever的名字出现在 OpenAI o1 背后团队名单中,他在 o1 中发挥了哪些作用,一时间成为不少网友的关注焦点。这不,机器学习工程师 Rohan Paul 刚刚发帖表示,去年 5 月份 Ilya 合著的一篇论文不能错过。论文题为“Let's Ve...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...用下游任务上对 OLMoE-1B-7B 的性能进行了基准测试。研究团队发现,在所有任务中,OLMoE-1B-7B 比密集 OLMo 模型以更少的计算量 (FLOP) 获得了更好的性能。尽管 OLMoE-1B-7B 使用了不到一半的 FLOP 进行训练并且仅使用 1B 个激活参数,但 ...……更多
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
4月21日,昆仑万维SkyReels团队正式发布并开源SkyReels-V2——首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforceme……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授,这是该团队在继 PMC-LLaMA 后,在持续...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...域,也出现在了机器人领域。昨天晚上,朱玉可和 Jim Fan 团队(英伟达 GEAR 团队)新鲜发布了他们的最新研究成果 HOVER。这是一个仅有 1.5M 参数的神经网络,但它足以控制人形机器人执行多种机体运动。先来看看效果,将 HOVER ...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...评估的高成本的限制。考虑到这些因素,谷歌DeepMind研究团队提出了自动评估解决方案FLAMe。论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...纠正信息并回答「它是在『上面』」,同时提供物体ID。团队确保描述的目标物体类别是当前场景唯一的、无干扰项,以避免歧义。真实数据:随机增强空间关系的同义词以提高多样性,例如,将「below」替换为「under」、「beneat...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...模型attention计算的额外开销。为了确定最优激活参数量,团队投入大量成本展开实验:训练一系列激活参数范围从10M到1B的模型,使用最高1000亿tokens的训练数据,覆盖100亿到1000亿tokens的不同数据规模。使用isoFLOPs曲线,在固定计...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一WilliamPeebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。如今,Sora团...……更多
...言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”...……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
...些问题,来自MIT、港科大、浙大以及格里菲斯大学的华人团队联合推出了一种全新的深度模型架构TimeMixer++,在长程时序预测、短程时序预测、时序分类、异常检测等8项时序任务上的效能全面超越了Transformer等模型,实现了通用...……更多
AI“她力量”:向人类想象更深处漫溯
...2015年组建的专注于“AI+人才管理计算”方向的数据科学团队。旨在通过人工智能和大数据分析手段辅助现代企业的人才管理,推动企业人才管理从经验导向型向数智化导向型的变革,通过智能预测、异常诊断、文本挖掘、社交...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...,并观察人类行为模仿动作;同是 3 月份,斯坦福李飞飞团队发布开源 " 灵巧手 "、成本仅 2.5 万美元;而在 4 月 16 日,波士顿动力先是宣布了数字液压驱动的双足人形机器人 Atlas 退役,不到 12 小时又发布了代表力量与灵活的...……更多
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
...与评估体系来了。来自香港科技大学(Guangzhou)USAIL研究团队,从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同攻击配置对LLMs性能的影响,包...……更多
谷歌公开“社会学习”ai框架
...始数据中隐私内容泄露的可能性。研究人员还尝试了合成指令的方式,让教师模型针对特定任务生成一系列指令,学生模型依据教师模型指令学习执行任务的方式,有点类似“人类遵循他人口头指令做事,并在执行任务中掌握如...……更多
这个AI赛道,一个月内融资4笔,一大半的创始人是华人
...1380 万美金融资。Haiper 由两位曾供职于 Google 旗下 DeepMind 团队的华人工程师建立,提供免费的视频生成功能,最长可以生成 2 秒的高清视频,和最长 4 秒的标清视频。2、3 月 13 日,由前字节跳动视觉技术负责人创立的爱诗科技...……更多
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
...常难消除。豆包AI制图,关键词:匹诺曹机器人清华大学团队在2025年2月发布《DeepSeek与AI幻觉》报告,将AI幻觉分为两类,一类是事实性幻觉,指生成的内容与可验证的现实世界事实不一致。例如,模型错误地回答“糖尿病患者...……更多
炒菜、做家务的开源机器人来了,斯坦福华人开发、Transformer 架构驱动、造价 3.2 万美元
...会萌生开发这样一款会做饭的 AI 机器人,是因为该研究团队发现,大多数机器人操纵任务都侧重于桌面操纵。这包括最近基于 Transformer 和 Diffusion 模型(广泛应用于生成式人工智能的架构)建立的一系列模型。然而,日常环境...……更多
第一个“拿起苹果”的人形机器人,为什么是Figure?
...今年2月,Brett Adcock公布Figure获得6.75亿美金融资,其投资团队震动了半个硅谷,亚马逊创始人贝索斯,以及微软、英伟达、OpenAI都来捧场。随后,Brett Adcock也公布了一张公司职位申请数量增长图,来显示Figure的受欢迎程度,从2023...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...于专有系统,甚至媲美人类专家。为了方便自动化评估,团队还一道推出了全新的大规模基准ScholarQABench,覆盖了CS、生物、物理等多个学科,用于评价模型在引用准确性、涵盖度和质量的等方面的表现。由UWNLP和Ai2两大顶流机构...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情况下也能提供准确的预测,为...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...用户难以发现DeepSeek的“幻觉陷阱”。来自Vectara机器学习团队的幻觉测试显示,DeepSeek-R1的幻觉率高达14.3%,显著高于DeepSeek-V3的3.9%,也远远超过行业的其他推理模型,比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...ore GPU或TPU主机上实现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能...……更多
研究人员研发出能听懂英语指令并执行家务的机器人
...员,利用OpenAI的GPT-3Davinci模型,研发出了一款能听懂英语指令并执行家务的机器人,名为TidyBot。这款机器人可以根据用户的喜好,自动完成如分类洗衣服、捡起地上的垃圾、收拾玩具等任务。GPT-3Davinci模型是一种深度学习模型...……更多
李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!
...样的协调行动能力是具身智能不可避免的挑战,而李飞飞团队在CoRL-LEAP研讨会获得最佳论文奖的ReKep对于这一挑战交出了一张亮眼的答卷。AI发展如火如荼的今天,机器人距离人类的协调行动能力还有多远?近日,李飞飞团队发...……更多
微软华人领衔AI²BMD登Nature,AI生物分子模拟双突破!继AlphaFold后又一里程碑
...照的数据集,这是DFT级别中规模最大的数据库。在该研究团队此前设计的ViSNet的基础上,他们使用机器学习训练了AI²BMD的势能函数。ViSnet是一种通用分子几何建模基础模型,已在《Nature Communication》上发表,并已集成到PyTorch Geom...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...明了RECIPE性能的优越性。 这项研究由阿里安全内容安全团队与华东师范大学计算机科学与技术学院、阿里云计算平台针对大语言模型知识编辑的联合推出。研究背景即使有非常强大的语言理解能力,像ChatGPT这样的大型语言模型...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...院自动化研究所,滑铁卢大学等众多高校组成的联合研究团队,为推动中文AI的发展,前往各大中文社交媒体和论坛取材,经过严格筛选和细致处理,构建了一份高质量中文指令微调数据集“COIG-CQIA”,用于AI训练。论文称,这...……更多
更多关于科技的资讯:
主播走进保税仓 “618大促”跨境电商进口增长强劲
一年一度的“618”电商大促正在进行。今年,跨境电商直播走进了各地保税仓,成为拉动消费的新增长点。走进义乌综合保税区进口商品仓库
2025-06-07 20:23:00
政策市场双轮驱动,十堰消费市场活力迸发
十堰广电讯(全媒体记者 陈伟 通讯员 郭华) 消费,一头连着经济发展的宏观大局,一头连着千家万户的幸福生活。今年以来,十堰持续激发消费活力
2025-06-07 20:20:00
95后清华博士,辍学,造出逆天机器人
3.99万,这是一款N2人形机器人的价格。这个价格,可以称之为“相当划算”,因为N2是全球第一个实现多场景连续空翻的机器人
2025-06-07 16:04:00
锂电池出口检验启动“快进模式” 厦门海关试点“出口锂电包装智慧监管”
厦门海关关员监管一批即将出口的锂电池。(童婕 摄)厦门网讯(厦门日报记者 吴晓菁 通讯员 陈志旭)昨日,厦门时代新能源科技有限公司(以下简称“厦门时代公司”)通过“出口锂电包装智慧监管”系统
2025-06-07 08:22:00
浙江日报讯 (记者 姜晓蓉 通讯员 柯溢能 查蒙) “学校AI模拟面试总结和分析能力非常强,其中追问模式特别有用,让我提前适应面试节奏
2025-06-07 09:08:00
干货多,收获丰!“艺术为广告赋能”南京研讨会圆满落幕
夏日葳蕤精英汇,艺术赋能起风云。6月4日,由南京市广告协会主办、大贺艺术空间承办的“艺术为广告赋能”南京研讨会圆满落幕
2025-06-07 09:33:00
编者按:2025年,东营市以“提振消费”为核心引擎,打出一套政策组合拳,通过惠民让利、场景创新、环境优化等多维举措,激发市场活力
2025-06-07 09:47:00
长春光谷·光博盛会|长光卫星:逐光苍穹 星耀光博
随着2025长春国际光电博览会•light国际会议(以下简称“2025长春光博会”)日益临近,聚焦吉林这片“中国光学摇篮”的创新沃土
2025-06-07 09:37:00
栖霞板块:创新生态聚势,一路与“智”同行
扫一扫,了解更多内容。□南京日报/紫金山新闻记者朱旖旎南京经开区,空气中弥漫着奋斗的气息。在兴智科技园C栋云蝠智能的办公区
2025-06-07 08:00:00
在“歌声唱给党 跟着总书记的足迹看贵州”网络主题宣传中,财经博主徐梦婧(@财经麦麦吉)聊起了贵州“村超”“村BA”的流量转化话题
2025-06-07 05:34:00
以“数”为脉重塑产业生态网|做强做优贵州数字经济(1)
在占据贵阳大数据交易所一面面墙的LED屏幕上,一串串数字滚动更新。在“银发经济”数据交易板块的首次亮灯,让这所中国首家数据交易枢纽再次成为行业焦点——贵州益智慧科技开发有限公司(
2025-06-07 00:53:00
数据“想象力”变产业新动力|做强做优贵州数字经济(2)
作为一家去年12月中旬才在毕节注册成立的新公司——贵州灵动大数据有限公司一季度数据交易额达到103.9万元,实现了毕节市数据产品在贵阳大数据交易所全流程场内交易零的突破
2025-06-07 00:53:00
3砺生辉&618大促丨开启甄选礼遇
烟台中泽华羿铂尔曼酒店2022.6.6-2025.6.6三载春华秋实烟台中泽华羿铂尔曼酒店迎来了三岁生辰岁月匆匆 宛如白驹过隙一千零九十五个日夜更迭见证了我们从青涩到坚韧的蜕变我
2025-06-07 03:03:00
戏剧艺术的创新发展路径
摘要:在数字化与全球化冲击下,戏剧艺术面临着传统模式与时代需求的结构性矛盾。本文以创新为核心,从技术融合、文化根植、市场下沉及社会应用四个维度
2025-06-06 09:00:00
乐其创新SmallRig助力全球公益影像创作者记录湾区活力,深化国际文化交流实践
2025年5月23日,以“影像浪潮・时代进程”为主题的2025国际影像文化周(中国·深圳)正式开幕,本届国际影像文化周涵盖全球影像场景产业论坛
2025-06-06 10:35:00