• 我的订阅
  • 头条热搜
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型,在输入输出方面更加自由。黄斐认为,在模型之外,AI Agent(智能体)也是一个需要重点关注的领域:“未来的一段时间内,AI Agent一定也是一个比较火...……更多
马斯克的AI大模型登场
...用户每天为推特生产包括文本、图像、视频在内的巨大多模态数据库。在算力方面,之前有消息称,马斯克一次性从英伟达购买了1万个处理大型AI模型数据的GPU,总费用达数千万美元,或许就是为了xAI。xAI官网信息也显示,“xAI...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...包含复杂跳转逻辑、通过全面测试且没有bug的网页;在多模态方面除了支持长文本文件,也支持视频、音频、图片等理解能力,同时支持生成图文音并茂的作品;还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,速度甚至达到了后者的两倍。支持图...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...值线表示。下图展示了几个生成图的对比, 1) 人工画的基准图,2) 直接询问 OpenAI o1,3) 直接运行 MatPlotAgent 工作流,4) DSPy 优化过的工作流,以及 5) 由 Cognify 优化过的工作流。Cognify 优化过的工作流返回的结果几乎与基准图吻合...……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...认为,该成果具有广泛的应用潜力,可以推广到文音视图模态的不同任务上,包括多模态理解、生成基座模型等。5. 写在最后团队关注底层问题,尤其在 LLMs 和多模态方面,期望实现更多突破。更多团队技术研究进展,可以通过...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...动评分器 ( FLAMe-RM 和 FLAMe-Opt-RM)。在12个自动评分器评估基准中的8个基准上,FLAMe及其变体的自动评分性能优于用专有数据训练的GPT-4o、Gemini-1.5-Pro等模型。- 计算高效的多任务训练:引入了一种计算更为高效的方法,使用创新...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...像与人类互动。由此,谷歌追随者高呼:“Gemini让原生多模态(即文本、声音、视频等模态)真正做到丝滑融合,发展原生多模态将成为未来主流路径!”视频发布不到一天,这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
....5 倍(如图 5 所示)。数据集评估本文在一系列标准学术基准测试中评估 Conba 性能,包括常识推理任务(如 HellaSwag、WinoGrande、ARC - E、ARC - Challenge)、阅读理解任务(如 BoolQ、QuAC)、聚合基准测试(如 MMLU、BBH),采用不同……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
RTX 40系GPU AI性能首测
...IAACE技术Demo,它突破了游戏中NPC角色互动的界限,采用多模态方法来展示NPC,将认知、感知和行为系统集成在一起,以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX,增加了更多的功能,在新版本中它加入...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...评估 SELF-GUIDE 的有效性,研究者从 Super-NaturalInstructions V2 基准中选择了 14 个分类任务和 8 个生成任务。研究者随机选择了一半任务用于超参数搜索,剩余的一半用于评估。在模型方面,研究者选择了 Vicuna-7b-1.5 作为输入生成、...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
...批12个长三角跨区域创新联合体正式发布。其中长三角多模态大模型创新联合体由科大讯飞牵头,德清阿尔法研究院等6家机构参与。为头部互联网企业提供技术支撑长三角多模态大模型创新联合体主要研究什么项目?德清阿尔法...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...),任意到任意则是更远的未来。任意到任意模型属于多模态到多模态,用户可以输入文本、语音、图像或视频等多种形式的内容,并相应地输出文本、语音、图像或视频。Vasi Philomin向我们解释说,任意到任意模型适用于变化...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款多模态睡眠状态分类模型。该...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...模型进行持续迭代式微调。GPT-4系列:能力跃升,增加多模态能力,最新版4o突破性价比GPT系列模型的技术演变(GPT-4~GPT-4o):继ChatGPT后,OpenAI于2023年3月发布GPT-4,它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...千帆平台上线。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调...……更多
更多关于科技的资讯:
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00
海尔印尼冷柜工厂奠基将增百万产能
11月27日,海尔印尼冷柜工厂奠基。这座规划年产能100万台的冷柜工厂,将成为海尔智家本土化战略布局及数字化转型落地的又一里程碑
2025-12-01 14:53:00
海尔城市体验中心天津店开业落地数字化转型战略
11月29日,海尔城市体验中心天津店开业。在这里,用户挑选的不再只是一台台冰箱、洗衣机这样的AI单品,而是可以直接把成套解决方案搬回家
2025-12-01 14:54:00
2025年11月27日,梨花教育发布业界首款聚焦“声音”领域的AI声学学习机。该产品主要面向银龄群体,以精准的适老化与智能化设计
2025-12-01 14:56:00
殷平:推动铁路旅游发展 厘清基本概念是前提
在旅游需求多元化个性化发展的拉动下,在国家和部门政策的推动下,在铁路行业深耕市场、实现“旅客变游客”理念的具体落实下,铁路旅游得到了蓬勃的发展
2025-12-01 15:13:00
中国演出行业协会发布团播权威报告,携手抖音启动“优质团播”遴选
作为多人协同的演艺直播新形式,“团播”正成为线上文化演出市场的重要增长点。近日,中国演出行业协会发布《2025中国网络表演行业团体直播业务现状与发展情况分析报告》(以下简称《报告》)
2025-12-01 15:26:00
中国科大发现活性液晶可编程双行波新机制
大皖新闻讯 12月1日,大皖新闻记者从中国科学技术大学获悉,该校物理学院彭晨晖教授、蒋景华研究员团队与香港科技大学、厦门大学合作
2025-12-01 15:27:00
比音勒芬高端破局:新疆鹅绒如何改写“原料出口,品牌进口”的产业困境?
作为全球鹅绒产量第一大国,中国鹅绒年产量占全球总量的 80% 以上。然而,长期以来,中国鹅绒产业却陷入 “原料大国、品牌小国”的困境
2025-12-01 15:27:00
《如何做一个会赚钱的自媒体》出版,助力普通人抓住AI时代自媒体新机遇
鲁网12月1日讯近日,聚焦普通人自媒体变现的实用书籍《如何做一个会赚钱的自媒体》正式出版。该书以“多维度能力叠加”为核心
2025-12-01 15:30:00