• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...动过程中不断促进自身“进化”。传统 AI 需要依靠内置模型对世界进行表征,再根据这些表征建构行为概念,这种模式高度依赖人工数据标注,不仅缺乏应对多变情况的灵活性,也无法理解与任务相关的未标注因素。由于传统 A...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...tificial Intelligence)进入人们视野。在这一概念下,借助大模型,机器人感知、决策与交互提升,具备更强的自主学习能力和环境适应性。机器人赋予大模型现实的物理载体,让曾经的虚拟智能走进现实世界。技术和现实的交织足...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...al Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。目光转回国内,我们同样在中国公司中发现了这场变革浪潮的先行者。据机器之心了解,国内初创公司自变量机器人(X Square),是国内唯一...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更有颠覆性的是国内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【新智元导读】适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文,结果。真实数据稀缺可能不再是问题...……更多
突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景
【新智元导读】GenXD模型结合CamVid-30K数据集突破了3D和4D场景生成的挑战,能从单张图片生成逼真的动态3D和4D场景。这一进展为虚拟世界构建带来新的可能性,让动态场景的生成更加快速和真实。在我们熟知的2D图像和视频生成...……更多
朱松纯:通用人工智能要“眼里有活”,关键在AI“价值观”
...教授朱松纯也发表了演讲,他提出,当前有以ChatGPT等大模型为首的“大数据,小任务”和“小数据,大任务”两条科研范式,而后者则很大程度上属于他们在实现通用人工智能上的路径。而他认为,对于机器人或者通用智能体...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
【新智元导读】UrbanGPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情...……更多
deepmind研究:未知物体也能轻松识别分割
...DetCon和ReLICv2。 除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?将使用Odin生成的分割图...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
趣丸科技任少峰:声音领域AI技术发展前景广阔
...能技术目前取得了哪些成果?任少峰:首先是开源语音大模型。例如,趣丸科技与香港中文大学深圳校区合作研发的开源语音大模型“MaskGCT”,它训练于10万小时数据集Emilia,是全球最大且最为多样的高质量多语种语音数据集之...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...出色的 BEV感知能力,需要积累海量的已标注数据以支持模型的训练。如何找到更多高质量的数据并高效利用,是支持技术不断迭代的重要基石。轻舟智航充分利用作为高级别自动驾驶解决方案提供商在AI领域的先发优势,通过突...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
【新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
...果、微软,苹果推出Apple Intelligence AI系统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才能找到更省力的负重登山方法。近日,LeCun 团队发布了他们在世界...……更多
共赢生成式AI时代
...更前沿、更有价值的业务场景。第二是选择合理的工具和模型。生成AI无比强大,但模型和工具的选择也很多,企业需要根据业务和场景选择最适合的模型和工具,因为没有一个模型能够适用于所有场景。第三是数据战略。选择合适...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...出图像目标表示(IGOR,Image-GOal Representation),“投喂”模型人类与现实世界的交互数据。IGOR能直接为人类和机器人学习一个统一的动作表示空间,实现跨任务和智能体的知识迁移以及下游任务效果的提升。要知道,在训练具身...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
百度与优必选合作,人形机器人“大脑”有了AI大模型深圳商报·读创客户端首席记者 袁静娴4月1日,记者从优必选获悉,优必选近日已确定与百度携手合作,尝试让人形机器人Walker S接入文心大模型,进行具身智能应用升级训...……更多
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
...粤港澳大湾区为窗口,深入探讨了全国及全球视角下的大模型算力趋势、具身智能、AI+编程、AI for Science、低空经济等热点议题。作为IDEA研究院创院理事长,沈向洋进行了近3小时的主题演讲,期间发布多个IDEA研究院创新成果,...……更多
半年冒出近百家新公司,「具身智能」也有春天 | 36氪新风向
...直没有出圈,只是科幻电影里人类浮夸的想象。直到AI大模型出世,大家才意识到,具身智能原来真的能走进现实。具身智能的理论认为,智能体是通过视觉、听觉、触觉等各种感官与现实物理世界的不断交互,来反馈到脑,生...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多
以“价值创造”为导向,医渡科技自研大模型即将发布
...生成式AI场景论坛”发表主题演讲,系统分享了医疗垂域大模型的建设与应用。闫峻强调,技术应该从价值出发,否则即使技术再先进,缺乏实际价值也难以持续发展,“以价值创造为导向”也是医渡科技建设垂域大模型的基本理念,公...……更多
更多关于科技的资讯:
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00