• 我的订阅
  • 头条热搜
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
...文集团涨幅达10.14%,金山软件涨7.84%,阿里影业涨6.98%,商汤涨6.25%,知乎涨5.87%,哔哩哔哩涨4.73%。龙年的首个A股交易日即将开启,节后AI行情如何演绎?国盛证券指出,AI算力有望继2023年后,继续成为新一年的热门投资方向。AI...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在视频生成这一个功能。而下半年,大语言模型公...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
...标GPT-4的国产大模型也在快速迭代升级,如4月23日发布的商汤日日新SenseNova 5.0,其综合性能全面对标GPT-4Turbo;又如5月9日发布的通义千问2.5,阿里云称性能得分追平GPT-4 Turbo。国联证券《AI大模型成果不断涌现,AGI或将到来》有...……更多
不要苛责中国大模型公司的盈利
...好的公司之一。对比国内上一波AI热潮中的头部AI公司,商汤科技在2017年的融资窗口期获得了超40亿元人民币的融资。从融资水平来看,今天的智谱AI明显不如当年的商汤科技。但从技术角度来看,智谱AI重点投资的AI大模型技术...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...积累的技术屡屡能取得佳绩。比如去年取得 MER23 第一的商汤和今年第一的 Soul,这些企业对 AIGC 技术和应用的重视和投入收到了显著成效。可以预见,未来像 Soul 这样坚持技术和产品创新的平台会在释放 AI 能力的过程中持续为...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
...民开放服务,至此,首批包括讯飞星火、百度文心一言、商汤SenseChat等在内共十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。人工智能大模型是指使用大...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
商汤科技亮相第十五届海峡两岸文博会,“元萝卜”成焦点
...未来”的主题,旨在增进两岸文化及产业的交流与合作。商汤科技旗下的家用机器人品牌“元萝卜SenseRobot”携一系列令人瞩目的AI产品亮相本次文博会。作为家用下棋机器人的开创者,“元萝卜”自2022年成立以来,一直致力于...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
4月9日,在金山办公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造更高效释放场景能力的智能办公平台。最强理...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...。 首先,提升了整体性能,尤其在数学、长文本以及多模态方面。在MMLU-Pro上性能提高约7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-previe...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...DCLM来设计高质量数据集从而提高模型性能,尤其是在多模态领域。其思路很简单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。...……更多
更多关于科技的资讯:
全球康养峰会发布2025年十大康养趋势
鲁网2月6日讯2025年1月28日,全球康养峰会(Global Wellness Summit)美国佛罗里达州迈阿密举行
2025-02-06 17:14:00
本文转自:人民网章斐然 陈键 罗知之这个春节,喜讯连连。6日中午,历经5年、追求极致、挑战各种“不可能”的《哪吒之魔童闹海》电影票房逼近58亿元
2025-02-06 17:31:00
奋斗筑梦想 实干向未来——记烟台联通省级服务标兵智慧家庭工程师吴新颖
胶东在线2月6日讯吴新颖,一名坚守在烟台联通第二营销中心北岛服务站16年的智家工程师,日常负责宽带安装与维修,他始终将客户满意度视作工作的至高准则与不懈追求
2025-02-06 17:35:00
潍坊昌乐:企业复工复产忙 冲刺首季“开门红”
大众网记者 焦雪 通讯员 张磊 刘宁宁 潍坊报道一年之计在于春,开局起势见精神。浓浓的年味儿还未散去,潍坊市昌乐县已经吹响了复工复产的“集结号”
2025-02-06 17:44:00
2025年初抖音电商推出9大扶持措施来帮助商家降低经营成本,近期部分政策开始密集落地。2月6日,抖音电商规则中心更新了调整保证金和“0元入驻”的新规则
2025-02-06 17:44:00
2025开年,DeepSeek助力企业AI招聘系统放大招!
新年伊始,万象更新。如果说2024年是AI大模型百花齐放的一年,那么2025年便是大模型落地应用遍地开花的一年。在AI应用如雨后春笋般破土而出之际
2025-02-06 18:00:00
开工大吉:乘2024创新东风,启2025泳池设备新征途
春回大地,万物复苏。不知不觉间,春节假期的余额已经归“零”。千家万户依然沉浸于阖家团圆的新春佳节美好氛围之际,广州千叶在一片祥和气氛中全面开工
2025-02-06 18:45:00
京东培育钻石购物节7日开启 每满300减40还可叠加品类优惠
情人节礼物怎么选?如何能既有创意又能显得独一无二?2月7日,京东黄金珠宝携手小白光、中南钻石、凯丽希、芮爱等知名品牌开启培育钻石购物节
2025-02-06 19:13:00
哪吒2登顶中国影史票房冠军 带火周边潮玩 新品盲盒上架即售罄
2月6日,“高开疯走”的《哪吒之魔童闹海》(以下简称“哪吒2”)刷新影史纪录,成了近两年春节档观众最“满意”影片,登顶中国电影票房总榜冠军
2025-02-06 19:14:00
春节期间,蒙牛集团充分利用假期消费场景,在全国各大商超、专卖店以及线上电商、小程序等渠道加大市场推广力度,全面实现新年产销“开门红”
2025-02-06 19:14:00
雷军回应小米SU7 Ultra车标是金的:花80万买车 满足下虚荣感不过分
快科技2月6日消息,近日,有网友发现,小米SU7 Ultra量产版的车标变成了碳纤维+金色,对此雷军表示,车标是金的,随后引发网友热议
2025-02-06 12:43:00
河南老板拿170万的玛莎拉蒂当套圈奖品 有人半小时花300元
快科技2月6日消息,日前,“河南商丘一老板用170万元的玛莎拉蒂当套圈奖品”的话题,引起网友关注。网友发布的视频中,一处套圈摊位中间摆放了一台玛莎拉蒂总裁
2025-02-06 12:43:00
GaaS陷入低潮 大锤创始人遭辞退
潜水教练出身的迈克尔·康德雷(Michael Condrey,图左)以EA Visceral工作室首席运营官身份与格伦·斯科菲尔德(Glen Schofield
2025-02-06 12:43:00
奔驰:30年前我们发布了ESP 彻底改写了汽车安全史
快科技2月6日消息,梅赛德斯-奔驰今日发文纪念ESP(电控车辆稳定行驶系统)全球首次亮相30周年。1995年2月6日,奔驰与博世合作研发的ESP在第7代S级车(W140系列)上首次应用
2025-02-06 13:43:00
《哪吒2》成中国影史票房新冠军 手办爆火售罄 泡泡玛特回应
快科技2月6日消息,今日,电影《哪吒之魔童闹海》总票房(含点映及预售)超越《长津湖》,位列中国电影票房总榜榜首,影片也带火了盲盒手办的销售
2025-02-06 13:43:00