• 我的订阅
  • 头条热搜
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...质,具体表现为数据规模和模型参数大,模型矩阵丰富且模态支持全面,算法创新有效,安全性高,训练数据持续更新,以及开源开放等。 为此,vivo进行了系统性的思考和布局,在人才、数据、算法、算力、安全等方面坚持战...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是推动大模型快进到“价值创造...……更多
不止卷硬件!理想新一代VLA智驾大模型有望下半年落地
...外,目前市面上的芯片性能大多无法支持其运行。不过,英伟达即将量产的Thor系列芯片有望解决这一问题。【本文结束】如需转载请务必注明出处:快科技责任编辑:王略文章内容举报 ……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...?喜欢我的夹克吗?”在“科技春晚”CES 2025开幕首日,英伟达创始人&CEO黄仁勋依然穿着标志性的黑色皮衣发表了主题演讲。在约90分钟的演讲中,黄仁勋发布了一系列重磅技术产品,包括新一代基于Blackwell架构的RTX 50系列显...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...),任意到任意则是更远的未来。任意到任意模型属于多模态到多模态,用户可以输入文本、语音、图像或视频等多种形式的内容,并相应地输出文本、语音、图像或视频。Vasi Philomin向我们解释说,任意到任意模型适用于变化...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...十年,AI将无所不在大模型始于文本,未来将拓展至“全模态”。跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需...……更多
Sora为何没能诞生在中国?
...要实现AGI相关。但Sora是不是世界模拟器,仍存在争议。英伟达人工智能研究院首席研究科学家Jim Fan表示,“Sora能模拟出无数个真实或虚构的世界”。图灵奖得主、Meta首席科学家杨立昆认为,“通过生成像素来对世界进行建模...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...招给对手致命一击。01、为了 Gemini ,谷歌有多拼?正如英伟达资深科学家 Jim Fan 在社交媒体上所期待的:“我想要看到一群使用GPT-4的人和Gemini Ultra的人玩一局《太空狼人杀》,这将会是一场史诗级的对抗。”图源:X 截图为什...……更多
智源研究院发布FlagEval“百模”评测结果
...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速,涌现了不少新的厂商与新模型,语言模型发展相对放缓。模型开源生态中,除了持续坚定开源的海内外机构,还出现了新的开源贡献者。语言模型,针...……更多
BAT等互联网大厂,如何入局人形机器人?
...等方面开展全方位合作。但目前宇树公开消息显示采取了英伟达的机器人大模型,而银河通用则并未公开其大模型,未来美团的两家生态企业是否同样采取华为大模型仍不可知。但大模型走向室外,安全性是必然会考虑的问题。...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...座赋能座舱的交互逻辑,使其在车载语音交互领域成为多模态感知、类人推理与群体协同的车载AI中枢,成为用户更人性化、更主动的智能出行伙伴。一、天琴语音助手系统架构:技术支柱+端侧部署天琴语音助手 8.0 以“空间智能、...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈的强化学习(RLHF)和细粒度的提示-隐变量对齐技术,提高了模型对图像多尺度信息的建模能力,...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...展现每一个动作的流畅过程。 语义遵从:业界首个以多模态大语言模型为文本编码器的视频生成模型,天然具备超高语义理解能力,在处理多主体及属性绑定等生成领域的难点挑战时表现出色。 原生镜头转换:多视角镜头切...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
英伟达投的Sora竞品免费了!网友挤爆服务器,120秒120帧支持垫图
...起研究NeRF相关的3D计算机视觉。此外,团队成员还包括前英伟达研究科学家Jiaming Song、NeRF开山论文作者之一的Matt Tancik等。 据TechCrunch消息,截至今年1月份,Luma AI已融资超7000万美元。其中A轮,完成了2000万美元融资,投资方包...……更多
AI应用正面临能耗挑战?分布式算力提供新路径!
...零极的分布式存算平台为每台硬件设备都配备了高性能的英伟达GPU,实施虚拟人及环境实时渲染,从而为大型AI模型、元宇宙应用等前沿技术提供基础支撑能力。传统的大型数据中心,高昂的成本不仅涵盖了硬件设备的初始购置...……更多
AI顶会自动驾驶挑战赛:无图小米汽车 全球第二
...是当下最火热、最值得关注的端到端赛道,第一名是巨头英伟达,联合了复旦大学等多家单位。提出了一个名为Hydra-MDP的新颖架构,使用多教师的教师学生范式进行知识蒸馏,整合来自规则与人的知识。’这使得模型能够学习不...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
上海:加速实施“模塑申城”
...潮的特点是训练和推理的成本更低、模型能力更强以及多模态融合。其中,随着整体推理成本的降低,我们可以在相同硬件上部署更大、更通用的模型,这也是我们在产业落地上非常重要的关键点。”商汤科技产品总监、小浣熊...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...竟发生了 180° 转变。昨天,谷歌在 X 上展示 Gemini 原生多模态能力的 6 分半钟视频下,几乎是清一色的赞扬:而到了今天,Gemini 还是那个 Gemini,但网友已经不买账了:发生了什么,才会让人们的态度一夜转变?原因在于那个 6 ...……更多
更多关于科技的资讯:
消费者的心声是时代的晴雨表,其行动更是驱动生产者前行的动力源泉。“这些Jellycat毛绒玩具的笑脸,看着就让人心里暖乎乎的
2025-03-13 13:37:00
构建线上传播矩阵 中原消金深入开展\
在2025年“3·15” 消费者权益保护教育宣传活动期间,中原消费金融秉持"金融为民"的服务理念,围绕"保障金融权益,助力美好生活"主题
2025-03-13 13:44:00
齐鲁晚报·齐鲁壹点 连宁燕2024年,威海市商务局坚持“商务为民·消费惠民”理念,稳步推进汽车、家电、电动自行车、家装厨卫等领域以旧换新政策落地
2025-03-13 13:48:00
简小知 App:以墨为翼,助力儿童素质教育腾飞
自 2020 年简小知App 上线以来,逐步构建起集写字、专注力训练、阅读等为一体的多维素养培育体系,实现 “知识输入 - 实践输出 - 兴趣延展” 的成长闭环
2025-03-13 13:51:00
无锡移动以创新科技领航“太湖游轮”通信新时代
江南时报讯 “新质文旅·太湖揽胜”太湖游轮的启航标志着太湖水上旅游开启崭新篇章,是无锡、苏州二地协同打造跨区域水上旅游航线的关键一幕
2025-03-13 14:22:00
为贯彻落实国家稳经济政策要求,邮储银行持续深化交通物流领域金融服务创新,通过搭建交通物流行业的融资服务体系,帮扶多家物流企业解决经营难题
2025-03-13 14:24:00
Airbnb新店该如何推广?
随着全球旅游人数的增多,Airbnb在全球范围内的普及和用户基础也在不断扩大,作为房东,如何推广新上线的Airbnb房源变得尤为重要
2025-03-13 14:28:00
澳大利亚跨境热,海外仓成“新标配”,菜鸟悉尼仓入库量增长超170%
近年来,澳大利亚在跨境电商领域展现出强劲的增长势头,不少跨境商家开年纷纷押注本地备货。高效便捷的海外仓备货模式,逐步成为出海澳大利亚的“新标配”
2025-03-13 14:31:00
临沂:沂州里商业街夜景
近日,临沂沂州里商业街夜景。
2025-03-13 14:36:00
广告定制行业作为经济活动的重要组成部分,近年来在数字化转型的浪潮中展现出了蓬勃的生命力。随着互联网技术的飞速发展和消费者需求的日益多样化
2025-03-13 14:48:00
蔚来“收紧”,一场迟来的“小鹏式”补课
过去几年,蔚来汽车的表现可圈可点,但随着中国新能源汽车市场竞争加剧,其发展瓶颈逐渐显现。今年3月,蔚来创始人李斌不得不面对现有经营模式的局限性
2025-03-13 15:13:00
临沂市立足“五个重点”集中发力提振电商消费
大众网记者 李梅 临沂报道3月13日,临沂市人民政府新闻办公室召开新闻发布会,介绍优化消费环境助力提振消费和消费者权益保护工作有关情况
2025-03-13 15:32:00
产品无人问津?齐鲁好物平台为你打通销售全链路,开启畅销之路~
在山东这片富饶的土地上,孕育了无数优质产品:章丘铁锅、胶东海鲜、阿胶制品、潍坊风筝……这些产品不仅承载着浓厚的地域文化
2025-03-13 15:42:00
外贸收款就选PingPong福贸:便捷无忧,推动企业持续发展
2025年的初春,中国外贸数据犹如一股强劲的旋风,席卷全球财经版面。出口总额达到3.88万亿元人民币的历史新高,犹如一面鲜艳的旗帜
2025-03-13 15:45:00
中电华星突破高铁电源热可靠性技术,科研项目获深圳市科创局验收
引言:以技术创新护航轨道交通安全在高铁、动车等轨道交通领域,车载电源系统的稳定性直接影响列车的安全与效率。随着设备小型化趋势加剧
2025-03-13 15:45:00