• 我的订阅
  • 头条热搜
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...项目Project Astra、对标Sora的文生视频模型Veo,以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元(TPU)Trillium芯片等等。其中,Astra是谷歌的AI智能体项目,能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容,响...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...车型形成竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...混元API服务调用,可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初,腾讯混元就宣布在国内率先采用MoE架构模型,总体性能比上一代密集模型提升50%。此后,腾讯混...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
AI应用正面临能耗挑战?分布式算力提供新路径!
...术为医疗诊断、安全监控和娱乐行业提供了强大支持。多模态AI:使AI能够同时处理和理解来自不同来源的信息,如文本、图像、声音和视频等,多模态AI的发展使得机器能够感知、理解甚至预测需求,提供更加个性化和智能化的...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
英国ai初创公司wayve公布gaia-1最新进展
...驶车辆的行为和场景特征进行细致的控制,且由于GAIA-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...化再创作任务。鉴于多媒体内容兴起,翻译需涵盖图像等模态,传统翻译局限于处理语音和文本中的语言,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型的实力,还需...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
Sora“超级涌现力”将把AI引向何方
...tokens(机器模型输入的基本单位),而谷歌最近发布的多模态通用模型Gemini 1.5 Pro就把稳定处理上下文的上限扩大至100万个tokens。Sora之所以能对物理世界规律进行模拟,一个可能的原因在于大数据驱动下,人工智能模型体现出一...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
...12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。 同样的模型,也负责决定在机器人上运行哪些学习...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
更多关于科技的资讯:
海外媒体发稿:品牌出海的“流量密码”
出海浪潮中的品牌挑战在经济全球化的大背景下,品牌出海已然成为众多企业寻求突破与发展的重要战略选择。越来越多的中国品牌将目光投向海外
2025-03-11 23:37:00
谋划“十五五”数字化转型关键行动 广药集团与华为签署全面战略合作协议
2025年3月10日,广州医药集团有限公司(以下简称“广药集团”)与华为技术有限公司(以下简称“华为”)在华为东莞松山湖基地签署全面战略合作协议
2025-03-11 23:41:00
雷诺CEO:欧洲汽车业应向中国学习 避免彻底落后
快科技3月11日消息,据新华社报道,法国《法兰西西部报》近日发表题为《雷诺集团负责人卢卡·德·梅奥:“中国人教会了我们什么”》的文章
2025-03-11 23:49:00
经济大省挑大梁丨千方百计开拓市场 外贸企业抱团出海抢单忙
今天,韩国国际模具及相关产业展在首尔举行,黄岩十多家模具企业首次组团参展,不少企业都带来了各类汽车模具、精密电子模具等最新产品
2025-03-12 00:04:00
丰田、日产们终于想通了 开始搞国产车换壳了
在国内市场被暴揍了这么多年以后,合资的车企们好像终于想明白了。就在最近这一两个星期,咱们很熟悉的日系御三家:丰田、日产和本田纷纷在国内发布了自家的纯电动新车
2025-03-12 00:19:00
《白雪公主》真人电影新片段和海报:皇后送公主毒苹果
近日迪士尼真人电影《白雪公主》新片段,以及杜比和IMAX版等新海报发布,片段展示了白雪公主与皇后的谈话。海报则展示了皇后送白雪公主毒苹果的场景
2025-03-12 00:19:00
稚晖君和机器人 离不开自行车
2021 年 6 月,稚晖君在 B 站上发布了一条「自动驾驶自行车」的视频,一经推出迅速火爆,也让他后来成为人们口中的「华为天才少年」
2025-03-12 00:19:00
小米15 Ultra首销量翻倍!6000-8000价位第一 创历史新高
快科技3月12日消息,小米15 Ultra在3月3日正式首销,一周时间过去,有第三方机构的数据显示,该机首周销量对比前代直接翻倍
2025-03-12 00:19:00
这些平顶山就像天空之岛!是失落的世界 到处是食肉植物
在南美洲北部国家委内瑞拉雨林的深处,有一些神秘的山脉,这些山脉是完全平顶的,而周围由几乎完全垂直悬崖构成,整座山就像一块凸起的桌子一样
2025-03-12 00:19:00
中国首个商业中型可回收火箭!蓝箭航天星云一号整机试车圆满成功
快科技3月11日消息,2025年2月22日,深蓝航天自主研发的星云一号火箭配套二子级液氧煤油真空发动机“雷霆RV”进行了第二轮整机试车
2025-03-12 00:49:00
第20万台小米SU7将在本周下线 工厂订单已排到明年
有数据分析师表示,截止2025年3月9日,小米汽车已经累计交付19.1万辆汽车,预计第20万辆小米SU7将在本周下线,下周正式交付给用户
2025-03-12 00:49:00
有了“长毛猛犸鼠” 我们真的能“复活猛犸象”吗
美国生物技术公司 Colossal Biosciences 在 3 月 4 日宣布,他们创造出了一批“长毛猛犸鼠”,称这是复活猛犸象的第一步
2025-03-12 01:19:00
龙芯CPU打造纯国产税务系统:中国银联都用它!
快科技3月12日消息,龙芯中科介绍了基于龙芯CPU处理器的纯国产税务系统信创方案,既满足了信创改造需求,也实现了税务系统的智能化升级
2025-03-12 01:49:00
本文转自:人民日报海外版夜幕降临,华灯初上,城市中大大小小的台球厅开始热闹起来。明亮的灯光下,一张张台球桌整齐排列,球杆碰撞声
2025-03-12 03:49:00
本文转自:人民日报海外版厉新建 杨占东在“AI+旅游”的发展过程中,我们要更多思考如何建立人与AI良好协作的新模式,AI的“聪明才智”必不可少
2025-03-12 03:50:00