• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
华藏生态共创,为大模型商业变现注入活力
...模型成果,华藏与元贝贝共创元贝贝智能婴儿床,通过多模态的数据结合人工智能和大模型的分析,不断迭代母婴健康管理服务,打通智能母婴应用场景,实现商业共赢。 经过华藏生态商业变现实践之路的积累,形成了一套高...……更多
人形机器人进厂“实习”,汽车制造还需要工人吗?
...的执行成功率,需要机器人拥有自主可靠的决策能力、多模态感知能力以及实时精准的运控能力,这些能力离不开大量的数据采集、模型训练、仿真测试。只有这样,才能真正将大模型适配到人形机器人的“大脑”。此前,人形...……更多
提升开户效率、控制合规风险,大模型助力券商提质增效
...讯云智能高级产品架构师丁鹏进一步介绍到,TI-OCR基于多模态底座大模型,采用端到端的识别方式,可以解决传统OCR没有办法解决的比较难的问题,如印章干扰、手写识别等。此外,相比于企业自己依据场景训练模型,如今将大...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
“解锁”AI云盘新体验!中国移动云盘通过3项AI算法备案
...中,中国移动云盘3项大模型算法成功通过备案,涵盖多模态大模型、文本生成算法等。去年9月,中国移动云盘启动AI智能工具内测,本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务,在国内AI云盘赛...……更多
科技巨头齐聚MEET2025:共话AI、Agent、具身智能机器人等浪潮趋势
...自今年年初OpenAI旗下视频生成模型Sora惊艳亮相以来,多模态大模型和生成技术便迅速成为了科技界和产业界竞相追逐的风口赛道。在多模态大模型的推动下,AI技术不再局限于单一的数据形式或应用场景,而是能够跨越文本、图...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新闻稿在chatGPT发布一周年之际,谷歌通过 Gemini 赶了个晚集,想要再度...……更多
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI
(图片来源:林志佳拍摄)国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
依图科技“天问”大模型赋能安防,智慧应急跨越式发展
...防行业正经历着前所未有的变革。作为应用人工智能和多模态大模型的先锋领域,安防行业不仅展示了其强大的产业基础,更在发展新质生产力方面彰显出卓越的能力和潜力。依图科技,作为AI领域的先行者和创新者,多年来一...……更多
谷歌 Android XR SDK开发者预览版上线:2种空间交互、多模态输入
...行。如需了解具体互动功能,请参阅各个平台的文档。多模态输入Android XR 支持多种输入方法,包括手部和眼球跟踪、语音指令、蓝牙连接的键盘、传统鼠标和自适应鼠标、触控板和六自由度 (6DoF) 控制器。您的应用应自动支持...……更多
...统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中国在AI大模型方面也已有足够竞争力。...……更多
朱秋国:云深处开展1+X+N战略 拓展足式机器人新赛道
...苏黎世联邦理工学院旗下Anymal四足机器人开始尝试使用多模态大模型,来完成通过手肘支撑攀爬以及跑酷、足部关灯开门等动作。足式机器人开始像人类一样加速进化,如果说决定足式机器人下限的是其硬件水平,那么决定其上...……更多
光大证券:商业领域的需求预计将在2024年出现增长
...本地性能平衡。AIPC具有存储容量大、计算能力强、交互模态以及承载场景丰富的优势。AI大模型目前覆盖的应用场景与PC高度重合,因此AIPC被称为“大模型的最佳载体”。各大厂商纷纷布局AIPC,逐步完善AIPC产品,目前PC换机周...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...—亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Am...……更多
...全新的计算范式;通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台, AI治理将引领我们踏上更智慧、更安全的未来。此外,数字交互引擎在高效构建虚拟世界、与现实世界高质量交互的过程中...……更多
...躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
伦敦证券交易所集团:视中国市场为未来增长市场、全球战略核心
...都可以用AI重塑。上一代金融信息产品其实是一维、单一模态的、小数据样本的,实际上,大部分信息是多维、多模态、非结构化的。AI可以让全域信息的捕捉和处理更高效,未来AI bots将成为每个企业的核心资产。“快速发展的...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...十年,AI将无所不在大模型始于文本,未来将拓展至“全模态”。跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需...……更多
高通aihub正式发布:支持75个ai模型
...示了全球首个在搭载第三代骁龙8的安卓手机上运行的多模态大模型(LMM)。在这一演示中,高通展示了一个超过70亿参数的LMM,其支持文本、语音和图像输入,并能够基于输入的内容进行多轮对话。同时高通还在搭载全新骁龙XEl...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
...及Pika和Runway等公司为代表的AI生视频技术持续革新,AI多模态能力持续演进,更广泛的应用场景如影视、游戏、营销、电商、教育等有望迎来生产工具层的革新,推动更高效且优质的内容创作。核心业务的应用场景有望受益的公...……更多
更多关于科技的资讯:
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00
厦门网讯(厦门日报记者 林雯)旧低效工业用地加速变身科创高地。近日,随着位于思明区前埔片区的2025P13、2025P14地块成功出让
2025-09-23 08:58:00
国网厦门供电公司持续推进“EASIER用电”品牌建设
国网厦门供电公司为厦门天马微电子有限公司创造更优质、更稳定的用电环境。(国网厦门供电公司 供图)“EASIER用电”品牌厦门网讯(厦门日报记者 刘艳 通讯员 林艳婷 高芳 郭芷祎)近年来
2025-09-23 08:58:00
山东移动泰安分公司数智融合加速 赋能企业蝶变升级
鲁网9月22日讯数字化浪潮正在席卷千行百业,山东移动泰安分公司(简称:泰安移动)以“技术赋能、生态协同、梯次服务”为核心
2025-09-23 10:01:00
企鹅网络(Q学友)与腾讯云达成战略合作,携手共创“AI+职业教培”新范式
9月16日-17日,2025腾讯全球数字生态大会在深圳举办。大会期间,深圳市企鹅网络科技有限公司(以下简称“企鹅网络”)与腾讯云正式签署战略合作协议
2025-09-23 10:39:00
本报记者 赵 曦 □ 花沁昕“白天的时间都用于工作和社交,只有夜晚的时间才真正属于自己,我舍不得睡,但真想睡的时候又睡不着了
2025-09-23 10:48:00
科学为基,爱心为桥:儿童营养品牌inne携手德甲冠军俱乐部启动全球公益计划
在全民健康意识提高与消费升级的双重驱动下,新一代父母对儿童营养的重视程度前所未有。消费需求愈发细分、专业,推动儿童营养品行业从“标准化供给”向“专业化服务”转变
2025-09-23 11:20:00
《金刚狼》《权游》供应商分拆机器人数据业务,腾讯、字节大牛加入 | 智能涌现独家
文|邱晓芬编辑|苏建勋2023年底,全球出货量最大的动作捕捉设备提供商"诺亦腾(Noitom)"联合创始人戴若犁,一度以为自己被骗了
2025-09-23 20:47:00
近8成职场人每周都会使用AI工具 通用对话型AI占比最高
在人工智能技术日臻成熟的2025年,AI已不再是科幻概念或实验室产物,而是深度融入职场生态的“数字同事”。从“工具”走向“伙伴”
2025-09-23 11:37:00
罗永浩宣布“将测评预制菜”,网友:气氛都烘托到这了,要不转型做预制菜吧
9月23日凌晨,罗永浩在微博发文称,将和团队一起,对市面在售的预制菜进行测评。他表示自己“陷入了深深的思考:为什么电商网站上能买到的预制菜
2025-09-23 11:54:00
首届“洞见未来·乡村振兴共创周” 及“怀柔乡村振兴新主体联盟”启动仪式在北京怀柔成功举办
金秋九月,长城栗乡,9月20日至21日,首届“洞见未来·乡村振兴共创周”在北京市怀柔区精彩启幕。活动以“探索新路径、凝聚新合力
2025-09-23 12:10:00