• 我的订阅
  • 头条热搜
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
... 2024“人工智能+”标杆示范征集活动。联汇科技凭借在多模态大模型与智能体行业的突破性技术创新,以及在细分市场中的卓越表现,荣获2024人工智能隐形冠军企业标杆Top10。联汇科技拥有卓越的技术能力,其核心技术包括向量...……更多
中国AI专利最多的5个公司!华为第5,平安第3,腾讯第1
...平安家医”,并正式发布参数高达百亿级的平安医博通多模态医疗大模型(以下简称“平安医博通”)。以平安医博通上的AI体检报告解读业务模型为例。目前,它已经能自动识别、解读体检中的促甲状腺素、血小板计数等936项...……更多
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...增长的可能。另一方面,如今图片、音频、视频、3D等多模态大模型层出不穷,这些能力对于用户而言也至关重要,因此边缘大模型的部署不会满足于简单的文生文、文生文。还有更多创新算法的出现,都会对芯片本身的灵活性...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
入选高工人形机器人优质企业链,银牛微电子3D空间计算解决方案获高度认可
...现具身智能。该方案不仅融合了语音、文本和图像等基础模态,还加入了3D点云模态,通过强化的多模态关联技术,显著提升人形机器人的智能水平和逻辑自洽性。与此同时,银牛还拥有丰富的三维空间多模态大模型数据库,可...……更多
浙江移动:以“国家队”实力全面推进AI+行动计划
...湃算力,打造的九天基座大模型实现行业定向增强、行业模态匹配、全栈国产化、安全可信等四大技术突破,成为国内预训练行业数据占比最高的大模型。”日前,在“智启新质、‘四新’向未来——浙江移动新质生产力系列能...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能100+城市治理下...……更多
Sora概念引爆A股!谁在布局AI视频
...技、会畅通讯、博汇科技等个股均涨停收盘。盘面上,多模态AI板块领涨A股,板块涨幅高达11.11%,板块内32只个股全部飘红,其中14只个股涨停;此外AIGC概念、Web3.0等板块同样涨幅居前。消息面上,近日,OpenAI推出了新的文生视...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...,其架构如下图所示:CogSound的核心技术依托于GLM-4V的多模态理解能力,能够精确解析视频中的语义和情感,并生成匹配的音效。例如,在展示森林景观的视频中,CogSound能够生成鸟鸣和风吹树叶的声音;而在城市街景中,则会...……更多
蚂蚁集团井贤栋:恪守科技伦理,推动AI向善而行
...不等于有效协同。而垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。为了破解这些难题,蚂蚁集团选择了构建专业智能体生态的路径。...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
...代面向智慧园区场景的智能服务器AIS 4.0。集成领先的多模态大模型能力,实现软硬件全面国产化,为各类园区综合管理效能提升提供更安全、更智能、更易用的AI新智引擎。自2019年首版推出以来,商汤星云AIS智能服务器以算法...……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
贵州移动:发变革之力 做经济社会转型赋能者
...的央企大模型,涵盖语言、视觉、语音、结构化数据和多模态。基于基座模型,中国移动已布局40多个细分行业,打造近千个数智化项目,覆盖政务、医疗、网络等领域,同时开源参数语言大模型,实现了让大模型既会“作诗”...……更多
智能产业赛道 天津跑出加速度!2023天津人工智能相关产业营业收入超3000亿元 扫码阅读手机版
...于其搭载的华来自研V15NX视觉大模型。该款大模型基于多模态视觉语言技术、自然语言处理技术等关键技术,能够无缝整合并解析各种视觉信息。通过深度学习能力,在各种计算环境中均能实现高效的内容创造与理解。它支持包...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
中国电信在大模型领域成功布局ai技术
...强烈的积极性,包括语义理解、语音识别、图像处理和多模态交互等方面。这些研发成果已经在多个行业和应用场景中得到了有效应用,展现了中国电信在AI技术本土化方面的成果,即更加符合中国的语言、文化和行业特点。第...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
金域医学2024“域见杯”医检人工智能开发者大赛启动
...字化转型,围绕医学自然语言处理、医学计算机视觉、多模态多组学AI和大数据应用等方向开展建设。“本届‘域见杯’的6道赛题,是金域医学从发现的行业痛点中筛选而出的,涵盖了罕见病诊断、病理诊断、药物研发、多模态...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
推动人形机器人规模化应用
...算力调度服务体系。支持头部企业积极引进业界知名的多模态大模型落地,围绕大模型基础架构、训练数据集构建、多模态学习算法等领域,开展算法创新和核心技术攻关,构建安全可控的技术体系,降低人工智能开发技术门槛...……更多
顶级专家讨论:生成式 AI 与机器人技术的未来
...模型带来的影响是深远的。另一个激动人心的话题是“多模态模型”,它有两种含义:1.结合不同输入模式的多模态:例如将视觉和语言结合起来。现在这已经扩展到包括触觉、深度感知以及机器人动作。2.对相同输入状态允许...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00