• 我的订阅
  • 头条热搜
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
AI赋能千年本草|三维天地开启中药‘鉴’证新篇章
...典》等高标准要求。 中药材智能鉴别系统通过结合多模态大模型(如CLIP、DeepSeek)的图像语义理解与视觉网络模型的特征提取能力,构建了“视觉-知识”双驱动的精准鉴别体系。其核心优势包括: 1.标准化特征库:通过量化指标...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...生图像、文生音频、视频智剪、图生视频、文生视频等多模态AI应用,并利用文生视频赋能短剧创作及制作。同时,公司逐步覆盖微短剧内容端、制作端、IP端、发行端及变现端等关键链路,成功出品多部不同题材的微短剧,并...……更多
智谱AI Open Day:开启大模型商业化“下一站”
...-Turbo。同时,首次开源了基于GLM的视觉模型GLM-4V-9B,其多模态能力可以与GPT-4V比肩。 新一代MaaS平台:降低成本的AI利器智谱AI还推出了全新的MaaS 2.0大模型开放平台。这个平台不仅接入了新模型,还推出了全新的企业权益服务体...……更多
大模型这把大火,烧到了手机领域
...是生态底座,可以提升人机交互的智能化等。同时,其多模态和跨模态及轻量级应用技术的发展,极大地促进了智慧应用及智能生态的繁荣。其次,手机行业困局待解,AI大模型或为最佳突破方向。过去几年,以手机为代表的消...……更多
华为车BU智能驾驶产品线增设一个新的技术开发部门
...提升智能驾驶技术水平。行业人士指出,端到端技术与多模态大模型的结合是一项长期工程,需要车端硬件的支持和大量数据训练。华为成立新的技术开发部门,正是为了通过组织调整,支持这一长期技术研发工作。 ……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
...势,向与会者着重介绍感知智能典型应用(语音识别、多模态交互)、认知智能典型应用(认知大模型)的技术现状、面临挑战以及发展趋势,“目前科大讯飞能提供70种语音识别、60种合成能力,未来希望与星宸科技一起为广...……更多
江苏南京:创新不靠单打独斗 合力构筑生态优势
...10项技术需求,涉及自主意识与情感反应数字人系统、多模态融合智能处理框架、直播数字人的音频驱动口型、多模态智能人机交互的语义关联信息融合技术等。“每一项都是我们一线最迫切的需求。如今,已经有一半都对接解...……更多
“人工智能”首次写入政府工作报告,平治信息等公司纷纷加大布局
...工智能时代全球性的紧缺战略资源。从ChatGPT到Sora,从单模态到多模态,从单一智能到通用智能,人工智能大模型技术正在引领新一轮全球人工智能创新热潮,也带来了智能算力需求激增。去年以来,全国多地掀起了智算中心建...……更多
DeepSeek R1赋能爱尔眼科“爱科(Eyecho)”数字人 驱动智慧医疗新突破
...。术后陪伴数字人:通过手机端提供视频、语音及文本多模态服务,为术后患者定制个性化康复方案,实现长期眼健康管理。自发布以来,爱尔数字人“爱科(Eyecho)”已在集团总部及旗下多家医院投入使用,并亮相多个国际国内...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
联想戴炜:如何跨越多模态大模型产业应用的最后一公里
...面临消失。同时ChatGPT带来的对算力巨大需求也为未来多模态大模型的应用带来了巨大的挑战。11月9日,在世界互联网大会“算力网络协同创新论坛”上,联想集团副总裁、中国区方案服务业务群总经理戴炜从算力网络的未来演...……更多
动动嘴就能点咖啡,荣耀MagicOS 9.0到底有多牛?
...成员,分别是大语言模型、图像大模型、语音大模型和多模态大模型,它们均基于MagicOS的四层AI架构基准,为手机的感知服务提供帮助。更重要的是,魔法大模型始终坚持端云结合的方案,这能有效地在效率和安全性上达到平衡...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始人Russell D...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
跟骑手学习送外卖,这家具身智能公司的机器人已经上岗挣钱了
...人的表现才能如此出色。未来,他们还将在自然语言、多模态等方向持续迭代,让这个机器人更加实用。 走进开放物理世界,机器人如何工作?机器之心:能否简单介绍一下,公司现在在做一件什么事,长期愿景是什么?卢鹰...……更多
人工智能接入电信网络意味着什么?英伟达称最早明年下半年商...
...型边缘AI应用,即通过5G远程支持自动驾驶汽车、工厂多模态AI应用和机器人开发应用。例如,自动驾驶汽车能够使用5G网络将其前摄像头视频转发到托管在AI-RAN服务器上的远程支持服务,多模态AI模型在服务器上分析视频流、进...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
从高校竞赛到AI手机,OPPO加速推动智能体生态建设
...连接AI技术和开发者的实践桥梁。基于自然语言处理、多模态AI、大模型等前沿技术,OPPO智能体平台不仅灵活强大,还特别注重安全性与开发便捷性,为开发者提供多种API接口和SDK工具。平台支持开发者通过低门槛、零代码的方...……更多
真香!智谱大模型,有了首个免费的API
...,是直面应用的底层逻辑。新一代大语言模型继续保持多模态、长上下文等方面的性能优势,又因为速度和效率的大幅提升获得了更多开发者的青睐。在实际应用场景中,新模型适用于处理高频次、相对简单的任务,禁得起人们...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...化应用的标准化平台产品。通过集成大模型、虚拟人、多模态语音、知识库等技术,利用人机对话的交互方式,轻松完成展厅和展会的讲解互动,实现用户行为分析,精准定位商机。在团队碰头会场景,星火快答可通过问答快速...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...2023年3月,朱军团队在全球首发并开源基于U-ViT架构的多模态大模型UniDiffuser;5月提出文生3D新算法Prolific Dreamer;今年1月,生数发布4D框架Animatable Dreamer并实现可生成4秒视频的文生视频模型。如今,朱军团队再发布的原创自研U-Vi...……更多
...台AI定制内容平台:根据企业的个性化需求,批量生成多模态、高质量、富有吸引力的定制化内容,有效提升企业在市场中的品牌形象与传播效果,如有效助力某家电品牌咨询量增长350%。-量子数据库:具备强大的数据存储与管...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...为 Llama 3 开发过程的一部分,Meta 团队还开发了模型的多模态扩展,使其具备图像识别、视频识别和语音理解的能力。这些模型仍在积极开发中,尚未准备好发布,但论文展示了对这些多模态模型进行初步实验的结果。7、Meta 更...……更多
腾讯大模型战略全景亮相!混元大模型、知识库、智能体开发平台一应俱全,打造真正“好用的 AI”
...话AI体验。 今年以来,混元的迭代速度明显加快。在多模态生成领域,混元图像 2.0 率先实现“毫秒级”生图,混元3D v2.5凭借业界首创的稀疏3D原生架构,实现了可控性与超高清生成能力的代际飞跃。凭借技术的领先性和开放的...……更多
扣子企业交流日最全回顾 数万家企业都在怎么用扣子?
...选择扣子的理由。“通过应用扣子,我们成功实现了‘多模态互动’。”乐鑫科技董事、副总经理王珏表示,依托 AI Agent平台扣子,乐鑫将智能体的开发能力引入端侧设备开发过程,并和扣子发布联名开发板EchoEar「喵伴」。该...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...包含复杂跳转逻辑、通过全面测试且没有bug的网页;在多模态方面除了支持长文本文件,也支持视频、音频、图片等理解能力,同时支持生成图文音并茂的作品;还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多
山东港口日照港:“00后”徒弟与“80后”师父的创新之旅
...大模型案例,经一个多月试验优化,最终选定豆包视觉多模态大模型,研发出兼容现有硬件的集装箱AI理货平台,实现集装箱智能理货的新突破。如今,集装箱AI理货平台已上线使用,准确率超99%,支持“一人多线N船”作业,实...……更多
【2025数博会】贵州省公共资源交易中心党组书记、主任蒋体佩:AI赋能公共资源交易革新成果显著
...审系统,涵盖44个客观评审点和256个主观评审点,利用多模态识别和混合专家模型技术,自动解析投标文件并生成评审意见供专家复核。系统自3月底上线以来,已完成20个房屋建筑和市政项目评审,单份文件处理仅需约3分钟,大...……更多
更多关于科技的资讯:
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00
“我是一名肢残三级的残疾人,请问能享受哪些补贴?”输入文字,几秒钟过后,手机页面就出现了答案——杭州市各级政府的相关助残政策和补贴金额被清晰地列举出来
2025-12-06 10:21:00
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00