• 我的订阅
  • 头条热搜
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛应用于公共卫生、新能源、医...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...刚刚显现,未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中,多模态其实是一个被寄予厚望的方向。但是,这个领域目前面临一个严峻的挑战,即多模态的理解和生成...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
字节扣子模型广场,给AI大模型搭了一座擂台
...触控点按GUI(图形交互界面)的App,而是基于人机自然多模态对话交互的Bot,就跟苹果在WWDC 24上“画饼”的Siri超级助理一样,AI可理解文字、声音、图片、视频等诸多指令并生成对应的结果。这样看,Bot将会是AI时代的“App”,...……更多
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni
...,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的...……更多
蚂蚁集团研究院院长李振华:探索应用端发展 推动AI科技提升
...务营销,主要为处理图文视频、数字人相关信息,通过多模态对行为进行大规模的优化运营,使营销更加精准,同时提升效率。从对客来看,李振华介绍,蚂蚁集团推出做老百姓投资的智能助理“支小宝”,提升知识力,覆盖现...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
周鸿祎:发展大模型要有AI信仰
...。最近谷歌双子座最大的突破是什么?我印象最深的是多模态的能力,它已经不仅能读书了,已经跟我们人一样开始迷恋看短视频了,能看得懂图片、听得懂声音、看得见电影。谷歌手里有YouTube,现在年轻一代孩子可能已经不...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
【2025数博会】“月球科学多模态专业大模型V2.0”正式发布,全面赋能“数字月球云平台”
...行业大模型成果发布暨供需对接活动”上,“月球科学多模态专业大模型V2.0”正式发布,并将全面赋能“数字月球云平台”,加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...包含复杂跳转逻辑、通过全面测试且没有bug的网页;在多模态方面除了支持长文本文件,也支持视频、音频、图片等理解能力,同时支持生成图文音并茂的作品;还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
百度突然扔出了个AI创作界的Game Changer!一个由文心多模态大模型加持的万能白板,因为支持任何模态的素材输入,并能精准满足用户原始创作需求,被命名为「自由画布」。一切都在一块类似“空白画布”的界面上操作,只需...……更多
Sora带火AI板块,部分基金经理大举换赛道
...关注度较高的人工智能子行业,如Wind光模块、AI算力、多模态模型、ChatGPT、AIGC等指数的涨幅均达到18%以上。2月26日,Wind人工智能、AIGC、AI算力指数等继续上涨。受益于行情回暖,一波AI主题基金迅速“回血”。根据Wind统计数据...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
...面,通过软硬件、云模型、端模型协同优化,实现座舱全模态主动理解、全舱位车内场景感知、多视角车外场景感知以及弱网、高信息负荷场景等全工况安心可用;在组织服务方面,通过生成式场景引擎,围绕用户需求与场景进...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...达到 750 亿参数,性能获得了大幅升级。AInno-75B 增加了多模态处理能力,支持输入文本、图像、视频以及工业场景中的行为(Action)模态,如 CAD 等。通过引入高参数量大模型 AInno-75B, 创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多
圆桌对话:软件还是硬件——人工智能的下一个热点 | 36氪2025AI Partner百业大会
...推出全球首款 DeepSeek 儿童腕表。今年最大的变化是 “多模态能力落地”:文生图、图生视频的头部 API 一出来,我们就融入架构,发现只要快速拥抱好模型,像我们这样的企业也能做 “全球首款” 产品。底层逻辑是 “谁好用...……更多
2024产学研融通创新活动:AI应用落地是重点
...,以及大模型小模型怎么互通也是大家关注的重点,突破模态瓶颈,增加视频、音频的多模态通用模型是后续突破的重点。当前基础模型发展收敛,行业模型落地成为新起点,未来模型发展仍遵循规模定律,关键在于解决“最后...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...力的建设。目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多
英诺天使基金:“明年或是AI应用元年”,AI创新将在C端爆发
...24年或是AI应用的真正元年,AI终端重构、算力国产化与多模态引领AI应用这三大新方向孕育了重要机遇。王晟进一步说明,AI和产业的结合并非刚刚开始,大模型只是拓宽了融合可能,但在业务模式未改变的情况下,这种进步依...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
...型的应用,合同质检的准确率能够显著提升。DeepSeek-VL2多模态模型的细粒度文档理解能力,解决了传统模型在非制式合同中存在合并单元格、跨页表格等多结构表格内容识别准确率不足、精度局限的问题,将嵌套表格、手写体混...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
更多关于科技的资讯:
河北新闻网讯(王闯)一体化电机一台、组合开关一台……11月24日,开滦集团唐山矿业公司(简称“开滦山矿公司”)综采一区主管机电工作的副区长李振辉轻点鼠标
2025-12-01 18:13:00
鲁网12月1日讯泰安联通聚焦精品网络建设核心,持续深化云网融合能力、优化网络运维体系、升级服务保障机制,为区域数字经济发展筑牢通信底座
2025-12-01 13:35:00
冬日有暖意 服务联万家——泰安联通客户日打造贴心服务体验
鲁网12月1日讯初冬时节,寒意渐起,但服务的温度却未曾缺席。近日,泰安联通在全市各营业厅成功举办“联通客户日暖冬回馈季”主题活动
2025-12-01 13:37:00
王倩:以“法律+”思维,护航企业破局新生
巾帼不让须眉:年轻有为的破产破局者,王倩用专业赢得信任当企业陷入债务泥潭,当债权人与债务人的利益激烈碰撞,当投资人寻求危局中的机遇——破产业务从来不是简单的“清算注销”
2025-12-01 09:25:00
重塑健康增长范式,米连科技或将引领互联网发展新路径
在互联网行业经历深刻变革的今天,追求健康、可持续的增长模式已成为企业生存发展的关键。米连科技通过其独特的战略路径,向业界展示了一条超越“烧钱换规模”传统逻辑的新型发展道路
2025-12-01 09:55:00
《和平精英》地铁逃生「冰雪危途」全新赛季火热开启,这把雪赚到底!
列车一响,雪赚开场!《和平精英》地铁逃生全新赛季「冰雪危途」,11月29日,邀你雪赚启航!用创新玩法,拓宽地铁逃生摸金搜打撤的边界
2025-12-01 09:55:00
邮储银行唐山市分行以“政策落地+精准赋能”为主线,积极构建专业化科技金融服务体系,全力支持新质生产力发展。该行创新推出“网点深耕+全链服务”模式
2025-12-01 10:02:00
近日,人保财险唐山燕新路营销服务部组建专项服务小组,走进公司周边场所,开展“面对面、零距离”客户服务行动。活动现场,工作人员以客户需求为导向
2025-12-01 10:06:00
信息技术的迅速发展,尤其是大数据的广泛应用,正在推动医保体系发生深刻变革。传统的医保支付方式已经难以适应现代医疗服务的复杂性与多样化需求
2025-12-01 07:04:00
“一上午加了8位境外采购商”
本报讯(全媒体记者陈春伟、实习生罗家骏)“嘀”的一声,江西华昌竹业集团有限公司外贸经理严慧的微信好友列表里,又多了一位国际采购商
2025-12-01 07:05:00
11月16日,一艘装载邢台纳科诺尔精轧科技股份有限公司生产的辊压分切一体机的货轮,从天津港环球滚装码头启航驶往海外。至此
2025-11-30 07:36:00
坚定信心 勇挑大梁·产业新亮点丨“能址星图”如何全省率先把数据“变现”?
10月18日,在2025中国国际数字经济博览会上,秦皇岛市大数据有限公司展示“能址星图”数据产品。 石 勇摄“我们的‘能址星图’产品上架两三个月时间
2025-11-30 07:37:00
重磅!鸣望教育签约英国子午线英语,解锁中英教育合作新范式!
2025年11月20日,鸣望教育行业赋能第27届研讨峰会,达成一项重磅签约。鸣望教育与拥有46 年专业积淀的英国子午线英语学校(Meridian English)正式达成战略合作
2025-11-30 12:05:00
新生态、新平台、新增长|鲸鸿动能数智赋能品牌确定性增长
2025年,中国消费市场的竞争正从流量红利的浅层博弈,迈向以生态力为引擎、深度运营为核心的新阶段。在这一关键转折点,鲸鸿动能于11月28日成功举办“鸿蒙商业增长论坛·品牌营销沙龙”
2025-11-30 12:05:00
全运会宣传中惊现AI MV:谁在用算法谱写湾区之声?
第十五届全国运动会于11月21日圆满落下帷幕。记者从组委会了解到,一首全程由AI生成的原创宣传MV《向着光的方向》已被正式收录进本届赛事的官方宣传素材库
2025-11-30 12:06:00