• 我的订阅
  • 头条热搜
机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”
...。除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力。现在能开口说话和人类交互,支持中英文。还能听从人类指令抓取物品:【此处无法插入视频,遗憾……可到量子位公众号查看~】而这些只是其中的一部...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进:1、引入超大规模数据处理系统,提升视频画质;2、采用多模态大语言模型(MLLM),...……更多
谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市公司回应无相关业务
谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市公司回应无相关业务 【谷歌Gemini引领多模态AI大模型热潮 云鼎科技、佳都科技等最新回应多模态具体事宜 科创信息等5家上市...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
多模态能力的进化,是AI眼镜成为生活必需品的关键
AI 浪潮下,多模态能力成为 AI 领域,特别是 AI 眼镜行业的高频热词。不少专家坚信,这项技术是突破单一交互局限的关键,有望重塑 AI 眼镜的使用体验。所谓多模态能力,即整合视觉、听觉、语言、触觉等多维度感官数据,...……更多
AI+智绘美好家 天翼数字生活公司携重磅AI+家庭产品亮相智算云生态大会
...活公司基于中国电信自研的星辰大模型、视觉大模型、多模态大模型等AI能力,打造4大AI应用。基于多模态大模型,建立百亿级向量数据库,提供智能搜图服务,用户可通过以文搜图和以图搜图两大智能搜索功能,在短时间内找...……更多
平安鹰眼系统十五年:一场专注风险减量的长跑
...0的灾害的预测、预警及灾中的响应时效。进入AI时代,多模态大模型为鹰眼系统3.0建设注入新动能。谢文峰表示,ChatGPT是聚焦语言处理,而多模态大模型把能力拓展到对音频、图像和声音等数据的处理,实现各种听说读写的能...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
Sora题材股继续分化:有公司称AI视频识别准确率90%,尚未有规模化收入
...股走势继续分化。2月21日,截至收盘,Wind数据显示,多模态模型指数涨1.64%,因赛集团(300781)三连板,当虹科技(688039)收涨18.65%。AI应用指数涨0.46%,路畅科技(002813)、实丰文化(002862)涨幅居前,中文在线(300364)、易...……更多
...行业难题。海尔消费金融(简称“海尔消金”)创新引入多模态大模型,并使用大小模型协同机制,充分发挥大小模型的专业能力,构建了一套完整的活体照欺诈防控体系,能够更加精准地识别和防范风险。技术瓶颈催生创新需求...……更多
大厂加码落地大模型,京东云一口气发了10个AI应用
...文案生成、产品图生成等,主要以内容生成为主,涉及多模态大模型技术。比如,智能营销文案生成应用言犀妙笔可以一站式创作智能文案。智能视频混剪平台言犀秒创上,用户只需输入SKU,仅需几分钟即可由大模型自动提取卖...……更多
科交会举办“人工智能+”场景对接活动 安徽打造全球AI创新高地
...其中,北京元一畅想推出“D2WEB 3D引擎+低代码工具集+多模态大模型”技术矩阵,实现3D AIGC实时创作与虚拟交互,在汽车行业AI渲染、文博元宇宙等领域形成标杆案例,助力企业效率提升40%以上。孪生宇宙自主研发了国内首个智...……更多
...国内人工智能独角兽企业月之暗面(Kimi)发布新一代多模态思考模型k1.5。利用长短转化技术,以长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude 3.5 Sonnet 等全球...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...质,具体表现为数据规模和模型参数大,模型矩阵丰富且模态支持全面,算法创新有效,安全性高,训练数据持续更新,以及开源开放等。 为此,vivo进行了系统性的思考和布局,在人才、数据、算法、算力、安全等方面坚持战...……更多
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
...大模型,AI大模型的迭代再进一步,从文本到图像、从多模态到视频,大模型的发展快得令人不敢眨眼。一个不留神,可能就会掉队。随着超大规模的基座大语言模型不再持续狂飙,大模型向着边缘和端侧下沉的趋势日益明显,A...……更多
提质降价,国产大模型加速奔跑
...主任工程师程莹认为,国产大模型技术在语言、视觉、多模态等领域持续突破,在文本、音频、视觉、3D等数据方面实现多模态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...客进行线路、票价等信息查询和快速购票,与此同时,多模态大模型能对站内的拥堵、异常情况进行实时判断,为相应的站内管控和车辆调度提供辅助决策和应急处置。全球首个发布并落地应用的交通行业大模型——佳都知行交...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
...“AI之眼”,通过集成麦克风、摄像头等传感器,实现多模态交互、智能讲解授课、智能导航导览三大核心功能。近期,人民网还与河南省级国资平台联合推出了首款大模型智能政务一体机,具有智能公文写作、智能知识库管理...……更多
金域医学域见医言大模型正式发布
...见医言’不依赖特定大模型底座,而是能适应各类通用多模态大模型,并支持衔接形态学、病理、基因等专业领域大模型以及医检特定场景的专用模型与工具,通过多智能体技术进行融合,可有效提升‘域见医言’的整体判读与...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款多模态睡眠状态分类模型。该...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
...汤科技等新老股东一同跟投。所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局...……更多
华藏生态共创,为大模型商业变现注入活力
...模型成果,华藏与元贝贝共创元贝贝智能婴儿床,通过多模态的数据结合人工智能和大模型的分析,不断迭代母婴健康管理服务,打通智能母婴应用场景,实现商业共赢。 经过华藏生态商业变现实践之路的积累,形成了一套高...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
2025,AI Agent还在起跑线
...,验证了大模型作为“通用认知引擎”的可能性,次年多模态大模型爆发,被视为智能体的“成人礼”,GPT-4、Gemini等模型展现的跨模态能力,让智能体初步具备人类的多感官协同。在这样的背景下,具备持续学习能力的AIAgent,...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
更多关于科技的资讯:
江南时报讯 在金融科技迅猛发展和客户需求持续升级的背景下,南通农商银行积极推动转型升级,以网点转型为核心,通过创新管理模式
2025-12-02 21:24:00
江南时报讯 近日,南通农商银行远程视频银行密码重置功能正式上线,当日即为两名客户顺利完成业务办理。这标志着该行在“远程银行”金融服务领域迈出关键一步
2025-12-02 21:24:00
迈萨科:亚太区首个生产基地落户常州,这里有着巨大的增长潜力
11月5日,迈萨科机械科技(常州)有限公司正式开业,这标志着全球工业混合技术领域的隐形冠军——德国迈萨科公司在中国市场布局迈出关键一步
2025-12-02 21:50:00
国家级赛事!薛家5家企业获奖
近日,历时3天的第十四届中国创新创业大赛合成生物与生物制造专业赛在常州正式收官。来自全国各地的44家企业与团队成功晋级
2025-12-02 22:20:00
中创新航跻身全国“百链千企”二十强
近日,在第八届中国国际进口博览会期间,“2025知识产权保护与企业国际化发展会议暨‘百链千企’专利产业化工程推进会”在上海举行
2025-12-02 22:20:00
千问APP接入万相Wan2.5,视频能力全新升级
12月2日,千问APP接入万相系列最新模型Wan2.5,视频创作能力再度升级。动作精度和肢体协调性全面提升,并成为首个支持音视频同时输出的移动端AI助手
2025-12-02 22:37:00
胶东在线12月1日讯 11月17日,在烟台金融监管分局指导下,《烟台市保险业整治“内卷式”竞争自律公约》(以下简称《公约》)正式发布
2025-12-02 19:54:00
12月2日,太重集团发布消息,由太重集团自主设计制造的6000UST(美吨)正向双动铜挤压机热试车圆满成功。这台堪称国内最大
2025-12-02 19:29:00
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00