• 我的订阅
  • 头条热搜
架构优先、先易后难,华为的制造业生成式AI方法论
...模型包括视觉大模型、自然语言大模型、预测大模型、多模态大模型、科学计算大模型等;L1行业大模型是针对汽车、生命医药、电子等行业需求特点而构建的;L2场景模型则面向细分的应用场景,比如传送带异物检测、焊点质...……更多
字节发布豆包1.5深度思考模型:“实拍级”图像生成
...型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任务方面,同样表现出色。该模型采用MoE架构,总参数为200B,激活参数是20B ,相较于业界同类...……更多
2025腾讯全球数字生态大会:腾讯云互联网行业“云+AI”全栈产品,加速行业AI应用落地
...智能体开发平台、混元大模型,到图文、语音、视频等多模态处理能力,均已形成标准化能力封装,企业可基于RAG、Workflow与Agent框架快速构建专属智能体,嵌入旅游规划、内容生成、智能客服、用户服务等业务链路,全面提升...……更多
...深耕场景。”他说,“能连接各类实时业务数据,融合多模态的内容,生成并打通原有的多媒体交互能力,成为所有流程的第一助手,这是我们对大模型在证券公司未来应用的展望。”“一项新技术是否能实现有效落地,可以从...……更多
...统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中国在AI大模型方面也已有足够竞争力。...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...服务完成备案,各类国产大模型,更是超过了200多个,多模态的大模型应用场景正在不断拓展。然而,随着大模型的快速发展,算力成本日益成为影响人工智能推广应用的重要因素,大模型产品的价格居高不下,更是长期制约着...……更多
未来医院变形记:生成式AI将病历书写从8小时缩短至25分钟
...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术,老年患者通过文本或语音与AI陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。第二,服务流程复杂,患者晕头转向。就医过程中,...……更多
星火大模型v3.5发布,带来七大能力提升
...为教师的“AI助手”。据官方介绍,星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”,教师使用粉笔在智慧黑板旁边的传统黑板上书写时,板书内容可以同步...……更多
DeepSeek大胆披露:理论利润率高达545%!
...画布功能,然而还不支持语音模式、视频和屏幕共享等多模态功能。而更令人瞠目结舌的是其API价格的飙升,GPT-4.5的API价格为每百万Tokens 75美元,这比其前一代产品GPT-4o的2.5美元上涨了整整30倍。这一价格变动引起了业界的广泛...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...中的商业周期、物理学中的电磁波,以及数学运算和逻辑推理等。因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功,但是它...……更多
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
...新研发的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“观察”和“操作”行为,协助用户高效完成各类电脑任务。GLM-PC的“深度思考”模...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
中国科技创新“乘”数直上
...火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方面的能力均显著提升。同时,讯飞还发布了星火语音大模型和开源大模型。“大模型带来了语音技术发展的全新机会。”刘聪说。让机器具备学习、推理和决策的...……更多
腾讯大模型战略全景亮相!混元大模型、知识库、智能体开发平台一应俱全,打造真正“好用的 AI”
...话AI体验。 今年以来,混元的迭代速度明显加快。在多模态生成领域,混元图像 2.0 率先实现“毫秒级”生图,混元3D v2.5凭借业界首创的稀疏3D原生架构,实现了可控性与超高清生成能力的代际飞跃。凭借技术的领先性和开放的...……更多
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
OpenAI发布最强模型o1满血版!史上最贵订阅费1450元/月
...能和准确性上相较于预览版有了显著提升,同时新增了多模态输入功能,允许用户上传图片以获得更准确的回答。OpenAI表示,满血版o1模型的“思维”速度提高了约50%,在回答困难现实问题时出现重大错误的概率减少了34%。在演...……更多
价格便宜75%!亚马逊推出全新大模型系列,3纳米自研芯片明年上市
...容。该系列包括六种型号,从纯文本模型Micro、低成本多模态模型Lite、高性能多模态模型Pro到预计于2025年第一季度推出的Premier,以及两款尚未确定发布时间的更先进模型Canvas和Reel。 据介绍,Nova 系列能够支持200种语言,Micro、L...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
在商言商无可非议!亚马逊高管:DeepSeek对客户和我们都有利
...,我们相信几乎所有大型生成式人工智能应用都将使用多模态技术,而且客户会针对不同类型的工作负载使用不同的人工智能模型。亚马逊需要尽可能提供更多领先的前沿模型供客户选择,这也是亚马逊基岩(Amazon Bedrock)服务...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...注意力表现出与视频中的运动和动态相关的中频变化;跨模态注意力是最稳定的,将文本与视频内容联系起来,类似于反映文本语义的低频信号。基于此,研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多
...、对外经贸大学发起的《面向科技保险的内生统一架构多模态大模型技术研究及应用》课题,入选北京市科学技术委员会2024年度“中央引导地方”专项金融科技方向立项课题。这是较早涉足保险多模态大模型技术研究的课题,...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...行的技术开放日上发布了其最新的“日日新SenseNova”5.0多模态大模型系列。该产品采用了混合专家(MoE)架构,并支持高达10TTokens的中英文训练数据与推理合成数据,数量达到数千亿Tokens。其推理时上下文窗口可有效达到200K左...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
...品,那么的确可能很难获得投资回报。 OpenAI将对o1进行多模态改进;在o1新范式下,预计基于图像的模型将迅猛发展。 对OpenAI最自豪的事情,是反复去做一些新的、完全未经验证的事情。 世界上很多有才的人因为他们在糟糕的...……更多
对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发
...或算力会上来。“DeepSeek只是语言大模型,接下来就是多模态。我觉得要找到有价值的、高难度的数据,这样才能产生很多有价值的知识出来。”王晓刚说。以下是对话精编:搜狐科技:商汤的世界模型“开悟”,跟杨立昆说的...……更多
国泰君安首席信息官俞枫:AI大模型驱动证券行业步入“智能认知”时代
...模型底座,“1” 是基于通用大模型,国泰君安打造了多模态垂类大模型—— 君弘灵犀大模型,并辅以 N 个场景模型协同,实现开源、闭源融合以及模型组合;二是全栈自主构建自有算力池,开展国产芯片替代,创新算力合作,...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...pMind CEO Demis Hassabis 代表 Gemini 团队正式推出了全新一代多模态大模型 Gemini,拥有「视觉」和「听觉」,还有强大的学习和推理能力。其中,Gemini Ultra 直接对标公认最强大的 GPT-4 模型,行业推测参数超万亿。更耐人寻味的是,在...……更多
更多关于科技的资讯:
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00