• 我的订阅
  • 头条热搜
智谱ai训练cogvlm2-video开源
7月12日消息,智谱AI宣布,训练了一种新的视频理解模型CogVLM2-Video,并将其开源。据介绍,当前大多数的视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的丢失,无法准确回答与时间相关的问题。一些专注于时间...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...项选择题。通过在该数据集和现有的视觉指令微调数据上训练模型,我们推出了新的视频 LMM——LLaVA-Video。实验表明,LLaVA-Video 在多个视频基准上表现出色,展示了该数据集的有效性。 论文标题:VIDEO INSTRUCTION TUNING WITH SYNTHETIC .……更多
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
...正常物理现象。为此,PhysVLM在专门整理的一套数据集上训练,包括用于评估的PhysGame benchmark、用于监督微调的PhysInstruct数据集和用于偏好对齐的PhysDPO数据集。PhysGame benchmark 设计如图所示, PhysGame包含880个含有故障现象的……更多
连发两款模型“补课”,百度AI成色如何?
...低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和多轮交互表现。这和DeepSeek-V3在Transformer框架之上,通过MLA(多头潜在注意力)降低算力成本,有着异曲同工之处。作为多模态大模型,...……更多
大模型到了该「验收」的时候
...力正在提升用户获取信息的效率。这背后,是大模型加速训练技术支撑,让模型迭代周期加快了30%;在迈瑞医疗产品的临床应用中,大模型能够让重症科医生病情应答快至5秒,大幅提升医疗效率,真正做到“从病魔的手里抢时...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP 的 PaLI 在各种多模态基...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列成果。近……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...进一步加强模型的语音推理能力。另一方面,本文所采用训练方案可有效迁移至任意语言大模型,通过增加少量参数及分阶段训练,在尽可能保留模型原始推理能力的同时,为模型加上 「听、说」的语音交互能力。 为了验证方...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户,其实...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉...……更多
AIGC工具测评:生成式AI的产品表现如何
...#26 数据来源:点点数据智普清言,由智谱AI公司在2023年训练的GLM-4语言模型,是一款基于深度学习技术的自然语言处理模型。通过学习大量文本数据,它能够理解和生成自然语言,针对用户问题和需求提供适当的答复和支持。界...……更多
生成式AI在金融行业的应用及思考
...出海日2024,生成式Ai金融应用,企业内部知识库,大模型微调训练,数据集成治理,人工智能落地工程]本文字数:2400,阅读完需:12分钟导读张呈刚先生在2024年亚马逊云科技出海日上做了题为”生成式AI在金融行业的应用及思考”的演讲。...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...差距从42.4%缩小到9.3%。 存在对齐代价:现有的对齐或后训练策略通常会降低语言模型的真实性。 SimpleQA和中文简问答的排名不同:几个专注于中文的大语言模型(Doubao-pro-32k和GLM-4-Plus)的性能接近高性能的o1-preview。特别是在...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...库、内部问答数据以及人工标注数据等金融知识进行融合训练调优,实现了全方位的金融知识理解和智能问答应用。图:ChatABC 1.0技术支撑及能力视图二、涵盖事项农业银行AI研发团队深入贯彻落实数字化转型战略,始终保持对...……更多
...话端仍由人工接听外,互联网端的问答,已经交给了经过训练后的大模型,再由人工做补充: 江门市政务服务和数据管理局副局长 梁宇 :平时说的12345是有电话端,其实我们还有一个网络端,目前我们最先上线的是在网络端,...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...开放大模型微调能力,再到针对逻辑能力改进,可个性化训练部署的「草莓」模型,一系列曝光的项目和产品,都显现着实用化的明确目的。OpenAI 研究员 Trevor Creech 的推文。大模型的领军企业似乎也把技术的落地放在了首位。...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提供稳...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。这是大模型的老毛病了。因为《黑神话》8月才上市,训练数据里没有它的相关知识。众所周知,大模型的训练和微调会消耗大量计算资源...……更多
主流文化语料库重磅上线,将为数字文化产业发展带来哪些意义?
...张中随着生成式人工智能的快速发展,高质量数据集作为训练和优化AI大模型的“养料”,已成为人工智能技术突破的核心竞争力。8月25日,山东数字文化集团(以下简称山东数文集团)与人民网共建语料库合作签约暨项目推进...……更多
腾讯云公布多项大模型产品进展
...、数据安全治理中心(API安全监测)等工具,为企业模型训练、精调、发布、运营全生命周期的数据安全保驾护航,助力企业保护敏感数据,保障数据收集安全合规。在内容安全方面,大模型生成内容经常会遇到虚假信息、内容...……更多
百度智能云升级7款大模型应用产品,让每个企业拥有新质生产力
...人力。在曦灵平台,只需5分钟的真人视频,半小时即可训练人像,录制100句话语,24小时生成专属音色库,相比真人授课成本只需过去的30%,录制效率提升20倍。在大模型的加持下,精致的3D数字人也可以通过一句话描述直接生...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...指是指在评估过程中,不考虑视频内容,仅依靠自身预先训练的知识来回答问题的大型语言模型。实验中以GPT-4为代表。它的存在可以揭示模型在多大程度上依赖于其预训练知识,而不是对视频中实际视觉信息的理解。 苏格拉...……更多
...行业专属大模型浪潮海若大模型可面向行业应用场景自主训练和微调,支持多款国产算力硬件兼容。截至目前,基于在政企多年数字化转型经验沉淀,浪潮云已面向行业研发了运维大模型、政务大模型、数据治理大模型、司法大...……更多
...路,通过智能推荐算法方案、自动扩充图像数据集、诊断训练实验结果,从而解决视觉AI应用生产过程中模型方案设计难、数据质量低、效果调优门槛高等难题。在推进大模型应用落地的过程中,百度智能云应用产品始终秉持开...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式多样,其内容质量亦呈现出...……更多
优惠力度加大!关于贵州算力券管理办法的政策问答
...策,加大了优惠力度,并探索将国产算力适配服务和模型训练服务纳入“算力券”政策的激励范围。现将有关内容解答如下。问题一:出台管理办法的背景是什么?答:一是落实国家要求的具体举措。“国发〔2022〕2号”文件将...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...量。在支持商汤自身大模型研发的同时,也支持外部客户训练大模型和应用部署。强大算力可支撑超过20多个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。之后随着ChatGPT掀起全球AI热潮,算力很快成为稀缺...……更多
2023内容科技应用典型案例:“央视听媒体大模型”发布
...专业知识为驱动,利用原创先进算法和超大规模算力进行训练,赋能视听节目创作、智能剪辑等多方面。图:央视听媒体大模型二、实现方式“央视听媒体大模型”是首个专注于视听媒体内容生产的AI大模型,集合了中央广播电...……更多
大模型如何链接产业?“联通元景”重磅发布!
...产品,分别是“海量智算集群产品”,提供多机多卡的AI训练服务;“训推一体集群产品”,实现训练和推理芯片混合部署;“分布式推理集群产品”,提供云推理、云渲染、云GPU等轻体量的弹性算力供给。中国联通基于自身禀...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00