• 我的订阅
  • 头条热搜
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
大华股份亮相全球智慧城市大会
...,为城市安全运行筑牢技术根基。城市精细治理 打造多模态智能监测体系为推动城市治理从被动应对向主动预判转型,大华搭建智能多模态城市监测框架,整合城市管理、应急响应、环境监测、安全监管四大核心模块,通过文...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
建好AI训练“优质数据粮仓”|贵阳大数据交易所发布939个高质量数据集
...多样性和系统性——涵盖文字、音频、图片、视频等多种模态,以及TTS(文本转语音)、OCR(光学字符识别)等跨模态数据,使模型能够学习更复杂的语义关联,显著提升多轮对话、图像生成等任务的准确性,构建的“预训练集...……更多
推动数智+大健康产业深度融合 又一研发总部落子长沙天心经开区
...会现场。单位供图活动现场发布了最新的深思考Dongni.ai多模态搜索引擎、智能终端(AI PC Suite、AI 摄像头、AI 显微镜)、重大疾病早期筛查等重磅产品,并宣布深思考人工智能机器人科技有限公司研发总部正式落户天心经开区。...……更多
多模态能力的进化,是AI眼镜成为生活必需品的关键
AI 浪潮下,多模态能力成为 AI 领域,特别是 AI 眼镜行业的高频热词。不少专家坚信,这项技术是突破单一交互局限的关键,有望重塑 AI 眼镜的使用体验。所谓多模态能力,即整合视觉、听觉、语言、触觉等多维度感官数据,...……更多
一文看懂AI结果优化(AIRO)和生成引擎优化(GEO)的区别
...索引擎抓取)和“LLMs友好”(适配大模型语义解析)。(3)跨模态适配:针对文本、图像、视频等生成引擎制定差异化策略(如优化Midjourney提示词以关联品牌视觉风格)。三、应用场景与典型案例1.AIRO的典型场景消费决策引导:用户通过智...……更多
江苏南京:创新不靠单打独斗 合力构筑生态优势
...10项技术需求,涉及自主意识与情感反应数字人系统、多模态融合智能处理框架、直播数字人的音频驱动口型、多模态智能人机交互的语义关联信息融合技术等。“每一项都是我们一线最迫切的需求。如今,已经有一半都对接解...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...座赋能座舱的交互逻辑,使其在车载语音交互领域成为多模态感知、类人推理与群体协同的车载AI中枢,成为用户更人性化、更主动的智能出行伙伴。一、天琴语音助手系统架构:技术支柱+端侧部署天琴语音助手 8.0 以“空间智能、...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通
...快科技3月27日消息,阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
...学学术大会(CCR 2024)上,依托“影像+文本”双AI引擎,多模态AI智慧解决方案引起多方关注。深睿医疗在大会上发布的多模态骨肌疾病智慧解决方案,突破了传统单个AI辅助诊断产品的局限,实现了基于CT、MR和X光等多种影像设备...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
如何让AI精确识别讽刺语言?新多模态算法应运而生
...义,来自荷兰格罗宁根大学的一个研究小组推出了一种多模态算法,这套算法能够提升AI理解讽刺语句的含义。以往AI技术检测语言内容是否具有讽刺含义时,只会基于单个参数进行识别,但如今研究表明这样的算法并不可靠,...……更多
软通智慧数智成果发布暨战略合作签约仪式举行
...算力灵畅服务体系、卧龙策渊人工智能平台,以及基于多模态感知的多元共治产品体系。活动现场。软通智慧供图正式发布“AI算力灵畅服务体系”,助力算力从“可用”走向“好用”,为人工智能产业区域发展带来全新解决方...……更多
贵州大数据企业为130万家用户提供AI营销方案
...能体,是一枝梅与成都任我行软件股份公司共同开发的多模态大模型应用。“依托于完全自研、有自主知识产权的Drawing多模态大模型,一个管家婆智能体相当于为企业提供3位精通文秘、美工、视频的新媒体营销‘数字员工’,...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
“沪企通”政策大模型亮相2025世界人工智能大会,数喆数据联合上海数据集团打造AI政务新标杆
...程指引、材料清单,让政策申报实现“掌上速办”。 多模态识别智能体:通过多模态图像识别技术,识别申报表单、政策文本,补全用户意图并匹配政策。依托多模态图像识别技术(覆盖表单照片、模糊政策图片等复杂场景)...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
更多关于科技的资讯:
关育兵近日,抖音博主“@爱吃蛋”凭借精确到秒的煮蛋教程,8天时间涨粉356万,被称为“蛋神”“煮蛋仙人”。最初,一名抖音用户分享“爸爸做出的完美水煮蛋”
2025-12-15 11:25:00
部分热门款式甚至卖断货 雪具市场迎“冬”风 国货订单激增
商报讯 随着入冬滑雪季的开启,多家雪场已经陆续“开板”迎客,滑雪装备市场也在悄然升温。国产雪具品牌凭借高性价比、差异化的设计及国潮元素融合等优势
2025-12-15 11:36:00
能源行业最大年度演讲在青岛举办 解码能源行业发展新趋势
12月10日至12日,“进化的能源·马一峰年度演讲2026”暨第21期综合能碳培训资源链接大会在青岛举行。作为能源行业最大的年度演讲和极具影响力的生态盛会
2025-12-15 11:55:00
厦门网讯(厦门日报记者 林露虹)厦门企业海辰储能聚焦长时储能,推出三大突破性的创新解决方案,以破解新能源消纳难题,满足AIDC(人工智能数据中心)能源转型需要
2025-12-15 08:58:00
“眼”观未来“镜”显风采 厦门眼镜产业发力新赛道
连续多年举办的厦门眼镜展。(厦门日报记者 王元晖 摄)艾普光学生产线。(资料图/厦门日报记者 林铭鸿 摄)嘉宾在厦门眼镜展上体验智能眼镜
2025-12-15 08:58:00
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知当AI成为信息分发的核心枢纽,企业却陷入前所未有的传播困境
2025-12-15 09:25:00
影视AI赛道再添强援 长江电影智象未来联合实验室挂牌 打开商业化想象空间
2025年12月11日,湖北长江电影集团与智象未来在武汉正式揭牌成立“长江电影智象未来影视AI联合实验室”,双方同步签订战略合作协议
2025-12-15 09:55:00
从古典中读懂未来:一位小提琴演奏者的“琴弓革命”
在不少人眼中,王辰翔的成长轨迹几乎是古典音乐领域的“标准答案”:四岁半拿起小提琴,少年时期便师从名家;先后进入中央音乐学院附小
2025-12-15 10:25:00
山东移动阳谷分公司助力酒店实现数字化升级
鲁网12月12日讯近日,山东移动阳谷分公司为汉庭酒店西汉庄店量身打造一体化通信解决方案,全面赋能酒店数字化转型升级。通过精准对接酒店在网络带宽
2025-12-15 09:49:00
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00