• 我的订阅
  • 头条热搜
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
...公告,中国第一汽车股份有限公司申请一项名为“副车架模态计算有限元建模方法、装置、终端及存储介质“,公开号CN117216865A,申请日期为2023年7月。专利摘要显示,本发明属于汽车技术领域,具体的说是一种副车架模态计算...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
多模态概念持续活跃 苏州科达3连板 【多模态概念持续活跃 苏州科达3连板】财联社12月11日电,多模态概念持续活跃,苏州科达3连板,宣亚国际大涨超10%,引力传媒、力盛体育、因赛集团等跟涨。消息面上,Google Al大模型Gemini...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
科技与民生共舞,科大讯飞用AI赋能湖南教育、医疗智能化建设
...、工业知识问答、工业理解计算、工业代码生成、工业多模态5大核心能力,可贯穿企业“研产供销服管”不同环节,为企业的生产运营管理提供全流程智能化解决方案。最近,羚羊工业大模型登上了由中国科学院主管、科学出...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
理想正式启动端到端+VLM的早鸟计划:让自动驾驶成为老司机
...导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给VLM模型进行自回归推理。VLM输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统1控制车辆。VLM会时时刻刻思考当前的驾驶环境,给系...……更多
OpenAI「草莓」两周内发布?网传不是多模态,反应慢了10多秒
...图片,这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的,这似乎是「草莓」一个明显缺点。大家比较关心的还有定价问题。「草莓」的定价可能与 OpenAI 的聊天机器人不同,后者有...……更多
创新典范:联通元景大模型再获三项殊荣
...”创作平台。“中华器灵”可充分发挥联通元景大模型多模态、语义理解和推理能力,构建高质量文本语义表征,以不同历史朝代文物为原型与基本素材,着力挖掘文物元素及艺术特质,实现文创设计辅助。同时还能够准确理解提示...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
...处理得十分优秀,极大地提升了真实感。Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。 ……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
王一刚:深耕技术产品,助力媒体融合
...中科闻歌雅意大模型在媒体领域的应用研究主要集中在多模态内容理解、关键信息提取、事件脉络分析、多模态内容生成和内容审校等方面,展现了在媒体领域的广阔应用前景。从业务视角来看,大模型可以在选题决策、辅助创...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...,其架构如下图所示:CogSound的核心技术依托于GLM-4V的多模态理解能力,能够精确解析视频中的语义和情感,并生成匹配的音效。例如,在展示森林景观的视频中,CogSound能够生成鸟鸣和风吹树叶的声音;而在城市街景中,则会...……更多
小米开启“小爱同学多模态功能内测”
3月15日消息,小米现已开启“小爱同学多模态功能内测”,拥有以下机型的用户可以在3月23日之前申请报名,将从3月18日到4月15日推送内测:XiaomiMIXFold3XiaomiMIXFold2XiaomiMIX4Xiaomi14系列(含14/14Pro/14Ultra)Xiaomi13系列(含……更多
中银协:已有11家银行客服中心与远程银行实现了虚拟数字人应用落地
...染等技术投入,全面提升虚拟数字人视、触、听、说等多模态感知交互能力。在运维管理方面:一是建设虚拟数字人应用管理平台,构建前、中、后台协同的数字化服务管理体系;二是强化客户体验及风险管理,增强客户需求洞...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
原钉钉副总裁创业杀入AI Agent赛道,获亿元融资 | 36氪独家
...erYeah“AI客服”配置到所有微信服务群,7*24小时拟人化多模态交互,响应用户问题,问题解决率提升150%;还有一家独角兽企业,借此解决获客、销售Copilot、销售人员管理等问题。“我们主要聚焦销售、客服、营销场景,助力企...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能...……更多
...的前沿技术研究,打造和提升高质量、国际领先水平的多模态交通大模型技术能力,高标准打造人工智能应用场景,全面开展人工智能产品应用创新生态建设,致力于将人工智能前沿技术成果广泛应用于智慧交通、车路协同、自...……更多
更多关于科技的资讯:
沐曦发布首款全国产通用GPU芯片“中国芯”,浦口造□南京日报/紫金山新闻记者肖凡 通讯员吴晓倩IP设计、晶圆制造、封装测试全流程国内生产
2025-10-23 07:46:00
10月22日从中北大学获悉,第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛日前在全国各地拉开帷幕
2025-10-23 07:49:00
聚焦雄安新区|首颗“雄安造”卫星完成生产下线
雄安新区空天信息产业从布局迈向实质性产出阶段首颗“雄安造”卫星完成生产下线河北日报讯(记者解丽达、曹铮 见习记者李畅)10月22日
2025-10-23 07:55:00
10月22日,安平国际会展中心。当天开幕的第25届中国·安平国际丝网博览会,用满场的“智造”活力,改写着人们对丝网的老印象
2025-10-23 07:59:00
试水市场化,VR博览会迸发新活力
会展作为经济发展的“晴雨表”和“风向标”,不仅是经济发展的助推器,更是展示经济活力的重要窗口。如今,世界VR产业大会成为南昌乃至江西的一张名片
2025-10-23 06:29:00
AI赋能医院病案内涵质量提升
鲁网10月22日讯(记者 魏萱)为深入推进健康中国建设,进一步深化医药卫生体制改革,全面提升医疗质量安全水平,建设有特色的医疗质量管理体系
2025-10-22 14:27:00
胡海建眼中的“末端决胜论”,跨越速运陆运体系如何做到“快、准、稳”?
在跨越速运的“陆空协同”运力体系中,陆运网络是连接航空枢纽与客户的关键环节。董事长胡海建深知,末端服务的“最后一公里”直接影响客户体验
2025-10-22 14:37:00
布蕾克咖啡携\
近日,布蕾克咖啡携新品「云南有机瑰夏礼盒」等多款咖啡产品登陆高端超市品牌Ole'精品超市,通过优质渠道将高品质咖啡呈现给广大咖啡爱好者
2025-10-22 14:37:00
AI驱动 数据赋能丨浪潮云领跑中国城市可信数据空间市场
近日,艾瑞咨询正式发布《2025年中国城市可信数据空间行业研究报告》,从城市可信数据空间的发展驱动因素和核心价值出发,对其总体架构
2025-10-22 17:06:00
AI赋能行业高质量发展,浪潮软件集团携线缆AI智能装备亮相华北电线电缆工业展
10月16日至18日,2025第三届华北(宁晋)电线电缆工业及材料设备展览会在河北宁晋成功举办。宁晋被誉为“中国电线电缆之乡”
2025-10-22 17:07:00
智慧兴港,科技领航:浪潮赋能港航数智化实践
近年来,我国高度重视信息化建设,先后出台多个指导意见,明确提出推动港航系统数字化转型智能化升级。在政策引领与技术创新双轮驱动下
2025-10-22 17:07:00
华为鸿蒙操作系统 6支持与Mac电脑及iPhone互传文件
10月22日14:30,华为正式推出鸿蒙操作系统6(HarmonyOS 6)。这意味着,“纯血鸿蒙”在经历“鸿蒙星河版”
2025-10-22 17:07:00
汕头企业深耕“一带一路” 艾德文制衣携转型新品再拓中东市场
2025年海湾地区国际B2B时尚贸易采购展(20周年特别版)即将开幕,这场聚焦全球时尚供应链对接的行业盛会将于11月17日-19日在迪拜世界贸易中心6号
2025-10-22 17:09:00
2025六大麦角硫因品牌榜单更新,成分筛查 + 安全适配性硬核对比
当《Nature》2024年特刊将麦角硫因(EGT)定义为 “21 世纪最具颠覆性的抗衰成分”,新加坡国立大学医院、美国国立衰老研究院等权威机构的临床数据进一步证实
2025-10-22 17:12:00
DCF智能商城:信息透明,让选择变得轻松
在信息越来越快的时代,DCF智能商城做了一件看似简单却非常重要的事——让商户和消费者之间的距离更近,让每一次交易都更有温度
2025-10-22 17:13:00