• 我的订阅
  • 头条热搜
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功能上展...……更多
...学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质量语料...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...缺对文字背后的文化内涵以及家国情怀的理解。面对历史地理综合题时,模型并不能像人类考生一样有效识别学科属性。相较于简单的英语题,模型反而更擅长复杂的英语题。解理科题目时,模型会出现以超出年级知识范围外的...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
永中智能办公软件亮相贵阳数博会,边摸鱼边干活的日子要来了
...秒速生成文字作品,还能自动完成表格数据计算、可视化图表及简报制作。在本届数博会上,技术人员现场展示了永中智能办公软件的各项能力,其对用户指令的响应速度与最终生成的效果,令参展嘉宾与在场媒体啧啧称奇。一...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
杀疯了!1分钟完成100页PPT,天工AI人工智能速成法!
...工AI软件,自研4千亿级参数MoE混合专家模型【全球首个多模态“超级模型”(SuperModel)】。网页端tiangong.cn,app天工,小程序天工AI智能助手,任君挑选!该说不说,目前国内各类AI都是子chatGPT爆火后的跟风套壳,国内具备自研...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
...益课程内容,为居民提供了更加便捷的生活服务。它通过地理定位技术,让成都市民可以一键找到离自己最近的图书馆、健身房、影音室等公共设施。无论身在何处,只需打开小程序,即可轻松查找周边提供各类服务的群团分中...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
更多关于科技的资讯:
鸿蒙智行再交成绩单!问界M8破3.6万台 全新M9破1.8万台
快科技3月7日消息,鸿蒙智行公布了问界M8和2025款问界M9的36小时小订“成绩单”。其中,问界M8小订量突破3.6万台
2025-03-08 00:15:00
站雷军背后的海尔总裁周云杰走红:可爱表情被网友拍下
3月7日消息,据媒体报道,在代表通道上,小米创始人、董事长兼首席执行官雷军人气高涨,人群中不停响起“雷总好”,雷军多次微笑挥手回应
2025-03-08 00:15:00
本文转自:人民日报3月5日,习近平总书记在参加江苏代表团审议时指出,科技创新和产业创新,是发展新质生产力的基本路径。政府工作报告提出
2025-03-08 06:26:00
谷雨  自研美白原料极光甘草  打造优质国货护肤品牌
本文转自:人民日报在化妆品行业蓬勃发展的浪潮中,在消费者对美白产品的需求日益增长的趋势中,美白护肤品已成为行业的重要细分赛道
2025-03-08 06:29:00
国补真香!平板销额上涨21% 手表/手环暴涨51%
快科技3月7日消息,今年1月20日,手机、平板等数码产品国家补贴在全国各地陆续上线,极大的带动了国内市场。根据洛图科技(RUNTO)数据显示
2025-03-08 07:15:00
酵母菌:微生物世界里手握核武的超级杀手
如果我们把水果或者谷物密封起来,那么过一段时间,我们再打开时就会闻到酒的清香,这是因为酵母菌将糖转化成了酒精和二氧化碳
2025-03-08 07:45:00
2025全国两会天津北方网讯:上线7天,能聊天、会推理的“DeepSeek”下载量已经破亿,当全球科技圈还在为它狂欢时
2025-03-08 08:03:00
家家悦济南环宇城店焕新亮相,品质消费生活圈引领新风尚
为积极响应山东省委、省政府的提振消费号召,家家悦集团以创新服务为核心驱动力,对济南中海环宇城店进行了全面而深入的升级改造
2025-03-07 21:22:00
可在室内外“无感”补电 全球首款钙钛矿太阳能充电手机发布
本文转自:人民日报客户端记者从京东方科技集团获悉:在西班牙巴塞罗那举行的世界移动通信大会上,传音旗下品牌Infinix发布全球首款应用了京东方钙钛矿光伏技术的太阳能充电手机
2025-03-07 21:25:00
依肤婗:匠心研发,打造肌肤焕变奇迹
近日,专业护肤品牌依肤婗(YIFUNI)推出"凝润舒颜套"系列新品,秉承"焕变赋能,宛若新生"的品牌理念,引发业内广泛关注
2025-03-07 21:26:00
依肤婗焕颜精华液:开启肌肤焕变奇迹之旅
广州讯-知名专业护肤品牌依肤婗(YIFUNI)日前隆重发布全新"焕颜精华液",引领护肤新趋势。该产品凭借创新配方和显著功效
2025-03-07 21:26:00
干货分享!2025英国国际美博会(GBE. UK 2025)参展全攻略
大家好,我是一名在美业摸爬滚打多年,专注拓展海外市场的市场经理。这几年外贸形势愈发严峻,竞争激烈程度堪称“内卷大战”。但今年我发现了一个绝佳机会——2025英国国际美博会(GBE
2025-03-07 21:27:00
政通智合·数聚泉城 共创政务AI新场景山东移动DeepSeek政务场景共创沙龙成功举办
3月7日,山东移动与华为联合举办DeepSeek政务场景共创沙龙。本次沙龙以“政通智合·数聚泉城 共创政务AI新场景”为主题
2025-03-07 21:36:00
REDMI K80至尊版看点汇总:这配置又要卖爆了
最近,REDMI宣布了K80系列上市100天的好成绩,销量突破了360万台!不仅如此,为了庆祝这个历史性时刻,REDMI团队还收到了来自高通的蛋糕
2025-03-07 22:45:00
赛分科技(688758)是行业内少数同时具备分析色谱及工业纯化领域研发及规模化大生产能力的企业,分析色谱领域技术达到国内领先水平
2025-03-07 22:45:00