• 我的订阅
  • 头条热搜
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功能上展...……更多
...学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质量语料...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...缺对文字背后的文化内涵以及家国情怀的理解。面对历史地理综合题时,模型并不能像人类考生一样有效识别学科属性。相较于简单的英语题,模型反而更擅长复杂的英语题。解理科题目时,模型会出现以超出年级知识范围外的...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
杀疯了!1分钟完成100页PPT,天工AI人工智能速成法!
...工AI软件,自研4千亿级参数MoE混合专家模型【全球首个多模态“超级模型”(SuperModel)】。网页端tiangong.cn,app天工,小程序天工AI智能助手,任君挑选!该说不说,目前国内各类AI都是子chatGPT爆火后的跟风套壳,国内具备自研...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
...益课程内容,为居民提供了更加便捷的生活服务。它通过地理定位技术,让成都市民可以一键找到离自己最近的图书馆、健身房、影音室等公共设施。无论身在何处,只需打开小程序,即可轻松查找周边提供各类服务的群团分中...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...中包含不可复现的论文。 CORE-Bench的优势能力要求高、多模态(Skills and modalities)解决CORE-Bench中的任务需要多种能力,包括理解指令、调试代码、检索以及跨学科解释结果,模型只有具备这些技能才能在CORE-Bench上拿到更高分数...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...其在传统学科知识上的深度(数学、物理、生物、化学、地理等顶级竞赛),还要在模型间的认知推理能力上展开较量。 近日,同样是研究团队,首次提出使用\"奥林匹克竞赛奖牌榜\"的方法,根据各AI模型在奥林匹克竞技场(...……更多
更多关于科技的资讯:
荣耀平板v9正式开售:搭载联发科8350处理器
12月16日晚,荣耀正式发布荣耀平板V9。12月24日,CNMO注意到,据荣耀官方消息,荣耀平板V9正式开售时间为今日早上10点08分
2024-12-25 16:43:00
“树人托管惊爆招商新政策,千万别错过这波机遇!“
在当前经济波动和服务业不断深入发展的大背景下,家庭服务业的细分行业——中小学生校外托管行业也面临前所未有的发展机遇,受到广泛的关注
2024-12-25 16:45:00
通讯员 李国秀 王俊菲走进山东厚丰汽车散热器有限公司的研发基地,精密的仪器彰显着高端的科技,其中整车环境模拟实验室可以将环境温度保持在-40℃—60℃的范围内进行试验
2024-12-25 16:54:00
小米官宣:与蔚来、小鹏、理想合作
12月25日,小米汽车通过官方微博宣布,正式与蔚来汽车、小鹏汽车、理想汽车展开充电补能网络合作。此次合作旨在为用户提供更高效便捷的充电服务
2024-12-25 16:55:00
拼多多代运营领域靠谱的代运营团队,电商代运营公司十大排名
在拼多多这个竞争超级激烈的电商平台里混,商家们的日子可不容易。流量就那么多,大家都在抢,想多卖点货、多赚点钱,简直难如登天
2024-12-25 17:10:00
2024“星鲨杯”全球虚拟现实内容大赛颁奖典礼暨《虚拟/增强现实内容制作流程规范》国家标准系列宣贯活动在京举行
中国消费者报北京讯(记者董芳忠)由虚拟现实内容制作中心、星鲨科技集团有限公司主办,青岛星鲨虚拟现实技术研究院协办的2024“星鲨杯”全球虚拟现实内容大赛颁奖典礼于近日在北京举行
2024-12-25 17:46:00
发展新质生产力看山西国企:山西省首个数字孪生隧道全息感知平台正式上线
近日,山西交控交科集团智研院公司研发的山西省首个数字孪生隧道全息感知平台正式上线,并在大南山隧道管理站正式投入使用。此平台是基于数字时空底座能力
2024-12-25 17:47:00
让顺风车用户再次同行更便捷 嘀嗒出行上线顺风车“再次同行邀请”功能
顺风出行,如何更方便地与同行过的同路人再次同行呢?近日,嘀嗒出行推出全新的再次“同行邀请“功能,让曾同行过的车主乘客,下次同行更方便
2024-12-25 17:48:00
嘉桦白桦树汁品牌践行人与自然和谐共生
12月18日,第七届界面财经年会在上海举行,嘉桦白桦树汁品牌凭借其卓越的创新能力和可持续发展实践,荣膺年度臻善企业奖,彰显了品牌在行业内的领先地位与社会责任感
2024-12-25 17:49:00
临沂:企业开足马力赶订单 奋力冲刺“全年红”
冲刺四季度,打好收官战。连日来,临沂市各企业纷纷按下生产“快进键”,开足马力赶订单,奋力夺取“全年红”。
2024-12-25 17:49:00
“潮好玩冰雪季”圆满收官,耕升带你回顾趣味瞬间!
“潮好玩冰雪季”已于2024年12月22日在吉林圆满收官!为了让众多游戏迷和科技爱好者积极参与到这次盛大的活动中,耕升上演一场科技与冰雪的激情碰撞
2024-12-25 17:58:00
中新经纬12月25日电 据工信部官网25日消息,近日,工业和信息化部、国务院国有资产监督管理委员会及中华全国工商业联合会联合印发《制造业企业数字化转型实施指南》(以下简称“《指南》”)
2024-12-25 17:58:00
华商网获评2024年搜狐网年度合作伙伴
2024年,媒体机构创作者们依旧积极活跃在搜狐平台上,持续追踪热点新闻、深度剖析社会现象。以其独特的视角和力量,跨越时空界限
2024-12-25 18:08:00
未来已来,华科尔推出量产级车载无人机WK-AC20MINI
在汽车上配备无人机,一直是汽车行业的宏大梦想之一。如今,梦想照进现实,作为全球主流的无人机制造商,华科尔推出全新的微型车载无人机场WK-AC20MINI
2024-12-25 18:26:00
京东客服再加薪!月固定工资大幅提升,全员平均涨薪2个月
12月25日,京东集团宣布,再次升级客服人员薪酬福利。超2万名京东客服月固定工资将大幅提升,提高收入的保障性和稳定性,实现全员平均涨薪2个月
2024-12-25 18:28:00