• 我的订阅
  • 头条热搜
arxiv研究人员:多模态ai模型存在安全隐患
...印象、争议性话题以及非法活动和犯罪等9个安全领域。研究人员说,大型视觉语言模型(LVLM)在接收多模态输入时很难识别SIUO类型的安全问题,在提供安全响应方面也遇到困难。在接受测试的15个LVLM中,只有GPT-4v(53.29%)、GPT...……更多
赋予人工智能更多温度
...据驱动的服务对象精准认知与最优决策技术,以及基于多模态的机器人主动服务与精准交互技术这三大核心技术,链接了物联网、精准服务分析、深度学习计算三大云端平台,实现了‘云、边、端’技术一体化和行业应用的深度...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...来源何处? 近日,来自清华、北航、上交和瑞莱智慧的研究人员联合撰写百页长文,发布名为MultiTrust的综合基准,首次从多个维度和视角全面评估了主流多模态大模型的可信度,展示了其中多个潜在安全风险,启发多模态大模...……更多
公路水路交通基础设施数字化转型升级,卓视智通准备好了
...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发,并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地,公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...似,但GPT-4o mini 模型的健壮性与GPT-4o相比,健壮性较差。研究人员中还探讨了 OCR 提示和思想链 (CoT) 推理的影响,结果发现 OCR 提示的影响很小,而 CoT 通常可以提高性能。MMMU-Pro:更健壮的MMMU重新审视MMMU基准测试大规模多学科...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...11402项目主页:https://nvlm-project.github.io/在模型设计方面,研究人员对纯解码器多模态大模型(如LLaVA)和基于交叉注意力的模型(如Flamingo)进行了全面对比,并根据总结出的优势和劣势,提出了一种全新架构,提升了模型的训...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...开源 7B 模型之外,该团队同样也开源了 1.3B 的小模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...该团队以将「Align Anything」框架进行开源。通过该框架,研究人员不但可以利用该框架进行多模态模型的对齐实验,提高模型的训练和评估效率,还可以用该框架微调各种大模型,提升在特定任务上的表现。该框架的推出,对探...……更多
苹果公司公布“mm1”多模态大模型
...已有多模态基准上监督微调后也能保持有竞争力的性能。研究人员对“MM1”模型进行了测试,号称MM1-3B-Chat和MM1-7B-Chat优于市面上绝大多数相同规模的模型。MM1-3B-Chat和MM1-7B-Chat在VQAv2、TextVQA、ScienceQA、MMBench、MMMU和M……更多
...型的计算效率。SmartTrim框架结构图在训练SmartTrim模型时,研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧,解决了不可导二值mask的问题,实现了模型的端到端训练。此外,自蒸馏和课...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...非易事。为解决以上问题,来自南洋理工大学 LMMs-Lab 的研究人员联合开源了 LMMs-Eval,这是一个专为多模态大型模型设计的评估框架,为多模态模型(LMMs)的评测提供了一站式、高效的解决方案。代码仓库: https://github.com/EvolvingL...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...”刘山松表示。在调研和确定研究现状和研究目标之后,研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器,来分别处理音乐、图像和视频输入。接着,将编码器的输出引入所选用的 LLaMA2 开源大模型,让其能够理解、处理多模...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...内容可溯源的能力。目前主要针对图片、音频和视频等多模态内容,采用隐式水印方法建立互认机制。文本内容上的实现仍有一定技术难度,后续将持续有针对性地突破。 此外,计划将通过AI保险机制,为相关人员和单位给予...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的医疗保健专用人工智能模型MedLM,旨在帮助临床医生和研究人员进行复杂的研究、总结医患互动等。此举标志着谷歌将医疗保健行业人工智能工具货币化的最新尝试。MedLM套件包括一个大型和中型AI模型,均基于Med-PaLM 2构建。Me...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...投资机会:对产业界AI的发展而言,数据质量的优化、AI研究人员的储备与计算能力将是未来能否走在AI应用前沿的核心能力。AI产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI产业有望继续保持“芯片+算力基础...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...客进行线路、票价等信息查询和快速购票,与此同时,多模态大模型能对站内的拥堵、异常情况进行实时判断,为相应的站内管控和车辆调度提供辅助决策和应急处置。全球首个发布并落地应用的交通行业大模型——佳都知行交...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...室多智能体与具身智能研究所联合中山大学 HCP 实验室的研究人员,对具身智能的最新进展进行了全面解析,推出了多模态大模型时代的全球首篇具身智能综述。该综述调研了近 400 篇文献,从多个维度对具身智能的研究进行了...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热门研究方向。实现类似 GPT4o 实时语音交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...和开发,发布了一系列开源工具和研究成果,为行业内的研究人员提供了宝贵的资源。随着技术的不断突破,OpenAI在多个领域都取得了显著的成果,其中包括自然语言处理、计算机视觉、强化学习等。在发展过程中,OpenAI也遇到...……更多
千亿级神经元数字孪生脑平台在沪发布,为治疗抑郁症等打开思路
...器人领域发布了全球首个具备动态双目立体视觉和视听多模态控制的机器头脑,满足机器在未知环境下自主移动及人机协作应用需求。千亿级神经元数字孪生脑平台以复杂的人脑为原型,实现了人脑全尺度千亿级神经元功能的精...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...模态大型语言模型(MLMM)在近年了引起了很大的关注。研究人员正在积极探索将视觉编码器与LLM集成的有效方法。一些方法,如Flamingo、BLIP-2、MiniGPT4和Qwen-VL和LLaVA等已经取得了这些成就,但由于处理分辨率有限,以前的多模态...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...种直观简洁的方式来识别不同学术领域中的领先模型,使研究人员和开发者更容易理解不同模型的优势和劣势。细粒度评估:研究团队还基于不同学科、不同模态、不同语言以及不同类型的逻辑和视觉推理能力进行基于准确性的...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅...……更多
更多关于科技的资讯:
AMD锐龙9000X3D缓存改为CCD之下:散热更佳、频率更高
快科技10月27日消息,AMD早就说锐龙9000X3D系列会带来真正的第二代3D缓存技术,那么到底有什么革命性的变化呢
2024-10-27 17:59:00
黄河流域最大水电站关键进展:转子吊装完成!
快科技10月27日消息,据报道,黄河流域中海拔最高且在建装机容量雄踞榜首的玛尔挡水电站,其标志性1号机组已成功完成转子吊装作业
2024-10-27 17:59:00
丰田传奇车型AE86重新复活:换装氢能源发动机
快科技10月27日消息,日前,丰田传奇车型AE86 H2 Concept在现代汽车与丰田汽车联合举办的“赛道嘉年华”中亮相
2024-10-27 18:29:00
轿车操控 SUV空间!全新进口奥迪A6大探险家版上市:起售价51.89万元
快科技10月27日消息,2024款新奥迪A6 Avant和Allroad大探险家版车型正式上市,售价分别为51.89万元和61
2024-10-27 18:29:00
Thermaltake发布CT 200系列风扇:无光/ARGB可选 线缆菊花链设计
快科技10月27日消息,Thermaltake自豪地推出了其最新一代的PWM风扇——CT 200系列,该系列精心设计了无光版与ARGB版
2024-10-27 18:59:00
天空:英超计划召开股东会议,讨论与EFL达成财务分配协议新提
10月26日讯天空体育报道,英超联赛计划于11月22日召开股东会议,讨论与EFL(英格兰足球联赛体系)达成新的财务分配协议提案
2024-10-27 19:01:00
一加13将于10月31日发布:搭载超级信号工程2.0
10月26日消息,一加13手机将于10月31日16:00发布,官方预热显示该机搭载超级信号工程2.0,对蓝牙、网络、信号等进行了优化
2024-10-27 19:11:00
匠心精耕二十年,爱可丁推出HMOs儿童奶粉,以强大创新力刷新
回首过往20年,中国奶粉市场风云变幻,发生了不少大事,安全、品牌、配方等相继成为消费者关注的焦点;国家监管政策频出,宏观调控
2024-10-27 19:53:00
辉山奶粉品牌力获权威认证,携十余项大奖载誉前行
岁末年终,各大奶粉品牌纷纷打响了年度营销收官之战。其中,营销声量贯穿2022年度的国民品牌辉山奶粉,近日来先后斩获人民网第十七届人民企业社会责任奖“年度案例奖”
2024-10-27 20:03:00
首届成人夜校行业论坛在西安成功举办,AI助力创新项目解决就业
2024年8月14日,由行人派夜校发起,首届成人夜校行业论坛在西安圆满落幕,多位省、市、高校、协会领导和全国各地的创业大咖齐聚一堂
2024-10-27 20:07:00
小明是位资深设计师,工作需要经常下载各种素材,从字体到图片,从模型到视频,都需要在浩瀚的网络资源中寻找。以往,他都是通过各种搜索
2024-10-27 20:10:00
北京有一趟仅仅4节车厢的粉色动车:周末特别火
秋高气爽,赏秋好时节。如果你身在北京,建议体验一下穿梭在北京怀柔与密云之间的“怀密号”,它使用的是CRH6F-A型电力动车组
2024-10-27 20:29:00
真的要涨价!小米15内存起步就有12GB
10月29日周二晚上19点,小米将举办小米15系列暨小米澎湃OS 2新品发布会,堪称又一次科技届的“春晚”,雷军也提前回答了有关此次发布会大家最关心的几个问题
2024-10-27 20:29:00
国际领先!我国750千伏电缆系统顺利通过鉴定
快科技10月27日消息,据报道,中国三峡建工(集团)有限公司——隶属于三峡集团,携手青岛汉缆股份有限公司、长缆科技集团股份有限公司及中国电力科学研究院有限公司等顶尖企业
2024-10-27 21:29:00
内存超频疯了!芝奇、金士顿双双超过12GHz
快科技10月27日消息,随着酷睿Ultra 200K系列的发布、CUDIMM DDR5的陆续登场,内存超频再次迎来一波高潮
2024-10-27 21:29:00