模态,研究人员,隐患,模型,人员,安全头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

arxiv研究人员：多模态ai模型存在安全隐患

...印象、争议性话题以及非法活动和犯罪等9个安全领域。研究人员说，大型视觉语言模型（LVLM）在接收多模态输入时很难识别SIUO类型的安全问题，在提供安全响应方面也遇到困难。在接受测试的15个LVLM中，只有GPT-4v（53.29%）、GPT...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

赋予人工智能更多温度

...据驱动的服务对象精准认知与最优决策技术，以及基于多模态的机器人主动服务与精准交互技术这三大核心技术，链接了物联网、精准服务分析、深度学习计算三大云端平台，实现了‘云、边、端’技术一体化和行业应用的深度...……更多

2023-11-24 06:27:00人工智能,人工,温度,智能,更多,智能

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...来源何处？近日，来自清华、北航、上交和瑞莱智慧的研究人员联合撰写百页长文，发布名为MultiTrust的综合基准，首次从多个维度和视角全面评估了主流多模态大模型的可信度，展示了其中多个潜在安全风险，启发多模态大模...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...和文本来混合：[TEXT]the cat [SPEECH][Hu3][Hu7]..[Hu200][TEXT]the mat研究人员认为，交错训练可以帮助模型学习语音和文本之间的对应关系，从而实现更好的文本到语音的转换；在每个训练步骤中，句子中的语音和文本部分是随机采样的。...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

公路水路交通基础设施数字化转型升级，卓视智通准备好了

...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发，并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地，公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多

2024-05-22 12:00:00智通,水路,基础设施,设施,公路,准备

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」（object pointer memory）的位置编码...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

北京人工智能数据运营平台发布

...大量通用数据、行业数据，支持文本、图像、视频等多种模态，并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练，同时，4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...似，但GPT-4o mini 模型的健壮性与GPT-4o相比，健壮性较差。研究人员中还探讨了 OCR 提示和思想链 (CoT) 推理的影响，结果发现 OCR 提示的影响很小，而 CoT 通常可以提高性能。MMMU-Pro：更健壮的MMMU重新审视MMMU基准测试大规模多学科...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...11402项目主页：https://nvlm-project.github.io/在模型设计方面，研究人员对纯解码器多模态大模型（如LLaVA）和基于交叉注意力的模型（如Flamingo）进行了全面对比，并根据总结出的优势和劣势，提出了一种全新架构，提升了模型的训...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

国网浙江电力探索“AI+电力”增量价值

...型，以及能融合多类型数据从而更全面理解电力系统的多模态大模型。在杨洋看来，电力行业的核心数据是时间序列、拓扑图等结构化数据。“可能未来1到2年之内，面向结构化数据的通用大模型，很快就会出来。大语言模型和...……更多

2025-05-09 19:06:00电力,增量,浙江,价值,人工智能,智能

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器（ViT）模型与对比性预训练的模型（SigLIP）进行了比较，结果发现，PaLI-3 虽然在标准图像分类基准上略微表现不佳，但基于 SigLIP...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...开源 7B 模型之外，该团队同样也开源了 1.3B 的小模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

全模态对齐框架align-anything来啦：实现跨模态指

...该团队以将「Align Anything」框架进行开源。通过该框架，研究人员不但可以利用该框架进行多模态模型的对齐实验，提高模型的训练和评估效率，还可以用该框架微调各种大模型，提升在特定任务上的表现。该框架的推出，对探...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...稀缺的。毕竟，很少人能和蝙蝠侠面对面说过话。因此，研究人员考虑使用现有不同模态的数据进行合成。首先，研究人员基于公开的动作-文本数据集构建了一个大规模的带有语义标注的动作库，包含4万多个人体动作，然后使...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

首个多模态连续学习综述，港中文、清华、UIC联合发布

...的负前向知识转移。 MMCL 算法汇总为了应对上述挑战，研究人员越来越关注 MMCL 方法。作者将 MMCL 方法分为四类主要方法，即基于正则化、基于架构、基于重放和基于提示的方法。基于正则化的方法：由于训练中参数的自由移...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

苹果公司公布“mm1”多模态大模型

...已有多模态基准上监督微调后也能保持有竞争力的性能。研究人员对“MM1”模型进行了测试，号称MM1-3B-Chat和MM1-7B-Chat优于市面上绝大多数相同规模的模型。MM1-3B-Chat和MM1-7B-Chat在VQAv2、TextVQA、ScienceQA、MMBench、MMMU和M……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型