模态,研究人员,隐患,模型,人员,安全头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

arxiv研究人员：多模态ai模型存在安全隐患

...印象、争议性话题以及非法活动和犯罪等9个安全领域。研究人员说，大型视觉语言模型（LVLM）在接收多模态输入时很难识别SIUO类型的安全问题，在提供安全响应方面也遇到困难。在接受测试的15个LVLM中，只有GPT-4v（53.29%）、GPT...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

赋予人工智能更多温度

...据驱动的服务对象精准认知与最优决策技术，以及基于多模态的机器人主动服务与精准交互技术这三大核心技术，链接了物联网、精准服务分析、深度学习计算三大云端平台，实现了‘云、边、端’技术一体化和行业应用的深度...……更多

2023-11-24 06:27:00人工智能,人工,温度,智能,更多,智能

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...来源何处？近日，来自清华、北航、上交和瑞莱智慧的研究人员联合撰写百页长文，发布名为MultiTrust的综合基准，首次从多个维度和视角全面评估了主流多模态大模型的可信度，展示了其中多个潜在安全风险，启发多模态大模...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...和文本来混合：[TEXT]the cat [SPEECH][Hu3][Hu7]..[Hu200][TEXT]the mat研究人员认为，交错训练可以帮助模型学习语音和文本之间的对应关系，从而实现更好的文本到语音的转换；在每个训练步骤中，句子中的语音和文本部分是随机采样的。...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

公路水路交通基础设施数字化转型升级，卓视智通准备好了

...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发，并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地，公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多

2024-05-22 12:00:00智通,水路,基础设施,设施,公路,准备

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」（object pointer memory）的位置编码...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

北京人工智能数据运营平台发布

...大量通用数据、行业数据，支持文本、图像、视频等多种模态，并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练，同时，4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...似，但GPT-4o mini 模型的健壮性与GPT-4o相比，健壮性较差。研究人员中还探讨了 OCR 提示和思想链 (CoT) 推理的影响，结果发现 OCR 提示的影响很小，而 CoT 通常可以提高性能。MMMU-Pro：更健壮的MMMU重新审视MMMU基准测试大规模多学科...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...11402项目主页：https://nvlm-project.github.io/在模型设计方面，研究人员对纯解码器多模态大模型（如LLaVA）和基于交叉注意力的模型（如Flamingo）进行了全面对比，并根据总结出的优势和劣势，提出了一种全新架构，提升了模型的训...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器（ViT）模型与对比性预训练的模型（SigLIP）进行了比较，结果发现，PaLI-3 虽然在标准图像分类基准上略微表现不佳，但基于 SigLIP...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...开源 7B 模型之外，该团队同样也开源了 1.3B 的小模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

全模态对齐框架align-anything来啦：实现跨模态指

...该团队以将「Align Anything」框架进行开源。通过该框架，研究人员不但可以利用该框架进行多模态模型的对齐实验，提高模型的训练和评估效率，还可以用该框架微调各种大模型，提升在特定任务上的表现。该框架的推出，对探...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...稀缺的。毕竟，很少人能和蝙蝠侠面对面说过话。因此，研究人员考虑使用现有不同模态的数据进行合成。首先，研究人员基于公开的动作-文本数据集构建了一个大规模的带有语义标注的动作库，包含4万多个人体动作，然后使...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

首个多模态连续学习综述，港中文、清华、UIC联合发布

...的负前向知识转移。 MMCL 算法汇总为了应对上述挑战，研究人员越来越关注 MMCL 方法。作者将 MMCL 方法分为四类主要方法，即基于正则化、基于架构、基于重放和基于提示的方法。基于正则化的方法：由于训练中参数的自由移...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

苹果公司公布“mm1”多模态大模型

...已有多模态基准上监督微调后也能保持有竞争力的性能。研究人员对“MM1”模型进行了测试，号称MM1-3B-Chat和MM1-7B-Chat优于市面上绝大多数相同规模的模型。MM1-3B-Chat和MM1-7B-Chat在VQAv2、TextVQA、ScienceQA、MMBench、MMMU和M……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

...型的计算效率。SmartTrim框架结构图在训练SmartTrim模型时，研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧，解决了不可导二值mask的问题，实现了模型的端到端训练。此外，自蒸馏和课...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型