模态,拟人,玩家,模态,情感,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2024云栖大会将是史上汇集AI硬科技最多的一届

...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是，由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍，大会也邀请到十余家多模态模型...……更多

2024-09-04 07:02:00大会,科技,机器人,模型,杭州,机器

...板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别【五连板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电，苏州科...……更多

2023-12-13 17:47:00科达,模型,模态,苏州,对象,服务

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

最前线｜让用户跟虚拟人交朋友，Soul上线AI应用“异世界回

...用户可自行创建、融合出属于该角色的专属声音，实现多模态互动。以及，用户也可以在这款新应用上创建自己的数字分身，即虚拟的自己。通过用户的授权，该应用可以获取用户在平台产生的所有公域内容，包括用户发布的内...……更多

2024-05-31 16:03:00回响,应用,用户,世界,用户,角色

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

以假乱真，天工音乐大模型带来颠覆式AI体验

...、拓宽「天工SkyMusic」的能力边界，让模型具备更强的多模态情感理解与表达能力，为用户带来更优质的AI音乐体验。最后，我们将很快给出「天工SkyMusic」音乐创作Prompt指南，并提供更多的AI音乐Demo与使用技巧，与用户一同探索...……更多

2024-04-03 11:35:00天工,颠覆,模型,体验,音乐,天工

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

喜马拉雅音频大模型亮相，AI赋能内容创作者

...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会，在“人工智能+”主题馆吸引众多市民驻足围观体验。AI（人工智能）已经在深刻影响着我们的生活，也影响和改变着内容创作行业。作为在线音...……更多

2024-09-21 09:50:00喜马拉雅,创作者,模型,创作,音频,内容

新网银行“多模态深度神经网络风控模型体系”入选10项首批代表

...暨第一批人工智能应用场景发布大会上，新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”，彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多

2024-10-30 16:25:00新网,模态,神经网络,代表性,深度,模型

支付宝发布多模态医疗大模型：支持千亿级视觉识别

...快科技7月5日消息，在2024世界人工智能大会上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据悉，该医疗大模型的基石，源自蚂蚁集团自主研发的蚂蚁百灵大模型，这一先进平台不仅拥有“视听言...……更多

2024-07-05 16:17:00模态,模型,支付,视觉,医疗,支持

蔚来 NOMI GPT 端云多模态大模型上线

蔚来 NOMI GPT 端云多模态大模型正式上线，并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉，NOMI GPT是为NOMI打造的端云多模态大模型，基于自研的端云融合架构，拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多

2024-04-12 13:09:00模态,模型,模态,多维度,多维,模型

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI ...……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型