模态,指令,框架,模态,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... AI 发起挑战的高规格赛事落下了帷幕！这就是第二届多模态情感识别挑战赛（MER24），它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

北京智源研究院创始人张宏江：大模型背后的核心是一个新的操作系

...源研究院创始人、创始理事长张宏江表示，今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察，可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多

2024-03-25 20:31:00张宏,北京,创始人,研究院,模型,背后

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

...的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点：统一性：OmniGen 天然地支持各种图像生成任务，例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外，OmniGen 可以处理经典的计...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

GPT-4劲敌，谷歌进入高能+高产模式

...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...刚刚显现，未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中，多模态其实是一个被寄予厚望的方向。但是，这个领域目前面临一个严峻的挑战，即多模态的理解和生成...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

杨幂+小兰会是什么样？中山大学新AI成果，实现人脸个性化SO

...山大学、联想的研究团队推出了ConsistentID，可在细粒度多模态面部提示下，仅利用单张参考图像生成多样的肖像，且保持五官的一致性。最终在人脸个性化任务处理上，相比腾讯的photomaker和小红书的instantID，在五官一致性保持...……更多

2024-05-22 15:47:00小兰,中山大学,人脸,中山,成果,个性

OPPO AI 中心产品总监张峻：多模态和个性化是将要深耕的

...的主要方向，表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向，同时端云协同将是重点架构。“我们相信，在这些领域持续投入后，一定能为用户带来更加与众不同的体验。”张峻进一步说明，未来会...……更多

2024-10-22 09:48:00模态,总监,方向,个性,产品,模态

拓斯达新一代X5机器人控制平台如何突破具身智能的“小脑”瓶颈

...策，并向控制模块发出指令。该环节以中央计算单元与多模态决策算法为核心。【小脑】负责运动控制、感知外界状态，在大脑的策略下实现机器人动作的执行和反馈。控制：将决策指令转化为实际操作，实现与物理世界的互动...……更多

2024-12-03 09:50:00小脑,瓶颈,机器人,新一代,机器,突破

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...导读】面壁小钢炮MiniCPM-V 2.6重磅出击，再次刷新端侧多模态天花板！凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

首个免费多模态大模型API：GLM-4V-Flash上线智谱

...技术普惠的理念，在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力，更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多

2024-12-12 09:49:00费多,模态,模型,开放,平台,模型

矩阵起源入选IDC《RAG与向量数据库市场前景预测》报告

...原生HTAP数据库，支持包括向量数据、时序数据在内的多模态数据管理和检索能。MatrixOne不仅实现了向量类型、向量搜索和向量索引功能，还通过其MatrixGenesis产品提供大模型托管和多模态检索服务，为企业搭建一站式生成式AI应...……更多

2024-11-29 19:41:00向量,矩阵,起源,前景,数据库,报告

全自动组装家具！斯坦福发布IKEA Video Manua

...主组装IKEA家具，或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令：说明书提供了任务的整体分解和关键步骤；视频展示了详细的组装过程；而3D模型则定义了部件之间的精确空间关系。I...……更多

2024-12-04 09:53:00斯坦,斯坦福,指令,全自动,场景,家具

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成