模态,指令,框架,模态,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点：统一性：OmniGen 天然地支持各种图像生成任务，例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外，OmniGen 可以处理经典的计...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

GPT-4劲敌，谷歌进入高能+高产模式

...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...刚刚显现，未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中，多模态其实是一个被寄予厚望的方向。但是，这个领域目前面临一个严峻的挑战，即多模态的理解和生成...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

杨幂+小兰会是什么样？中山大学新AI成果，实现人脸个性化SO

...山大学、联想的研究团队推出了ConsistentID，可在细粒度多模态面部提示下，仅利用单张参考图像生成多样的肖像，且保持五官的一致性。最终在人脸个性化任务处理上，相比腾讯的photomaker和小红书的instantID，在五官一致性保持...……更多

2024-05-22 15:47:00小兰,中山大学,人脸,中山,成果,个性

OPPO AI 中心产品总监张峻：多模态和个性化是将要深耕的

...的主要方向，表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向，同时端云协同将是重点架构。“我们相信，在这些领域持续投入后，一定能为用户带来更加与众不同的体验。”张峻进一步说明，未来会...……更多

2024-10-22 09:48:00模态,总监,方向,个性,产品,模态

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...导读】面壁小钢炮MiniCPM-V 2.6重磅出击，再次刷新端侧多模态天花板！凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

矩阵起源入选IDC《RAG与向量数据库市场前景预测》报告

...原生HTAP数据库，支持包括向量数据、时序数据在内的多模态数据管理和检索能。MatrixOne不仅实现了向量类型、向量搜索和向量索引功能，还通过其MatrixGenesis产品提供大模型托管和多模态检索服务，为企业搭建一站式生成式AI应...……更多

2024-11-29 19:41:00向量,矩阵,起源,前景,数据库,报告

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...进行统一的处理。在本文中，研究者通过提出创新型的多模态模型架构，以及统一的物理可解释动作空间，来解决这些挑战。设计 RDT：双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

世优波塔AI数字人多模态交互系统，赋能智慧医疗服务升级

近日，世优科技“波塔发布会”在京举行，AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础，致力于打造人工智能时代有温度的多模态人机交互界面。医疗水平提升、市场...……更多

2024-06-13 10:45:00优波,模态,人多,医疗服务,智慧,升级

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...像与语音识别能力。本月初，微软更是公布了 166 页的多模态版 GPT-4V 的相关文档，详细探讨了 GPT-4V 的功能和使用情况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

...一年，人工智能领域风起云涌，模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方？3月24日，在2024全球开发者先锋大会的大模型前沿论坛上，上海人工智能实验室领军科学家林达华...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

vivo自研大模型全家桶炸场，亮出PhoneGPT智能体，蓝

...幕的力度、圈搜文字或图片、还是拖拽一段地址信息，多模态大模型都可以深度解读你的意图，进而给你需要的反馈和服务。依托文本大模型，结合自监督学习语音编解码、多语音任务学习和模态对齐等技术，蓝心小V在文本能...……更多

2024-10-11 09:55:00一键,衣食,全家,模型,智能,模型

苹果发布新型开源人工智能模型：可根据自然语言指令编辑图像

...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing，利用多模态大型语言模型（MLLM）解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令，进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多

2024-02-09 03:32:00自然语言,人工智能,指令,人工,模型,图像

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

...的视频教程！具体来说，团队提出了用于机器人的大型多模态数据集IKEA Video Manuals，已入选NeurIPS。数据集涵盖了6大类IKEA家具，每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细，拆解出的安装子步骤多...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...规模高达2100亿，覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同，他们解码的是生命语言，而非自然语言，意味着不仅能处理复杂的生物序列...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...变小，成为具身智能的「大脑」。解法：垂域大模型、多模态技术与 AI 智能体论坛中，关于可信大模型如何在应用具体落地，呈现出了多种解法，大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...力的建设。目前，小红书技术团队同时针对语言模型和多模态能力进行了综合研发，结合小红书自身的业务场景和需求，更早做了视觉理解大模型方向的技术攻关：在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

vivo自研蓝河操作系统发布：支持大模型、多模态交互

...号称一款面向未来的自研智慧操作系统，支持大模型、多模态交互，还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来，Rust重构的热潮席卷整个开发圈，Rust在安全性、高效性和可维护性等方面都有一定优势，包括...……更多

2023-11-03 02:14:00模态,模型,支持,系统,系统,支持

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态