团队,智能,空间,视频,模态,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

空间智能版ImageNet来了，来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

斯坦福吴佳俊团队，给机器人设计了一套组装宜家家具的视频教程！具体来说，团队提出了用于机器人的大型多模态数据集IKEA Video Manuals，已入选NeurIPS。数据集涵盖了6大类IKEA家具，每种家具都包含完整的3D模型、组装说明书和...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

拓宽行业应用场景多模态大模型加速通用AI进程

...市场上已公开的大多数模型出自初创公司和小型技术开发团队，包括Runaway、Pika等，且目前已呈现较为可观的完成效果和商业模式。（实习生张泊洋对此文亦有贡献） ……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...的重要基础。近日，来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中，这篇论文...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

全自动组装家具！斯坦福发布IKEA Video Manua

...让数据集更能反映实际应用中的难点。‍有趣的是，研究团队发现25%的家具存在多种有效的组装顺序。比如Laiva架子就有8种不同的组装方式！这种多样性真实地反映了现实世界中组装任务的灵活性。系统的标注流程为了获得高...……更多

2024-12-04 09:53:00斯坦,斯坦福,指令,全自动,场景,家具

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型（MLLM）。之所以选择多模态大模型作为 Ferret 的设计前提，是因为其拥有强大的视觉语言全局理解能...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

大模型“遍地”都是，谁能真正解放生产力？

...市场现实情况是，供不应求：除了大厂以外，少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然，听到了太多客户关于大模型难以落地的抱怨，正致力于解决以上困境，给出两全法。相较于其他两百多个大...……更多

2023-11-30 14:50:00生产力,模型,解放,生产,模型,考拉

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁蒋杰率先透露，腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱，快手视频生成大模型可灵AI也宣布基础模型...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...aS（模型即服务）服务和To C的应用产品。生数科技的核心团队成员，出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室，曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...对这一领域关注得很早，有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”，当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

萤石推出智能家居AI主机！接入自研蓝海大模型，智能手表抬手就

...融合难，而且单一产品往往没法解决场景系统问题，所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架，云端大模型为复杂场景问题提供了解法，一些简单问题则由本地小模...……更多

2024-07-25 09:30:00智能,萤石,家居,智能家居,血糖,接入

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...多模态模型」实现了规模与模态的双重突破。在规模上，团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据，创新「跨模动态对齐」技术，融合大语言模型，实现千亿参数视觉语言模型。在模态上，团队建设模态动...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...的大模型前沿论文SwiftEdit：50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis：首个完全自主的纯视觉 GUI agentGoogle DeepMind：利用运动轨迹控制视频生成大模型数学新基准：成功率最...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...、Relay Diffusion（ICLR’24）、CogView3 （2024）。基于CogView，团队研发基于大模型的文本到视频生成模型CogVideo，采用了多帧率分层训练策略生成高质量的视频片段，提出一种基于递归插值的方法，逐步生成与每个子描述相对应的视...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

Sora爆火96小时国内大模型进场

... 查睿春节期间，大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora，特别是官方公布的长达60秒未经修改的AI视频，引发业界极大的震撼，网友惊呼“现实不存在了”。发布短短96个小时内，国内已...……更多

2024-02-20 05:20:00模型,小时,视频,模型,生成,文本

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...智谱清言打造的视频创作智能体，清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX，现已支持文生视频、图生视频多个能力，让用户“自助式”地完成艺术视频创作，首发测试期间，所有用户均可免费使用。同时，...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

联汇科技发布最新智能体应用——第二代多模态智能体OmAgen

近日，2024世界人工智能大会(WAIC 2024)期间，中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al，智能体重新定义世界”自主智能+创新应用论坛，该论坛是本次世界人工智能大会核心专业论坛...……更多

2024-07-18 14:51:00联汇,二代,模态,智能,应用,科技

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...其中Semi 赛道第一名由社交平台 Soul App 摘得，其语音技术团队凭借可行性创新技术方案拔得头筹。不过，在揭秘 Soul 团队技术方案之前，我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下，这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨，美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

全模态对齐框架align-anything来啦：实现跨模态指

...。本开源项目由北京大学对齐小组开发并进行长期维护，团队专注于人工智能系统的安全交互与价值对齐，指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力