• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和...……更多
...市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献) ……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...让数据集更能反映实际应用中的难点。‍有趣的是,研究团队发现25%的家具存在多种有效的组装顺序。比如Laiva架子就有8种不同的组装方式!这种多样性真实地反映了现实世界中组装任务的灵活性。 系统的标注流程为了获得高...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
大模型“遍地”都是,谁能真正解放生产力?
...市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...aS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...对这一领域关注得很早,有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”,当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多
萤石推出智能家居AI主机!接入自研蓝海大模型,智能手表抬手就能看血糖
...融合难,而且单一产品往往没法解决场景系统问题,所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架,云端大模型为复杂场景问题提供了解法,一些简单问题则由本地小模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...多模态模型」实现了规模与模态的双重突破。在规模上,团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据,创新「跨模动态对齐」技术,融合大语言模型,实现千亿参数视觉语言模型。在模态上,团队建设模态动...……更多
...命中,智能硬件这个场景将会扮演什么样的角色?我也和团队说,过去我们讲互联网思维,未来可能叫大模型思维,过去我们是讲“互联网+”,以后可能是“人工智能+”。或者以后人工智能这个词改一下,新的人工智能可以叫...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...、Relay Diffusion(ICLR’24)、CogView3 (2024)。基于CogView,团队研发基于大模型的文本到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功率最...……更多
Sora爆火96小时国内大模型进场
... 查睿春节期间,大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界极大的震撼,网友惊呼“现实不存在了”。发布短短96个小时内,国内已...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...原始代码是公开的,但每个版本的开发过程由一个专属的团队管控;一种是市集模式,原始代码同样是公开的,不过是放在互联网上供人检视及开发,最直接的例子就是Linux。最终“市集模式”证明了开源比闭源更加高效,全球9...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...独立人士处获悉,小红书从3月份起筹备了独立的大模型团队,核心员工来自广告业务的NLP技术团队。目前该部门在内部为保密状态,在员工系统里也被直接隐藏。据36氪了解,小红书大模型团队的负责人为张德兵,薯名为“宇尘...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
近日,2024世界人工智能大会(WAIC 2024)期间,中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al,智能体重新定义世界”自主智能+创新应用论坛,该论坛是本次世界人工智能大会核心专业论坛...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
这周,5家公司发了AI新品 | 最前线
...头阵。此次发布的新版钉钉,主要面向的是个人用户、小团队、高校师生等C端用户群体。基于“通义千问”的模型能力,钉钉个人版对目前企业版进行了“瘦身”,在提供多模态交互的AI能力的同时,整合了wolai知识库、阿里云...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。若愚科技是一支源自哈工大的团队,创立于2023年,旨在通过多模态大模型技术打造机器人大脑。公司创始人聂礼强现任哈尔滨工业大学(深圳)计算机...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。多模态的意义在于,为AI应用带来更多的可能性...……更多
...24日 第 09 版)本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...景任务提供高效精准的感知和理解能力支持,向通用人工智能迈出坚实的一步。“书生(INTERN)”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布,并持续联合研发...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...灯光等干扰误报。这些都不是简单的技术 demo ,而是百度智能云在给实际生产「上价值」 的真实写照。IDC 数据也印证了这一点。2023 年,百度智能云至少拿了两个第一:在 AI 公有云市场份额达到了 26.4 %,已连续五年位居首位;...……更多
更多关于科技的资讯:
进一步拥抱华为 岚图梦想家新车型近期推出:或全系配乾崑智驾
快科技2月10日消息,随着长安、比亚迪等传统大厂的入局,智驾势必会成为今年汽车市场最为关键的能力,而智驾全民普及也必将成为今年一大趋势
2025-02-10 12:47:00
最终票房或达150亿!《哪吒2》盗摄现象层出不穷 专家释疑买票也不具备盗摄权利
快科技2月10日消息,按照猫眼专业版最新预测,《哪吒2》票房最终将达到108.7亿元。一些业内人士更是预测,最终票房可能达到150亿元
2025-02-10 12:47:00
谷歌DeepMind CEO评价Deepseek为中国最好的作品:但外界炒作有点夸大
快科技2月10日消息,谷歌旗下DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)在巴黎一场谷歌主办的活动上
2025-02-10 12:47:00
“理想汽车是力帆车”谣言频传 理想高管怒回应:从来没有用过代工
快科技2月10日消息,“理想汽车是力帆车”的谣言一直在网上流传,对此理想高管正面回应。理想汽车第一产品线总裁汤靖表示,“网上还有不少人说“理想汽车是力帆车”……车到底是谁家的
2025-02-10 13:17:00
能装进口袋!米家筋膜枪3迷你版发布:首发229元
快科技2月10日消息,小米最新推出了米家筋膜枪3迷你版,宣称小到“轻松装进口袋”,强到“快速击退疲劳”。新品建议零售价299元
2025-02-10 13:47:00
蛇年伊始,浙江以3520.5亿元的重大项目投资规模,在开年之际掀起了一股“热劲”。这不仅是数字的叠加,更是一场关乎未来的精准布局
2025-02-10 13:53:00
公众号与小红书文案设计排版服务让运营内容更出彩(附案例参考)
【本篇由言同数字科技有限公司原创】在小红书和公众号的运营中,你是否遇到过这些问题:想写一篇爆款笔记,但文案总是差了点“感觉”
2025-02-10 13:56:00
蔚来:春节期间成功帮助用户化险为夷108次
快科技2月10日消息,蔚来公布了其自动紧急避让AES功能的最新进展。自1月10日全量推送以来,该功能在春节期间共帮助用户化险为夷108次
2025-02-10 14:17:00
启源芯动力荣获青浦区多项殊荣,以技术创新赋能高质量发展
近日,2025年上海市青浦区高质量发展企业表彰会在国家会展中心举办。青浦区区委副书记、区长金晓明,区人大常委会主任朱明福
2025-02-10 14:45:00
俄罗斯打造等离子体火箭发动机:将航天器送至火星仅需一个月
快科技2月10日消息,据报道,俄罗斯国家原子能公司(Rosatom)公布了一种等离子体电力火箭发动机,据称该发动机能够在短短一到两个月内将航天器送至火星
2025-02-10 14:47:00
刷医保买华为手表需当场激活:网友扎堆购买
快科技2月10日消息,近日,不少网友在社交平台上分享可以用医保个人账户中的钱去药店购买华为WATCH D2,引发关注。据媒体报道
2025-02-10 14:47:00
曝智驾明星企业纵目科技创始人失联:断电封楼、全员欠薪
快科技2月10日消息,近日有媒体报道,2月8日,纵目科技员工收到行政通知:将在当天18点后断电封楼,员工须在此之前取走私物或办理离职证明
2025-02-10 14:47:00
长安押宝全民智驾:大半个车圈儿老总齐发声力挺
全民智驾,爆发增长。这就是2025年智能驾驶的主旋律。因为长安在重庆,开了一场群星闪耀的发布会。尹同跃、李书福、魏建军
2025-02-10 14:47:00
竟然撑了10代!网友晒iPhone 6S换iPhone 16 Plus感受:全是优点
快科技2月10日消息,在智能手机快速迭代的今天,许多用户每隔一两年就会更换手机。然而,一名网友却在论坛上分享了自己从iPhone 6S Plus升级到iPhone 16 Plus的感受
2025-02-10 14:47:00
男子强行变道被撞后辱骂后车司机 我就变了怎么着:官方回应了
2月10日消息,据国内媒体报道称,近日长深高速广东河源段出现了一起事故,前车强行变道被撞后竟公然辱骂后车司机。2月8日长深高速广东河源段
2025-02-10 14:47:00