• 我的订阅
  • 头条热搜
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
文博会观察:大模型为文化产业发展提供新机遇
...前来互动。“面向文化创作领域,腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示,面对内容制作行业多样化需求,腾讯混元在...……更多
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...ATO大模型算法和讯飞星火认知大模型算法之外,阿里的多模态算法达摩院交互式多能型合成算法也在列。受到这一消息刺激,AI概念股午后突然发力,其中科大讯飞一度涨逾8%再创新高,而神州泰岳一度涨超13%,万兴科技、彩...……更多
OriginOS 5来了!2024 vivo开发者大会定档10月10日:还有自研操作系统
...以及性能优化上呈现新面貌,并搭载蓝心大模型,提供多模态交互体验,包括语音、视觉及文字等领域的智能解决方案。蓝心大模型于去年11月初举行的2023 vivo开发者大会上首次对外公布,包含十亿、百亿、千亿三个参数量级共5...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
紧握根技术竞速大模型
...幅竹林水墨画……峰会上,中科院自动化研究所发布的全模态大模型“紫东太初”2.0现场展示的图像生成能力令人惊叹。除了支持图像生成,“紫东太初”2.0还支持多轮问答、文本创作、3D理解、信号分析等跨模态任务,例如在...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...元宇宙情绪感知、基于听觉的情绪感知以及最终产生的多模态情绪判断。团队选择了比动漫人物、动物在表情复现上更为精细的数字人写实形象作为建模方案,而实现表情驱动则需要对真人的眉毛、眼睛、鼻子、嘴巴等70个特征...……更多
比ChatGPT省电10倍 Google研训练AI模型新方法
...究团队近日提出一种加快人工智能训练的新方法,使用多模态对比学习与联合范例选择(JEST)能大大减少训练人工智能所需的计算资源和时间,其迭代次数比现在少13倍而运算量也少10倍,成功超越最先进的模型。根据Google DeepMi...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
...级别智能交通技术的世界级人工智能企业。公司专注于多模态感知、AI算法算力、自动化控制及多模态大模型技术等智能科学发展新范式的研发与应用,致力于为用户提供高级别智能交通产品全栈技术和解决方案,其人工智能产...……更多
9月15日,厦门理工学院发布了“以中文为核心的多模态预训练闽南话语言模型”“闽台视频资料AI增强与编辑云平台”等多项科研成果。“闽台视听资料AI超高清视频增强与编辑云平台”是依托人工智能技术实现对视频资料的智...……更多
汤姆猫:与西湖心辰团队正加速推进大模型应用落地
...智能交互产品的研发工作,并通过文字、图片、语音等多模态的交互初步实现拍照识物、科普教育、对话修图、交互引导等功能。后续公司与西湖心辰将加速推进在多模态模型、垂直领域模型及终端软硬件等领域的深度合作,进...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
阿里大模型,再次开源大放送
...版让不少人都迫不及待想试试。并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?除此之外,还集成到了Huggingfacetransformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...内部特征同等的高度,进行显式的逻辑映射,通过整合多模态数据,如点云、图像、声音和文字,构建出对环境的全面细致的表示。这些不同形式的数据提供了丰富的环境信息,从三维形状和空间位置、到视觉特征、再到上下文...……更多
2023数博会丨“数治无疆·智治无界”AIGC与基层治理发展论坛成功举行
...武教授人民大学高瓴人工智能学院博导卢志武教授以《多模态通用生成模型及落地应用》为题发表主题演讲。卢志武教授曾主导设计我国首个公开发布的中文通用大模型——文澜BriVL,并在此基础上推出第一款应用级多模态ChatGPT...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
医疗大模型这一年,腾讯健康迈出了第一步
...诊,都是提供了一系列选项,让患者勾选,现在搭载了多模态的大模型和自然语言处理内核的系统,将选择题变成对话框,可与患者进行自然、流畅的对话,文字、语音甚至图片都能理解,预问诊的精准度实现跨越式提高。不仅...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
大模型通向AGI,腾讯云携手业界专家探索创新应用新风向
...项目,而非“AI+”的项目;· 保持前瞻性眼光,如关注多模态等前沿方向;· 强调“产业闭环”。向量数据库:实现多模态数据打通和人与数据的互动“大语言模型的本质是把治理范式进行了转移,它的作用主要体现在即使是非程...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款多模态睡眠状态分类模型。该...……更多
更多关于科技的资讯:
蔚来萤火虫首车内饰曝光:中控车机用上大横屏
快科技11月25日消息,今日,有博主曝光了蔚来第三品牌萤火虫首车的内饰谍照。从谍照可以看出,萤火虫采用了与乐道L60相同的横屏车机
2024-11-25 18:59:00
成功率接近90%!科学家让蚊子为人类打疫苗
快科技11月25日消息,据报道,荷兰莱顿大学的科学家通过对引起疟疾的疟原虫进行一番基因改造后,能够让蚊子携带它们为人类接种疫苗
2024-11-25 18:59:00
曝苹果不会更新AirPods Max 第二代可能得等2025
【CNMO科技消息】苹果在2024年9月为AirPodsMax带来了USB-C接口和新的颜色选项,据报道,公司不打算对这款耳机进行任何进一步的硬件更新
2024-11-25 19:01:00
又推迟?曝苹果iOS 19将取消推送大量已推出的功能
【CNMO科技消息】今年,苹果推出了AppleIntelligence,正式迈入AI时代。据彭博社消息,苹果已经推迟了多项原定于明年iOS19更新中推出的功能
2024-11-25 19:01:00
曝iOS 19和iOS 18一样分批推出
【CNMO科技消息】11月25日消息,据彭博社记者MarkGurman透露,iOS19也会像iOS18一样,采用分批推出的策略
2024-11-25 19:01:00
曝iPhone 17 Air灵感来自MacBook Air
【CNMO科技消息】近日,彭博社记者MarkGurman揭示了苹果推出超薄iPhone的原因。由于Plus型号的市场反响平平
2024-11-25 19:01:00
曝iPhone 17 Slim影像将落后于Pro版本
【CNMO科技消息】据传,苹果将在明年推出iPhone17Slim(或称iPhone17Air,本文简称“Slim”)
2024-11-25 19:01:00
AppStore年销售额3.7万亿!苹果官宣“苹果税”构成
2024年11月21日,苹果发布了一项关于“App生态系统在中国”的新研究报告。该报告由上海财经大学商学院副教授居恒撰写
2024-11-25 19:02:00
1999元起!曾经最香的国产机,杀回来了
现在的新机啊,是越来越贵了。你没听错,这个听起来多少有点不满地抱怨,确实是从我这个从业资历不浅的老数码人口中说出来的。当然
2024-11-25 19:02:00
OpenAI进军浏览器!AI正在消灭“网页”,浏览器怎么活?
ChatGPT之后,AI改造软件就迅速成为了全球的共识,「人工智能将从根本上改变每个软件类别,」正如微软CEO萨蒂亚·纳德拉所言
2024-11-25 19:02:00
Sonos将发布首款电视盒子!北美市场这玩意竟还有「搞头」?
海外媒体TheVerge报道称,Sonos计划不久后推出一款电视盒子,搭载由TheTradeDesk公司开发的Ventura操作系统
2024-11-25 19:02:00
不到5000元!我整了台16G+2T的皇帝版Mac mini
要说最近热度最高的苹果设备,既不是刚发布的iPhone16系列,也不是什么AppleWatch,而是在10月29日悄悄上架官网的Macmini(M4版)
2024-11-25 19:02:00
240万分刷新性能天花板!真我Neo7爆狠料
最近机圈的大混战可太激烈了,国产高端旗舰新品陆续登场,接下来的中端市场也有一大波新品来袭,近期有换机打算的朋友可有得挑了
2024-11-25 19:03:00
售价万元起步的Mac还值得买吗?一文带你读懂
不难发现,随着AI技术的发展,不少人正在借助AI来改善自己的工作流畅,实现更为高效的生产力办公。而笔记本作为人手必备的移动设备
2024-11-25 19:03:00
从高校竞赛到AI手机,OPPO加速推动智能体生态建设
近年来,人工智能(AI)技术的迅猛发展让“人人都是开发者”从理念逐步成为现实。在这场技术变革中,智能交互作为人与机器连接的关键领域
2024-11-25 19:05:00