• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对外展示了图像识别...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...能力测试基准。其中每个问题包含三部分:一个人的活动视频,环境和人类动作的文字描述与一个 ToM 问题。视频链接:https://mp.weixin.qq.com/s/fRa138rmFsv8W8JOYcsAPA 此前,大部分的心智能力测试基准都使用较简单的模版,文字或视频...……更多
腾讯云公布多项大模型产品进展
...入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持16s视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Amazon Nova系列中的所有模型,均以功能和尺寸来划分。先来看下新版尖端基础...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前的 CAD 软件普遍缺乏简易的交互工具...……更多
Sora爆火96小时国内大模型进场
...认为,国内企业想弯道超车难度不小查睿OpenAI“文字生成视频”大模型Sora根据提示词“纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游弋”生成的20秒视频。 视频截图 ■Sora不仅可以理解用户的需求,...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...AI“画布”的界面上,自由拖入文库和网盘内的文档、音视频等富媒体素材,迅速生成多模态内容。“自由画布”的背后得到了文心多模态大模型的强力支持,它不仅是一个简单的编辑工具,更成为了一个能够智能辅助用户完成...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...论坛上,商汤科技董事长兼CEO徐立在开场演讲时用一个AI视频致敬了人工智能行业的几位重要奠基人,而这个视频正是由Vimi生成的。Vimi是商汤此次发布的一大C端主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更...……更多
视频大模型 快手美图殊途同归
有图像视频业务傍身的互联网企业,加速奔向大模型。近日,快手正式上线视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品MOKI,该产品基于美图奇想大模型的视频生成能力,可帮...……更多
...研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上的潜力。据了解Emu3只基于下一个to...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...方面,已经完成了超500TB文本数据、12亿张图文数据、PB级视频数据的积累。而且,中国电信拥有丰富的产线业务与庞大的客户基础作为落地基底,以及丰富的2C、2H、2B的信息服务经验,能够更快地推动大模型在各个领域的落地,...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...ora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...模型团队自研打造。自从快手可灵 AI 火爆海内外,国内视频生成也如同 2023 年的文本大模型一样,越来越卷了。刚刚,又一视频生成大模型产品宣布正式上线:智谱 AI 正式发布「清影」。只要你有好的创意(几个字到几百个字...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...推理任务,如解答数学题、编写代码、创作诗歌等。三是视频理解能力。它不仅能够准确识别视频中的物体、人物和环境,还能够理解视频的整体氛围和人物情绪。生成方面,阶跃手里有Step-1X图像生成大模型。Step-1X采用DiT(Diff...……更多
“3D视频版Sora”来了!
输入单个物体视频,就能获取任意拍摄视角的全视图3D动态视频了!智东西7月25日消息,昨日晚间,AI独角兽Stability AI推出其首个视频生视频(video-to-video)模型Stable Video 4D(SV4D),该模型能够将单个物体的视频输入,转换为8个...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能力外,联通元景大模型还面向交通、农业、医疗打造了专业理...……更多
英国ai初创公司wayve公布gaia-1最新进展
...A-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策。而“预测未来事件”是该模型的基本关键能力,而...……更多
Sora概念引爆A股!谁在布局AI视频
ChatGPT风潮未过,OpenAI近日再放“大招”,发布文生视频模型Sora,再度点燃了A股的热情。2月19日,相关概念股集体大涨,当虹科技(688039)、因赛集团、万兴科技等多只个股冲上涨停。在接受北京商报记者采访时,当虹科技相...……更多
...交流日最后环节,徐立还带来了三段完全由大模型生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。他表示,通过商汤打造的智能算力中心,可以不断赋能于大模型的训练,目前,日日新大模型体系在自然语言...……更多
价格便宜75%!亚马逊推出全新大模型系列,3纳米自研芯片明年上市
...模型进行预训练。 全新大模型Nova系列涵盖文本、图像和视频在大会上,亚马逊推出了新一代基础模型Amazon Nova系列。用户可以使用由Amazon Nova提供支持的生成式AI应用程序来理解视频、图表和文档,或生成视频和其他多媒体内容...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...智能)正掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者。李彦宏表示,百度作为一家技术公司,定位是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为现场观众带来一场零距离、沉浸式的AIGC探索...……更多
...。北京时间2月16日凌晨,Open AI公司正式发布其首个文本-视频生成模型Sora。Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。同时,Sora还...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...,但对于生成式AI而言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍...……更多
AI潮起 共筑数智之基
...速实现从传统信息服务到智能服务全面升级,中国移动对视频彩铃、5G新通话、移动云盘、移动高清、云电脑等20余款战略产品开展全量AI+升级,通过全面接入人工智能大模型,实现产品的功能重塑、流程重构、机制重建,全面...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...人一般的对话伙伴,而不仅仅是一个文字的朗读者。以下视频来源于 智谱清言 视频链接:https://mp.weixin.qq.com/s/Bi7cPZXCmsjSaJu6EglhJA精通各种方言,比如这段北京烤鸭的介绍,那叫一个地道:试听链接:https://mp.weixin.qq.com/……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...的语音合成效果。其首批40个语种平均MOS分(评估音频或视频质量的一种标准,5分为最高)提升了0.25,拟人测试中MOS达到4.5分,拟人度达到83%,拟人语音合成能力超越ChatGPT。星火语音大模型开源方向上,此次科大讯飞发布了星...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...我们发现很多年轻用户戴着我们的AR眼镜,去拍第一视角视频,包括使用AI语音询问周边的信息。”李未可科技创始人兼CEO茹忆说到。而这也是用户驱动李未可科技在室外运动场景后,拓展研学、CityWalk等文旅场景等一大原因。在...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...理解大模型混元-V也在持续升级,解锁文字、图像、3D、视频等更多模态,今年8月在SuperCLUE-V多模态理解评测基准总榜中排名第一。文生图方面,今年5月,腾讯混元全面开源业界首个中文原生DiT架构文生图大模型,评测结果国内...……更多
更多关于科技的资讯:
春晚与淘宝,如何成为“最佳搭档”的?
作者:剑秋申遗后的春晚,正在变得更年轻? 在辞旧迎新的除夕夜,春节联欢晚会这个持续了43年的文化盛宴,在其与老搭档淘宝7年后第四次携手之际
2025-02-03 07:17:00
2024年全新上市车型销量榜:比亚迪秦L第一 一年狂卖228818辆
快科技2月2日消息,易车榜根据终端销量数据,整理了2024年上市的全新车型销量Top20榜单。具体来看,比亚迪秦L为去年上市的全新车型销冠车型
2025-02-02 23:10:00
苹果宣布开源Swift Build:拓展开发者生态建设
快科技2月2日消息,据报道,苹果宣布其将开源用于构建Xcode开发环境的工具引擎Swift Build。为开发者提供更加灵活和强大的工具支持
2025-02-02 23:40:00
阿西莫夫三定律 还适用于今天的AI吗
1942年,伟大的科幻作家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中首次提出了“机器人三定律”
2025-02-02 23:40:00
想买YU7 先看看这台14000公里的创始版SU7现在咋样了
各位买新能源车的时候,会考虑二手车么?反正脖子哥我是有点心动的,二手新能源大部分年份都很近,里程数很低,而且一看价格全是骨折价
2025-02-03 01:10:00
“新冰箱吸不住高价买的冰箱贴”,气疯有囤积癖的年轻人
原标题:为什么新出的冰箱,吸不住冰箱贴了?作者:梁婷婷囤满食物的冰箱,在爸妈眼里自带一种年味儿,但一代人有一代人的“囤积癖”
2025-02-03 03:03:00
电动车主分享高速服务区充电小妙招:过个通道立马不用排队等桩
快科技2月2日消息,随着新能源汽车保有量的增多,每年春运期间都会出现服务区充电排队的情况。日前,有电动车车主分享了一个高速服务区充电小妙招
2025-02-02 12:40:00
《哪吒》导演饺子:试过外包给国际团队制作 但效果不理想
快科技2月2日消息,据网络平台最新数据,截至2月2日11时12分,2025春节档总票房(含预售)破64亿元。《哪吒之魔童闹海》《唐探1900》《封神第二部
2025-02-02 12:40:00
最便宜的50系列显卡终于来了!RTX 5060 Ti/5060将于3月上市:最高16GB大显存
快科技2月2日消息,RTX 5090D(国内特供版)、RTX 5080已于1月30日(大年初二)正式在国内上市。虽然性能顶级
2025-02-02 12:40:00
DeepSeek-R1大模型登陆腾讯云:一键部署 3分钟调用
快科技2月2日消息,据腾讯云官微发文,DeepSeek-R1大模型一键部署至腾讯云「HAI」上,开发者仅需3分钟就能接入调用
2025-02-02 13:10:00
Intel下一代移动、桌面CPU官宣!Panther Lake 2025年下半年推出 Nova Lake 2026年见
快科技2月2日消息,尽管2024年第四季度财报表现不佳,但Intel的制造工艺、产品并未停歇,各项工作依然在积极推进。被外界寄予厚望
2025-02-02 14:10:00
华为三折叠即将走向世界!Mate XT非凡大师获阿联酋认证
快科技2月2日消息,华为Mate XT三折叠手机近日通过了阿联酋TDRA的官方认证,型号为GRL-LX9,注册编号为ER41137/25
2025-02-02 15:10:00
最快的N卡和最快的A卡跑DeepSeek谁更快:RTX 5090比RX 7900 XTX快一倍
快科技2月2日消息,最快的N卡和最快的A卡跑DeepSeek谁更快?最新消息显示,RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多
2025-02-02 15:10:00
玩家被耍!整个欧洲的RTX 5090、5080公版卡发售前就被黄牛机器人抢空了
快科技2月2日消息,RTX 5090、5080已于1月30日正式上市,但极度缺货,想以官价买到几乎不可能。除了供应短缺之外
2025-02-02 15:40:00
2024年中国外贸总值破43万亿,人民日报金社平夸赞喜临门
2025年开年,中国外贸传来振奋人心的好消息:2024年外贸总值突破43.85万亿元,同比增长5%。人民日报署名金社平发文《从外贸看中国经济韧性》
2025-02-02 15:49:00