• 我的订阅
  • 头条热搜
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,相比现有最高效的同类方法快...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更加安全和...……更多
开局一张图,内容我来编!图像转视频AI工具盘点
...仅仅用时两三个月就爆火的text-video工具,RunwayGen2的图像生成视频功能称得上是目前AI视频领域第一梯队的选手,如果说LeiaPix只是单纯地使图片“动”起来,Runway则是使图片更具生命力。Gen-2不仅可以控制镜头位置和移动速度的...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI...……更多
metareality推出sapiensai视觉模型
...像中每个像素与摄像头的距离,从而有效地从二维图像中生成三维图像。这对增强现实和自动驾驶等应用至关重要,因为在这些应用中,了解空间布局非常重要。表面法线预测:这项任务是预测图像中表面的方向。每个像素都会...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...了其在模拟复杂环境中处理细节和进行决策的能力。环境生成模型(generative models of environments),也可以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。但...……更多
谷歌推出了最新AI模型Gemini
近日,谷歌推出了其最新AI模型Gemini,具备了根据文字生成图像的功能。然而,不少用户在使用该模型时发现,生成的图像中大部分为非白人角色。这一现象引起了公众的广泛关注和质疑。针对这个问题,谷歌高级副总裁普拉巴...……更多
最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
...吧?不过放大看一些特定细节,还是很容易看出确实是AI生成的,比如车牌号上的文字都是乱码。 那么是否Flux1.1模型本身能力就很强大,这个技巧在其中起到了多大作用呢?一位资深修图师傅晒出了对比,左边加了IMG_1018.CR2,...……更多
“3D视频版Sora”来了!
...定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成8个视图的各5帧视频,整个4D优化需要20-25分钟。该模型已在Hugging Face上开源,适用于游戏开发、视频编辑、虚拟现实(VR)等场景的应用,可免费用于研究、非商业用...……更多
成都索贝数码陈智:适配媒体工艺的视频 AI 生产引擎
...,围绕“高品质、全媒体、大视听”主题,聚焦超高清、生成式人工智能等广电新质制播技术,邀请政府、行业厂商、媒体机构等单位,汇集广电机构领导和国内外知名专家、学者,从更为具体的实操层面探讨技术创新发展趋势...……更多
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...挑战中,英伟达荣获终端驾驶赛道冠军,展示了如何利用生成式AI模型来实现复杂的自动驾驶模拟。该团队开发的Hydra-MDP模型在端到端驾驶规模化类别中表现优异,超过了400多个全球参赛作品。此外,英伟达还介绍了一种名为JeDi...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...示性任务规划、长程任务规划、可操纵性判断、可操纵性生成、未来与过去预测、末端执行器位姿预测等。摘要机器人操纵的一个基本目标是使模型能够理解视觉场景并执行动作。尽管现有的机器人多模态大模型(MLLM)可以处...……更多
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;
AI应用Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。Midjourney推出Style Tuner工具,让用户自定...……更多
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
...人那里拿数据,不如发挥自己在计算力学领域的所长,去生成足够多样化的模拟数据。想到这里,三人立刻行动起来。他们合力编写程序,模拟各种不同的地层条件,由此生成了海量的地表位移数据。同时,他们也意识到这项研...……更多
小米新增超分辨率技术,仅限泊车场景,原因是算力所限?
...的超分辨率AI模型使用了深度卷积神经网络,优化了图片生成速度与多目标还原,从而生成更高质量的模型,比当前最优的超分辨率方法更快。在FLTOPS算力相当的前提下,深度卷积神经网络的超分辨率生成速度与效果都优于其他...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...循指令方面的能力有关。如果模型无法准确地遵循指令,生成CoT解释就会变得更加困难。此外,有些模型无法保持正确的回复格式,即存在所谓的「简化回复格式」问题。 ……更多
shutterstock新增“创意编辑”功能
...利用了公司对OpenAI最新技术的优先访问权,用户可使用AI生成新内容,或者对Shutterstock图库中的任何图片进行简单编辑、转换。这套“创意编辑”功能拥有6大类别,以及AI设计助手等辅助功能和号称是行业内“最先进”的滤镜等...……更多
...调,他可能很快就会在信箱里收到一封警告信。但是,在生成式AI时代,如果保护品牌的堡垒会成为品牌未来发展的阻碍,企业该如何应对?亨氏公司(Heinz)在一场颇受关注的广告宣传活动中使用人工智能研究公司OpenAI的DALL-E...……更多
市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
...是AI视频、AI图片赛道上的玩家。Sora的出现,意味着视频生成门槛大幅降低。广告、影视、短视频等行业也会有较大改变。”然而,出人意料的是,Sora的行业冲击尚未显现,美股二级市场却掀起了一股“腥风血雨”。Sora发布的...……更多
韩国科学团队研发koala人工智能图像生成模型
...,韩国科学团队近日研发了名为KOALA的新型人工智能图像生成模型,大幅降低了对硬件的需求,而且可以在2秒内生成高质量图片。该模型的关键在于采用了“知识蒸馏”(knowledgedistillation)的新技术,极大地压缩了开源图像生成...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模块,已经能生成相当合理、逼真的图像。文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金...……更多
AI为数字办公按下“加速键”
...版 》( 2024年02月07日 第 10 版)第七届世界智能大会上,生成式人工智能相关应用引发关注。 新华社记者 李 然摄1月17日,工信部就《国家人工智能产业综合标准化体系建设指南》(征求意见稿)公开征求意见。征求意见稿提出...……更多
Sora冲击波 抢人“饭碗”促生新职业?
...通用人工智能的实现近日,OpenAI正式发布了旗下首款视频生成模型Sora,引爆全球关注。据介绍,Sora可根据提示词,生成长达一分钟的短视频,同时保持视觉质量并遵守用户的提示。在业内人士看来,Sora可以大大降低视频制作的...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...型进行模态扩展,得到不仅能够处理语言,还可以理解并生成图像、音频、视频等多种信息的全模态模型,如 GPT-4o、Chameleon 等。也包含目前最为流行的开源视觉语言模型,Llama-3.2-Vision。以 Llama-3.2-Vision 为代表的大语言模型多模...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...布全新AI模型——MusicLM。通过AI模型MusicLM,文字可以直接生成高保真的音乐。这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。透过MusicLM,不难...……更多
当Sora能做真实的3D视频,离它能设计战舰也就不远了
...切换以及表情生动的多角色。其实,早在Sora之前,AI视频生成模型领域就已经打得热火朝天了。最初是Runway和Midjourney你追我赶。2023年2月初,Runway首次推出Gen-1,并在6月份开放了第二代Gen-2。Gen-2通过文本、图片、文本+图片,采...……更多
西班牙用DALL-E生成老照片,正探索联用回忆疗法治疗痴呆症患者
...十人的记忆以这种方式转化为图片。该工作室使用了图像生成模型,如 OpenAI 的 DALL-E,将人们的记忆具象化。自 2022 年以来,该工作室获得了联合国和谷歌的资助,一直在与世界各地的移民和难民社区合作,将那些从未被拍摄过...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
...新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型从训练样本中“抄袭”的...……更多
更多关于科技的资讯:
宁波市消保委发布“大路灯”比较试验结果:“适璞”落地灯电气安全项目不符合要求
中国消费者报杭州讯(记者郑铁峰)“最接近日光的照明体验”“让孩子的用眼环境更加舒适”……近年来,作为新兴的护眼灯具产品
2025-02-18 11:13:00
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
2025-02-18 11:13:00
橘子冒烟小心肺部真菌感染:大量孢子形成烟雾
快科技2月18日消息,按压橘子冒烟是咋回事?据报道,这通常是因为霉菌繁殖产生的孢子扩散。霉菌成熟后会产生大量孢子,当微小的孢子在空气中扩散时
2025-02-18 11:25:00
路遇限宽墩司机不敢开:打开智驾寻求最强外援
快科技2月18日消息,日常生活中我们开车时可能会遇到限宽墩,每当这个时候,不少新手司机都觉得眼前一黑,不敢通过。而当前新能源汽车越发加宽
2025-02-18 11:25:00
“两新”政策赋能,太原电子产品市场“热”力全开
消费日报网讯(记者 刘自昌)2025年,作为 “十四五” 规划收官与 “十五五” 规划谋划的承上启下之年,意义非凡。在这一关键节点
2025-02-18 11:32:00
30家轻工企业入选工信部实数融合典型案例
本报讯 近日,工业和信息化部公布了2024年实数融合典型案例名单,235个案例上榜。轻工行业“成绩单”亮眼,共有30家企业榜上有名
2025-02-18 11:32:00
漫评丨这些机器人企业“代言”苏州新质生产力
□秦柳青在今年总台央视春晚上,人形机器人的“赛博秧歌”实力出圈了。在苏州,人形机器人不仅能“炒菜浇花”,还能“进厂打工”
2025-02-18 11:36:00
联通数科墨攻安全运营服务平台,护航亚冬安全,彰显卓越实力
2025年2月7-14日,第九届亚洲冬季运动会在哈尔滨隆重举办,这场冰雪盛会吸引了全球目光。作为本届亚冬会的官方通信及云服务合作伙伴
2025-02-18 11:45:00
小米青年公寓内部实拍首曝!减轻北漂毕业生租房贵压力
快科技2月18日消息,日前,小米市场部管培生赵长琳(抖音、小红书昵称“二赵上道”)全网首发分享了位于北京昌平的小米青年公寓内部实拍视频
2025-02-18 11:55:00
本田:若日产社长辞职 我们愿意重启合并谈判
快科技2月18日消息,据知情人士透露,如果日产汽车公司社长内田诚卸任,本田愿意重启收购谈判,以创建世界第四大汽车生产商
2025-02-18 11:55:00
深圳70名AI公务员上岗引热议 AI能取代公务员吗:DeepSeek是这么回答的
快科技2月28日消息,日前,#深圳70名AI公务员上岗# 的话题登上热搜,引发网友关注。据报道,近日,广东深圳福田区推出了基于DeepSeek开发的AI数智员工
2025-02-18 11:55:00
两女子骑电动车走机动车道并闯红灯:被撞翻还需负全责
快科技2月18日消息,行人闯红灯被车撞,该怎么判罚?也许这个案例可以全国推广。据“公安部交通管理局”最新披露的案例显示
2025-02-18 11:55:00
全社会都能共享数据!国家公共数据资源登记平台将于3月上线
快科技2月18日消息,据央视报道,今天,国家数据局举行新闻发布会,介绍公共数据开发利用最新情况。相关负责人介绍,国家公共数据资源登记平台将于3月1日上线试运行
2025-02-18 11:55:00
SSD直奔PB时代!闪迪已在路线图中列出
快科技2月18日消息,在近日的投资者日活动上,闪迪宣布了其开发容量高达PB级固态硬盘的计划,不过遗憾的是路线图中并未公布具体的时间
2025-02-18 11:55:00
学而思今天正式发布接入DeepSeek的全新“随时问”APP
学而思今天正式发布接入DeepSeek的全新“随时问”APP。该产品深度融合DeepSeek R1智能推理,依托学而思22年教研沉淀
2025-02-18 12:01:00