• 我的订阅
  • 头条热搜
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...同时提升生成质量。具体来说,Magic3D可以在40分钟内创建高质量3D网格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion。图像-文本模型生成 主要代表作有Flamingo、VisualGPT。Flamingo 是Dee……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
openai推出shap・e基于文本数秒内生成高质量3d模型
...els)的模型不同,可以生成具有细粒度纹理和复杂形状的高质量3D资产。OpenAI展示了Shap・E的结果,例如一碗食物,一只企鹅,一只体素化的狗,一个篝火,一把鳄梨形的椅子等。整个图片可以在几秒内完成渲染。附相关名词解...……更多
Sora爆火96小时国内大模型进场
...频数据。OpenAI利用Dall-E 3中的标题生成技术,为视频生成高质量的文本标题,以此提高文本和视频数据之间的对齐度。在大规模训练过程中,Sora展示了一些“涌现的模拟能力”,如三维一致性、长距离连贯性、物体持久性以及与...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...一个30B参数的Transformer模型,可以从单个文本提示,生成高质量的高清图像和视频,视频为1080P、16秒、每秒16帧。一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示,它就可以可控性生成和...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费级GPU上运行。除了免费、开源,该模型还注重保护创作者版权,在数据训练中尽力避免伦理道德问题。论文透露,Stable Audio Open是StabilityA...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...视频数据生成详细的、贴合内容的描述,进而构建海量的高质量视频文本对,使得训练出的模型指令遵循度高。最后值得一提的是,智谱 AI 自研了一个将文本、时间、空间融合起来的 transformer 架构,该架构没有采用传统 cross att...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...频生成: Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐,而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒,而且Meta还表示,它们的音频模型可以生成任意长度视频的连贯音频...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视频片段,并将这些视频片段逐层插值得到最终的视频片段。这个工作引起脸书、谷歌...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...型模型架构 ——LLaMA-Omni,它可以实现与 LLM 的低延迟、高质量交互。 论文:https://arxiv.org/pdf/2409.06666 代码:https://github.com/ictnlp/LLaMA-Omni 模型:https://huggingface……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...用VAE进行解码以重建视频。数据视频生成模型训练需筛选高质量视频数据,以学习真实世界动态。但视频可能因人工编辑或拍摄问题而不准确。为此,团队开发了负面标签来识别和排除低质量视频,如过度编辑、运动不连贯、质...……更多
stability邀请用户测试文本到图像生成模型
...on3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试,不过已经启动了早期预览计划,用户可以访问该页面提交相关信息,加入等待名单,从而在正...……更多
Meta 公司发布 Imagine Yourself AI 模型
...粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练的 CLIP 补丁编码器提取身份信息,并通过并行交叉注意模块将其与文本提示整...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...SOTA开源模型。用户喜好打分结果如下:Hunyuan3D-1.0在保证高质量、多样化生成之外,推理性能也大幅提升,显著减少了3D资产生产的耗时。“3D生成技术今年已进入快速发展阶段”推出Hunyuan3D-1.0的同时,腾讯混元3D大模型也正在落...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...确保每个子模型有效地从数据中学习并有助于整体性能。高质量合成数据混元团队开发了一套完整的高质量数据合成流程,主要包括四个步骤:指令生成、指令进化、回答生成和回答过滤。在指令生成阶段,混元团队使用高质量...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。(根据文字描述生成的产品) 值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允许用户自己上传或从一系列预加载的示例中选择图像,...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...重信息检索和摘要。通过人工标注精心生成了超过1100对高质量的长依赖问答对,以满足长依赖性要求。这些问答对经过了严格的交叉验证,从而得到了对大型语言模型(LLMs)长依赖能力的精确评估。LooGLE基准数据集仅包含2022年...……更多
大语言模型,实现智能客服知识库自动扩写功能
...板的动态框架,利用多轮迭代不断优化和改进,最终实现高质量的知识扩展。知识点扩充的技能也可以用于实现相似问句的自动生成。实现方法可以包括:构建知识图谱:收集与给定知识点相关的所有信息,构建知识图谱,包括...……更多
重磅!国产AI写作模型比ChatGPT强1000%,360前员工AI团队取得重大突破
...说,只需要在输入框内输入创作需求,就可一键生成一篇高质量的长文本内容,超过当前市场上的所有热门AI写作产品。更重要的是,这不是简单粗暴的数字堆砌,而是去除了“AI味”的结构完整、逻辑清晰、深度专业的内容。...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...避免仅只有原始词条。知识图谱的结构化特性有助于生成高质量指令,通过逻辑拆解和语义关系合成提升大语言模型的自然语言理解和推理能力。此外,指令的合成和语义对齐使小参数量模型达到接近或超越更大参数模型的效果...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...于为视频数据生成高度吻合的文本描述,进而构建了海量高质量视频文本对,提升了指令遵循度。清影的第三个特点是内容连贯性,能够比较好地还原物理世界当中的一些运动的过程。例如基于这张大家熟悉的杜甫画作,清影让...……更多
2023 的人工智能之年
...下载。Mixtral 8x7B:Mistral AI 还推出了 Mixtral 8x7B,这是一个高质量的稀疏专家混合模型(SMoE),拥有开放权重和总计 46.7B 的参数,代表了在提高真实性和减少偏见方面模型开放性的新阶段。Yi-34B llm:今年估值达到 10 亿美元,李...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...笔!正如其名字一样,Sana能以惊人速度合成高分辨率、高质量,且具有强文本-图像对其能力的模型。而且,它还能高效生成高达4096×4096像素的图像。项目主页:https://nvlabs.github.io/Sana/论文地址:https://arxiv.org/abs/2410.10629……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...模块,基于此构建了 Charades-FIG、DiDeMo-FIG 和 ActivityNet-FIG 高质量细粒度 VCMR 基准,以推动细粒度 VCMR 研究发展。图 1:a) 粗粒度 VCMR 中,因查询文本简单,存在许多潜在正匹配(绿色),但这些时刻未被标注,导致真实标注不合...……更多
三星自研大模型Gauss发布,引发业界关注,目前仅内部使用
...深度学习技术,能够理解和模拟人类语言,从而自动生成高质量的文本内容。无论是新闻报道、广告文案,还是科技论文、小说创作,只要用户提供基本的关键词或主题,Gauss就能迅速生成符合要求的文本内容。这一功能无疑将...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...,显著提升视频生成模型的文本指令响应能力。模型架构高质量的标注数据准备完毕后,可灵大模型又是如何获得模拟物理世界特性与概念组合的能力呢?在整体架构设计上,可灵采用了目前火热的 Diffusion Transformer (DiT) 。传统...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...上之前所用的视觉创意、数据和代码作为prompt,生成多个高质量的除了为每个问题生成答案,作者还提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:...……更多
更多关于科技的资讯:
天玑9400性能之神!iQOO Neo10系列前瞻
今天,iQOO宣布将于11月29日16:00举行新品发布会,正式推出iQOO Neo10系列,此次发布的新品包括Neo10和Neo10 Pro
2024-11-18 18:23:00
银白战甲!华硕ROG STRIX X870-A GAMING WIFI吹雪主板图赏
快科技11月18日消息,随着AMD锐龙9000系列处理器上市,颜值性能兼具的ROG STRIX X870-A GAMING WIFI主板也已开售
2024-11-18 18:23:00
华为首款超百万豪车 博主绘制尊界S800假想图:玩灯到极致
快科技11月18日消息,说2024年广州车展上哪台车最神秘、最具话题性,那么一定非尊界品牌首车S800莫属,因为这款车虽然参展
2024-11-18 18:23:00
闲鱼注册用户已超6亿!首次将AI技术应用于闲置交易
快科技11月18日消息,在第29届联合国气候大会上的中国角边会上,闲鱼CTO陈举锋宣布平台注册用户数已突破6亿,并展示了“闲鱼AI智能体”这一AI模型
2024-11-18 18:23:00
大唐东营发电公司顺利完成2号机组同源核相、假同期并网试验
11月15日,东营发电公司顺利完成2号机组并网前同源核相、假同期试验。为确保整个试验顺利进行,继保专业提前制定同源核相
2024-11-18 18:51:00
室内充电起火 3辆电动自行车全部烧毁 夫妻俩无法逃生
据福建消防消息,11月15日21时38分,福建平潭海坛街道一居民房屋突发火灾,有人员被困。消防员迅速响应,到场后发现一楼门厅出口浓烟滚滚
2024-11-18 18:53:00
览邦Watch Ultra测评:腕上小手机,这才是该有的样子
在科技飞速发展的今天,智能手表已经从一种新兴的概念演变为众多消费者日常生活中不可或缺的伴侣。它不仅保留了传统手表的佩戴功能
2024-11-18 19:08:00
辽宁省40+高校升级5.5G:上传提升2倍 下载最快4.2Gbps
快科技11月18日消息,辽宁移动携手华为在辽宁各大高校进行5G-A网络升级行动,预计覆盖辽宁省40多所高校。目前,辽宁大学
2024-11-18 19:23:00
被蔚来抛弃的新造车:正败退上海滩
去年,合创汽车还带着全新MPV车型合创 V09,兴冲冲地参加广州车展。如今一年过后,热闹的广州车展,却没见这个广州本土品牌的身影
2024-11-18 19:23:00
全球罕见!女子腹痛查出怀孕 胎儿竟长在肝脏上
快科技11月18日消息,据报道,福建福州,一名女子因持续腹痛前往医院就诊,经过检查后惊讶地发现,原本应位于子宫内的胚胎竟然生长在了肝脏上
2024-11-18 19:23:00
孟晚舟透露华为用人评优标准:把平凡工作做到极致
快科技11月18日消息,在日前的香港中文大学(深圳)第九届研究生毕业典礼上,华为公司轮值董事长孟晚舟作为特邀嘉宾发表演讲
2024-11-18 19:23:00
【多彩新论】拆除职场“偏见围城”,释放人才活力
日前,教育部印发《关于做好2025届全国普通高校毕业生就业创业工作的通知》,要求严格落实校园招聘“三严禁”要求,即明确严禁发布含有限定985高校
2024-11-18 19:53:00
Linux Kernel 6.12正式发布!实时功能终于来了
快科技11月18日消息,Linus Torvalds在邮件中宣布推出Linux Kernel 6.12,带来了多项重大更新和新功能
2024-11-18 19:53:00
中国联通:6G 70%技术与5G重合 将有6大典型应用
时至今日,6G已经不是空中楼阁,正在从概念阶段转入原型阶段,全球统一标准也正在推进中。2024全球6G发展大会上,中国联通研究院中心总监李福昌在演讲中介绍了6G网路的六大特点
2024-11-18 19:53:00
华为将5G天线技术应用于Wi-Fi:一个设备无死角覆盖三个房间
快科技11月18日消息,陕西省企业数字化转型大会日前在西安召开。会上,陕西联通携手华为推出智企全光组网FTTO+ 2.0解决方案
2024-11-18 19:53:00