• 我的订阅
  • 头条热搜
stablediffusion3:文字渲染能力大升级
那个和Midjourney打得难舍难分,引发了一波买显卡“炼丹”“炼妹子”风潮的StableDiffusion,又推出船新版本了。就在昨天晚上,StabilityAI在官网来了一波更新,预告了一波 StableDiffusion3 。根据介绍,新版本在多主题提示、图片质...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...LLM, Triton, Nemo Megatron 等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 Di.……更多
...力,包括广告、网络营销等降本的领域,还有短剧创造、文字IP类等相关领域。(文中观点仅供参考,不构成投资建议,投资有风险,入市需谨慎。)(记者 董湘依 制作 赵晨羽 郑铮 宅男财经出品)(更多报道线索,请联系本文作者:...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...立带来了3段完全由大模型生成的视频。未来,输入一段文字或一个完整描述就可以生成一段视频,人物的服饰、发型、场景可预先设定,保持视频内容的连贯性和一致性,“我们会在很短时间内发布为大家提供服务的文生视频...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...据处理系统,能够混合处理图像与视频数据。该系统包括文字检测、转景检测、美学打分、动作检测、准确度检测等多个维度的功能,进一步提升视频画质。其次,模型引入了多模态大语言模型(Decoder-only MLLM)作为文本编码器...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...至发稿申请仍未通过审核。官网信息显示,天幕主要具备文字生成视频、已有视频风格化处理、文字生成背景音乐、视频配乐、文字生成音效、文字生成图片,以及图片生成图片等7项能力。以市场最受关注的文生视频为例,天...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...;2、图像大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更...……更多
英伟达推出全新文生图ai模型
...更多支持和帮助:更高水平的详细提示,可让图像更符合文字提示。更长的提示:支持更复杂、更长的提示,最多250个单词。先进的镜头控制:更好地控制镜头类型和景深输出。作为更新的一部分,公司还推出了AI修图功能,让...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视频生成模型 PixelDance 和 Seaweed惊艳、惊喜、目眩神迷……在深圳站城市巡展上,火...……更多
边缘大模型狂飙落地!清华系GPGPU惊艳WAIC,解读“六边形战士”处理器
...示的AI PC适配了通义千问的7B模型,在文生文的演示中,文字对话的生成速度很快,能满足基本的办公、生活需求。在文生图演示中,现场基于加速卡适配的是Stable Diffusion模型,因此仅支持英文输入,据现场工作人员介绍,目前...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...hnell]也超越了Midjourney v6.0、DALL·E 3等更大的模型。FLUX.1在文字生成、复杂指令遵循和人手生成上具备优势。以下是其最强的专业版模型FLUX.1[pro]生成图像示例,可以看到即使是生成大段的文字、多个人物,也没有出现字符、人手...……更多
进击的AI PC:全产业链共同推动,带领市场走向回暖
...U和GPU上挤了牙膏,但在AI性能上却带来了大幅度的提升,升级了XDNA NPU,AI算力从10TOPS来到了16TOPS,整体的算力也从33TOPS增加到了39TOPS。在今年,则会带来新一代“Strix Point”处理器,除了CPU/GPU的升级外,其NPU将升级到XDNA 2...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...来的那种超强版本。而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。至于几何精细度和图片还原度等方面的效果嘛,先小放一段用新工具生成3D模型的视频,大家直观感受一下:在官宣新品之余,VAST又带来...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...生图和文生视频等视觉生成模型中,负责处理文本、理解文字的文本编码器起着关键作用。目前行业中大部分的视觉生成模型的文本编码器,适配的主要是上一代语言模型。 混元视频生成是业界适配最新一代大语言模型 MLLM (M...……更多
Sora震撼发布 开启视频生产新模式 浦银安盛投资解决方案迎接AI新热潮
...视频为代表的多模态内容生产,加速内容制作端生产效率升级。尤其对于游戏、影视、营销等多行业都会带来降本增效、降低行业门槛等长远影响。”在各类大模型推动下,AIGC产业发展不断提速。根据艾瑞咨询预测,2028年我国A...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...技术报告。腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型,不仅在定量指标上达到开源模型的先进水平,而且轻量版生成高质量3D资产只需10秒,标准版也将文/图生成3D资产的耗时缩至45秒内。 两个...……更多
Sora为何没能诞生在中国?
...但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布文字生成视频的大模型Sora。根据简单几句提示,Sora便能准确“理解”文本,生成长达60秒的视频,引发全球关注。一些业内人士将Sora的问世称为视频生成领域的“ChatGPT 时...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...业模式不确定性等挑战。在宋教授看来,尽管ToC市场吸引力大,但ToB领域因成本效益和应用深度,展现出更大的商业潜力。数字人处于快速发展中,不仅在形象创造上不断进步,也在向更复杂的动作、情感交互等方向探索。展望...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外,第四批国产AI大模型备案获批,14款大模型及产品获得备案审批,备案企业已经从以大厂、AI厂商、AI研究机构为主,快速覆盖到了各个垂直行...……更多
Stable Diffusion 3来了!100%理解提示词,不仅能生成文字,还涌现出物理能力了?
...一个报刊亭,在报刊亭的顶部,我们看到 \"它来了!\"的文字。背景是一场大雨即将来临。)Prompt:A horse balancing on top of a colorful ball in a field with green grass and a mountain in the background……更多
国潮启航于AI生成式视频
本文转自:中国新闻出版广电报又一波网络新潮——文字自动生成视频技术(Sora)来袭。不仅国外有Sora生成的作品呈现,国内首部文生视频AI动画片《千秋诗颂》也于近日在央视面世。科技与传统文化实现“梦幻联动”,《春...……更多
国产“Sora”亮相中关村,文生视频相关个股有哪些
...悄然降临,部分行业或将加速变革此前的2月16日,OpenAI的文字生成视频模型--Sora首次面世。该模型可以根据所输入的prompt(提示词),直接输出最高长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...模型基于跟Sora类似的DiT架构,在架构设计上进行了多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现;采用统一的全...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...整地运行各种大模型,无论你需要生成的图片多么精致、文字多么复杂,给予一定的时间都可以完成,而且这个时间正在快速缩短,因此在内容生产力的AIGC创作方面,PC仍旧是不二之选。虽然PC的便捷性不如手机,但如今的笔记...……更多
A股龙年“开门红”,沪指涨1.56%,多只Sora概念股涨停
...指出,AI主要有4大受益产业链:电子板块:AI大模型不断升级,AI芯片、HBM芯片、AI服务器、光模块光芯片及交换机等相关产业链持续受益,看好重点受益产业链。整体来看,电子基本面逐渐改善,AI大模型持续升级,AI给消费电...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...直、推近、拉远四种。在图生视频中,我可以为图片添加文字描述,如果不知道写什么也可以空着,或是让系统随机生成一个提示词。首先我尝试了一组动物场景的提示词,第一个为:一只蓝猫在猫爬架上,正在吃主人递过来的...……更多
我国自研视频大模型面向全球上线
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分...……更多
Sora将改写什么
...视频平台的内容发布要求。“匹配自如”。Sora不仅能让文字迅速成片,而且能根据情况生成与各种设备匹配的画面,宽屏视频、竖屏视频以及其他比例的视频,都能得到匹配。这也使得Sora能适应不同设备,满足各类用户的观看...……更多
智源研究院发布FlagEval“百模”评测结果
...正在缩小与头部闭源模型的能力差距,而长尾视觉知识与文字识别以及复杂图文数据分析能力仍有提升空间。评测结果显示,OpenAI GPT-4o-2024-11-20与字节跳动Doubao-Pro-Vision-32k-241028先后领先于Anthropic Claude-3-5-sonnet-20……更多
更多关于科技的资讯:
自动驾驶赛道2025年将迎“爆发期”:“无人化”成主旋律
被业界公认为新能源汽车“下半场”关键一环的高阶自动驾驶,在2025年开年阶段依旧火热,有关车辆投运、测试、技术发布等动作频频出现
2025-01-15 13:54:00
18元起!《黑神话》官方周边开卖:衣服、挂件等多品类覆盖
快科技1月15日消息,今日,《黑神话:悟空》开发商游戏科学正式发布衍生品品牌“黑神话BlackMyth”。据介绍,黑神话BLACKMYTH是游戏科学100%自主出品
2025-01-15 13:54:00
曾称“特斯拉自动驾驶杀人”:前华为高管苏箐时隔四年再次开麦
“如果一定要找一个对标对象,我会选择FSD。”对标特斯拉不稀奇,稀奇的是,这话是苏箐说的。没错,就是2021年锐评“特斯拉自动驾驶杀人”
2025-01-15 13:54:00
朝日超爽啤酒携知名纸模型品牌TERADA MOKEI推出「酷玩限定版」
潮酷迎新年作为拥有潮酷基因的朝日超爽啤酒,其凭借敏锐的市场洞察力和不懈的创新精神,近期推出了「酷玩限定版」包装,以独特的创意和潮酷的品牌形象
2025-01-15 14:05:00
欧洲经济研究院院士来自全球自愿组成的学术性、非营利性、非政府性组织。学院的会士来自于斯坦福大学、普林斯顿大学、麻省理工学院
2025-01-15 14:21:00
男子捡到“白酒” 喝完抢救21天 医生:喝的是防冻液
1月15日消息,据媒体报道,一名62岁男子在路边捡到一瓶不明液体,外观与白酒无异,因本人喜好喝酒,于是便将其喝下了肚。没想到喝完后行走不稳
2025-01-15 14:24:00
全球首次!中国科学家让大肠杆菌实现光合作用
1月15日消息,大肠杆菌作为人和动物肠道的正常居民,一般生活在暗无天日的环境中。而中南林业科技大学教授刘高强团队联合江南大学教授刘立明团队成功在大肠杆菌中构建人工光合系统(人工叶绿体)
2025-01-15 14:24:00
小米国补正式上线!至高2000元:第一波开启区域公布
快科技1月15日消息,今天,雷军、卢伟冰陆续发文宣布,2025年小米国补已经正式上线。现在购买指定家电产品,至高还可获得2000元补贴
2025-01-15 14:24:00
联想:全球每三台激活的Windows电脑中 就有一台是我们的
快科技1月15日消息,目前,全球每三台激活的Windows电脑中,就有一台是联想电脑。近日联想集团执行副总裁、智能设备业务集团(IDG)总裁Luca Rossi接受媒体采访时表示
2025-01-15 14:24:00
乐道高管回应强制员工购车:本意良好的购车政策被误解
快科技1月15日消息,针对近期关于乐道汽车强制员工购车的传闻,乐道汽车用户运营及服务运营负责人夏庆华作出回应。夏庆华指出事件起因是一位店长在与员工互动时方式不当
2025-01-15 14:24:00
中新经纬1月15日电 题:人工智能将进一步赋能产业变革作者 刘典 复旦大学中国研究院副研究员随着科技的迅猛发展,人工智能(AI)作为一项颠覆性的技术
2025-01-15 14:35:00
在当今全球宏观环境充满不确定性的背景下,国内经济正面临前所未有的下行压力。面对这一挑战,“坚定信心,稳住经济”成为了众多企业的共同心声
2025-01-15 14:38:00
河北新闻网讯(苏畅)近日,“路演中国”2025上市公司投资者关系创新峰会暨第八届中国卓越IR颁奖盛典举行,新奥股份荣获“最佳路演中国奖”和“最佳ESG奖”两项大奖
2025-01-15 14:40:00
Steam如何赚取更多收益
Steam作为全球最大的视频游戏数字发行平台,拥有庞大的用户基础和丰富的游戏库。对于开发者和商家来说,Steam不仅是一个发布游戏的理想平台
2025-01-15 14:41:00
判判机器人携智能作业批阅一体机,闪耀人工智能+教育论坛
2025年1月11日,备受瞩目的“中小学人工智能与教育创新论坛”在上海成功举办。本次论坛以“数据赋能,AI助力教育”为主题
2025-01-15 14:42:00