• 我的订阅
  • 头条热搜
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
Google的下一个主要人工智能模型已经到来,以对抗来自 OpenAI 的新产品的夹击。本周三,Google 发布了 Gemini 2.0 Flash,该公司称其除文本外,还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务,使其能够接入 Goo...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...e Information 的一篇文章。这篇文章透露,OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
...,跌1.91%,总市值1.70万亿美元。就在本月初,谷歌为其AI模型Gemini推出了图像生成器工具,允许用户通过输入提示来创建图像。但在过去一周中,网友们发现,该工具似乎在有意避免生成包含白人的图像,并在图像中加入了过量...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
最强开源文生图模型一夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流...……更多
谷歌人工智能模型gemini生成人物图像存在问题
2月25日,据报道,谷歌公司的人工智能(AI)模型Gemini在生成人物图像时存在一些问题,用户反馈该模型无法准确地生成白人形象。尽管Gemini能够根据文字快速生成各种各样的人物形象,并且输入关键词“高兴的黑人”时也没有...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型...……更多
...维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。 过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引...……更多
英伟达推出全新文生图ai模型
...昨日(7月29日)发布声明,联合推出安全的商业文生图AI模型,能够在6秒时间内生成4张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。图源:英伟达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
...森林实验室。一亮相就kuku发了一个系列、共3款图片生成模型,其中有2个开源。而且支持中文输入。效果怎么样?看过的网友称很狂野(wild)!输入提示词,一次测试出了画面效果和人脸数据等安全措施:一名十多岁戴着滑雪...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...。据介绍,新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后续是否收费未知),并且每个提示都会生成四个图像。此前,Meta图像生成模型因...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...自新加坡南洋理工大学 S-Lab 团队提出结构化隐空间扩散模型(Structured Latent Diffusion Model)的三维数字人生成新范式 StructLDM。该范式包括三个关键设计:结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型...……更多
...智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实际上很难落地。对于成都恒图来说,则是先找到行业需求,瞄准图像处理这个场景,再去用技术为行业赋能。竞逐文生视频新赛道,这家川企...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
2023 的人工智能之年
...风格或纹理应用于文字和短语。Midjourney:Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑,它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本,Midjourney V.6,引入了额外的增强功能,如更精准的提示...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...上了一步台阶,可以向公众发布以供广泛使用。以大语言模型(large language models,以下简称“LLM”)为基础的 text-to-X(文本到任意)技术再在2022年有了突破性进展,分别在 text- to-image(文本到图片)、AI-generated-text(AI 生成……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...Leonardo.ai官网功能方面,Leonardo.ai是基于Stable Diffusion开源模型建立,集成插件支持AI生图、改图、扩图和3D素材生成。因操作简单,界面友好,用户评价它是“简单版Stable Diffusion”,具有较高的性价比。Leonardo.ai精选模型(Fine……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...—更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发布ChatGPT的API功能以来,该公司现在已拥有超过2...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
更多关于科技的资讯:
送100辆车被指责拉人头套路多 周鸿祎正式道歉
快科技2月22日消息,今天,周鸿祎因送100辆车活动被吐槽套路多而正式道歉。他坦诚地表示:“对不起,我错了,我想公开给我的粉丝道个歉
2025-02-22 16:01:00
18岁小伙在鳌太线失联10天后幸存 付费8万 救援者:收费为震慑
快科技2月22日消息,据媒体报道,日前一名18岁小伙在穿越秦岭鳌太线时失联多日,最终获救。被发现时,他已4天未进食,身上还带有伤痕
2025-02-22 17:01:00
Intel酷睿Ultra 5 230F处理器评测:高频率低功耗 办公首选
一、前言:新一代主流处理器 NPU开始普及Intel酷睿Ultra 200S系列处理器上市以来,以高端酷睿Ultra 9 285K
2025-02-22 17:01:00
小米手环丢外面一年竟还能充电 雷军:质量是小米的生命线
快科技2月22日消息,前两天,小米举行了质量奖表彰大会,这是集团内部质量最高荣誉,专门奖励在追求卓越质量和体验中做出突出贡献的团队
2025-02-22 17:31:00
白蚁咬烂上海百年楼板 女子一脚踩穿跌落到楼下邻居家
快科技2月22日消息,据国家应急广播报道,近日,上海万航渡路中行小区发生了一件令人惊愕的离奇事件,而背后的“元凶”更是让人意想不到
2025-02-22 18:01:00
200斤女生cos石矶娘娘被小孩当真:美不需要被定义
2月22日消息,据媒体报道,《哪吒之魔童闹海》爆火后,电影中“石矶娘娘”这一角色因形象和台词圈粉无数。陕西90后女生身披粉红披肩
2025-02-22 18:01:00
全球最薄折叠屏!OPPO Find N5缺货严重:8999元供不应求
快科技2月22日消息,OPPO周意保表示,感谢大家对OPPO Find N5的喜欢和支持,一上班就在讨论紧急加单的事情
2025-02-22 18:01:00
替身女演员受伤 《漂白》剧组致歉:演员已康复
2月22日消息,据媒体报道,有网友发布视频称,在电视剧《漂白》拍摄现场,替身女演员头部疑似被车撞到。对此,电视剧《漂白》官方微博发文表示
2025-02-22 18:31:00
DeepSeek回答存多少钱有安全感:最低标准是存够3-6个月的生活开支
快科技2月22日消息,有网友问Deepseek:存多少钱会有安全感呢?DeepSeek给出答案:最低标准是存够3-6个月的生活开支作为应急基金
2025-02-22 19:01:00
比传统豪车更舒适更安全 尊界S800自主黑科技有多牛
当我们谈豪华车时,常常会想到精致的内饰、经典的动力系统、出色的驾驶体验。然而这些传统的“豪华”标准如今正被一种全新的定义所取代——智能化
2025-02-22 19:01:00
全球最薄折叠屏!OPPO Find N5下周首销:8999元起
快科技2月22日消息,OPPO京东自营店显示,OPPO Find N5将于2月26日上午10点正式发售,起售价是8999元
2025-02-22 19:31:00
回忆杀!盘点手机厂商整过的影像狠活:如今再也看不到了
如今,手机正在成为普通人唯一的拍摄工具,相比于相机,它更为轻便、操作简单,再加上出色的软件算法,拍摄的照片基本无需后期就有着非常不错的效果
2025-02-22 19:31:00
全球开发者先锋大会:宇树科技机器人“遛”机器狗,移动数字人融合DeepSeek
用大模型产品短短几秒生成可视化图表,与数字人对话交流获得信息……AI技术如同一把智慧的钥匙,用科技的力量重塑着人们工作生活的方式
2025-02-22 20:11:00
今年伊始,DeepSeek大模型凭借强大的自然语言处理和逻辑推理能力迅速火爆全球。目前,阳光保险已完成了DeepSeek-R1模型私有化部署
2025-02-22 20:24:00
2025年智能手表「零差评」双王评测:学生党&商务精英闭眼入指南
在科技飞速发展的今天,智能手表已经成为了许多人日常生活中不可或缺的一部分。无论是学生党还是商务精英,智能手表不仅能提升生活便利性
2025-02-22 20:26:00