• 我的订阅
  • 头条热搜
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
Google的下一个主要人工智能模型已经到来,以对抗来自 OpenAI 的新产品的夹击。本周三,Google 发布了 Gemini 2.0 Flash,该公司称其除文本外,还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务,使其能够接入 Goo...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...e Information 的一篇文章。这篇文章透露,OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升,因为高质量文本和其他数据的供应量正在减少,原本的 Scaling Law(用更多的数据训练更大的模型)可能无以为继...……更多
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
...悉,这回跟谷歌saybyebye的,是文生图核心团队——AI绘画模型 Imagen论文的四位核心作者,出走目的是要搞自己的AI公司。虽然公司名称暂未对外公布,但新公司将一以贯之的路线是很清楚的:以Imagen为基础,沿着原来的项目做下...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
...,跌1.91%,总市值1.70万亿美元。就在本月初,谷歌为其AI模型Gemini推出了图像生成器工具,允许用户通过输入提示来创建图像。但在过去一周中,网友们发现,该工具似乎在有意避免生成包含白人的图像,并在图像中加入了过量...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
最强开源文生图模型一夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流...……更多
谷歌人工智能模型gemini生成人物图像存在问题
2月25日,据报道,谷歌公司的人工智能(AI)模型Gemini在生成人物图像时存在一些问题,用户反馈该模型无法准确地生成白人形象。尽管Gemini能够根据文字快速生成各种各样的人物形象,并且输入关键词“高兴的黑人”时也没有...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...独家财务顾问。本轮融资额将用于继续打磨产品和自研大模型,拓展商业化能力等。数月前,「Tiamat」已经获得由DCM独家领投的数百万美元天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。...……更多
...维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。 过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引...……更多
新ai模型发布:设计圈看了心慌慌
...搬运了朱俊彦团队的新成果,一个能将2D草图一键变成3D模型的新算法,却意外引发设计圈盆友们的热烈转发讨论。配文全是“沃日”、“???”……简单来说,这个模型能让非常粗糙的简笔画,一键变成逼真3D模型。还支持实...……更多
英伟达推出全新文生图ai模型
...昨日(7月29日)发布声明,联合推出安全的商业文生图AI模型,能够在6秒时间内生成4张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。图源:英伟达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
...森林实验室。一亮相就kuku发了一个系列、共3款图片生成模型,其中有2个开源。而且支持中文输入。效果怎么样?看过的网友称很狂野(wild)!输入提示词,一次测试出了画面效果和人脸数据等安全措施:一名十多岁戴着滑雪...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
AIGC生成图像加速度 百亿赛道将开启
...大众画出各种天马行空的画作,背后离不开大量深度学习模型的不断完善。这其中,CLIP模型基于海量互联网图片进行训练,促进了AI绘画模型的组合创新。另外,Diffusion扩散化模型的引入也实现了算法创新,最终使用潜空间降维...……更多
Meta开源多感官人工智能模型,整合文本、音频视觉等六类数据
Meta公司发布了一个新的开源人工智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...。据介绍,新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后续是否收费未知),并且每个提示都会生成四个图像。此前,Meta图像生成模型因...……更多
不写代码、靠“玩” ChatGPT 年入百万,提示工程师正变成硅谷新宠
...万美元一年。提示工程师的主要职责是帮助训练大型语言模型 ( LLM ) ,让 AI 能更好的理解需求,完成专业任务。简而言之,他们的任务就是将一个复杂的任务拆分,提炼成长度有限的自然语言,来一步步查询 AI 工具,从而获得...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...自新加坡南洋理工大学 S-Lab 团队提出结构化隐空间扩散模型(Structured Latent Diffusion Model)的三维数字人生成新范式 StructLDM。该范式包括三个关键设计:结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型...……更多
...智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实际上很难落地。对于成都恒图来说,则是先找到行业需求,瞄准图像处理这个场景,再去用技术为行业赋能。竞逐文生视频新赛道,这家川企...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
更多关于科技的资讯:
杭州六小龙 第一个IPO即将诞生
继 DeepSeek 和宇树科技之后,又一家来自杭州的科创企业群核科技于近日走到台前,迎来了关键时刻。近日,群核科技递交了港股招股书
2025-02-26 19:05:00
禁止电竞选手2月23日洗澡冲上热搜!到底什么情况
快科技2月26日消息,今天下午,微博热搜上出现了一个看起来颇为奇怪的词条“禁止电竞选手2月23号洗澡”,并且一度冲上了第一的位置
2025-02-26 19:05:00
RTX 50/40/30大量黑屏变砖!救命的BIOS、驱动来了
快科技2月26日消息,RTX 50系列发布之后,不少玩家遇到了黑屏、变砖的问题,无法再点亮,不仅波及RTX 5090(D)
2025-02-26 19:05:00
汽车应急车道违停 被一只半挂轮胎追尾 司机懵了
快科技2月26日消息,近日,杭州公安高速交警接到一起奇特的车辆报警。一位驾驶员称自己停在应急车道的车子,竟被一只轮胎“追尾”了
2025-02-26 19:05:00
曾为驾驶爱好者白月光!新款别克君威GS实车展示
快科技2月26日消息,曾几何时,别克君威GS还是很多年轻人梦想中的运动型家用车,然而随着新能源的到来,2.0T高性能发动机已经无法满足他们的胃口
2025-02-26 19:05:00
响应小于1秒、唤醒识别超98%!岚图自研AI语音对话系统即将发布
快科技2月26日消息,岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力
2025-02-26 19:05:00
国补政策落地“满月”,点燃十堰数码产品“换新潮”
十堰广电讯(全媒体记者 蒋巍)自1月20日起,手机等3C数码产品购新补贴政策正式实施,“国补”政策落地满月,十堰的数码产品销售市场态势如何?数码产品迎来换新潮2月25日
2025-02-26 19:24:00
三星计划2030年实现1000层NAND!使用长江存储专利技术
快科技2月26日消息,随着NAND闪存技术竞争日益激烈,三星电子公布的路线图显示,计划到2030年开发出1000层的NAND闪存
2025-02-26 19:35:00
ROG魔盒WIFI7电竞路由器首发1999元:9个2.5G网口
快科技2月26日消息,华硕带来了ROG魔盒 WIFI7电竞路由器。首发到手价为1999元。ROG魔盒 WIFI7电竞路由器机身融入了大量ROG元素
2025-02-26 19:35:00
旅游公司招募太空旅行者:门票一人400多万 近两年席位已售罄
快科技2月26日消息,据媒体报道,近日,在湖北一商场内,一家旅游公司悬挂出太空旅行的乘客招募广告。该广告宣称,这场太空旅行面向普通市民开放
2025-02-26 19:35:00
DeepSeek凭借其开源、低成本、高性能等优势,掀起人工智能领域的新一轮热潮。作为平安集团金融科技生态圈的重要组成部分
2025-02-26 19:44:00
股价暴涨4倍后,博士眼镜实控人再减持,“AI眼镜第一股”含金量如何?
博士眼镜股价暴涨但业绩下滑,欲靠加盟拓展门店? 来源|时代商业研究院作者|陈佳鑫编辑|韩迅【导语】AI眼镜是人工智能最热门的赛道之一
2025-02-26 20:02:00
男子在高速上恶意别停他车 还威胁辱骂女司机让网友看怒:官方通报
2月26日消息,近日,有网友发视频称,重庆高速上一男子开丰田车在高速上恶意别停后车,并且还辱骂后车女司机。按照女司机的陈述
2025-02-26 20:05:00
游戏本天花板!微星泰坦18 Ultra AI/龙魂典藏版发布:满血RTX 5090、96GB大内存
快科技2月26日消息,在今天的新品发布会上,微星正式发布了泰坦18 Ultra AI和龙魂典藏版旗舰游戏本。核心配置上
2025-02-26 20:05:00
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
开源模型,还是得看杭州。前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型Wan 2.1,14B参数直接屠榜VBench
2025-02-26 20:05:00