• 我的订阅
  • 头条热搜
stability邀请用户测试文本到图像生成模型
...StabilityAI近日更新其产品页面,邀请用户测试文本到图像生成模型StableDiffusion3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试,不过已经启动了早...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...消息,10月14日,Adobe在Adobe MAX大会上宣布推出Firefly视频生成模型,并强化了现有的图像、矢量和设计模型。Firefly视频模型已进入有限公开测试阶段,成为首个可安全用于商业用途的生成式AI视频模型。最新的Firefly图像模型Firefly...……更多
Stable Diffusion 动画版上线
StableDiffusion也能生成视频了!你没听错,StabilityAI推出了一款新的文本生成动画工具包StableAnimationSDK,可支持文本、文本+初始图像、文本+视频多种输入方式。使用者可以调用包括StableDiffusion2.0、StableDiffusionXL在内的所……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在...……更多
OpenAI 总裁:GPT-4 并不完美但却绝对与众不同
人工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格・布罗克曼(GregBrockman)在接受采访时表示,GPT-4并不完美,但却绝对与众不同。GPT-4在其前身GPT-3的基础上,在许多关键方面进...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...确的RGB颜色控制和多语言识别。自去年以来,文本到图像生成模型取得了巨大进展,模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。Playground Research最近发布了一篇论文,详细介绍了团队最新的、基于DiT的扩散模型Pl...……更多
字节版Sora火爆24小时,同名论文再次被热议
...ixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这样一张原图:若使用当前大多视频模型,一般只能进行到“摘墨镜”这个环节;而PixelDance能解锁时序...……更多
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;
AI应用Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。Midjourney推出Style Tuner工具,让用户自定...……更多
重磅!苹果发布AI功能测试版,未融入ChatGPT,仅面向付费开发者
...(WWDC)上,苹果介绍,Apple Intelligence基于个人场景发挥生成式人工智能(AI)模型的强大功用,深度集成于iOS 18、iPadOS 18和macOS Sequoia中,可做出多种跨App操作,同时结合个人场景,提供情景驱动通知、写作改进、图像生成等功...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...文档搜索和分析等,同时回答准确性显著提高,同时能够生成歌词、创意文本等。OpenAI表示,当任务的复杂性达到足够的阈值时,GPT-4就展现得比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。为了解这两种模型之间的差...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。其自研的MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小程序IT之家获悉,山海多模态大模型有如下特点:实时秒回,自由插话:与现实对话中人类的响应时间相...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...的相关问题。2、写作工具升级。新版iOS提供苹果的文本生成服务;同时支持AI生成邮件、信息,语音转录摘要等功能。3、视图工具升级。该版本提供更智能的图片搜索及电影回忆制作功能。仍有不少苹果在6月发布的AI功能未出...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...型,也是昆仑万维继AI绘画产品“天工巧绘”后的又一款生成式AI产品。“天工”通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。即日起,获得邀请的...……更多
2023 的人工智能之年
...总结了 2023 年人工智能领域的主要进展,重点介绍了图像生成(如 Adobe Firefly, Midjourney V.6, DALL-E 3)、视频生成(如 Stability AI, Runway Gen-2)、文本生成(如 GPT-4, Bard and Gemini)等技术。同时,……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...据报道,该公司产品发布1年,用户突破700万人,平台共生成超过7亿张图像,并获得投资者青睐。2023年12月7日,Leonardo.ai宣布获得3100万美元种子轮融资,投资方包括 Blackbird、Side Stage Ventures、Smash Capital、TIRTA Ventur……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已在Azure中推出。Phi-3模型功能强大、经济高效,并且针对个...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
速度惊人,手机跑stablediffusion,12秒出图
...化,在三星手机上成功运行StableDiffusion1.4。实现了11.5秒生成图像,重要的是,内存使用量也大幅减少。正所谓,SpeedIsAllYouNeed!论文地址:https://arxiv.org/ abs/2304.11267谷歌最新提出的方法是通用的,可以对所有扩散模型的改进,……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...于中国本土——在美国,更常见的说法是Generative AI,即生成式AI。其实,AIGC 是 Generative AI 的子集。因此在本文中,我们将用 GA 来统称这一年的生成式 AI 的进展。AI 领域还有一个名词叫做 AGI(通用人工智能),可以被理解为一...……更多
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
Sora爆火96小时国内大模型进场
...专家认为,国内企业想弯道超车难度不小查睿OpenAI“文字生成视频”大模型Sora根据提示词“纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游弋”生成的20秒视频。 视频截图 ■Sora不仅可以理解用户的需...……更多
AIGC生成图像加速度 百亿赛道将开启
...互联网巨头、AI独角兽等各行业玩家也在集体涌进AIGC图像生成赛道,如百度的文心一格、腾讯的AI画匠、蓝色光标的“创意画廊”等,企图在这场AIGC的盛宴中创造更大的市场价值。近日,英伟达在GTC大会(GPU Technology Conference)...……更多
...发现》月刊网站12月22日发表题为《人工智能对话年——生成式人工智能工具开启了一个充满希望和陷阱的新世界》的文章,作者是斯蒂芬·奥尔内斯。文章摘编如下:2023年初,大型语言模型风靡全球。可以说,聊天生成预训练...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目,正文很大,清晰易读,机器人的手在打字机上打字。 5月14日,OpenAI发布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
更多关于科技的资讯:
天玑9400性能之神!iQOO Neo10系列前瞻
今天,iQOO宣布将于11月29日16:00举行新品发布会,正式推出iQOO Neo10系列,此次发布的新品包括Neo10和Neo10 Pro
2024-11-18 18:23:00
银白战甲!华硕ROG STRIX X870-A GAMING WIFI吹雪主板图赏
快科技11月18日消息,随着AMD锐龙9000系列处理器上市,颜值性能兼具的ROG STRIX X870-A GAMING WIFI主板也已开售
2024-11-18 18:23:00
华为首款超百万豪车 博主绘制尊界S800假想图:玩灯到极致
快科技11月18日消息,说2024年广州车展上哪台车最神秘、最具话题性,那么一定非尊界品牌首车S800莫属,因为这款车虽然参展
2024-11-18 18:23:00
闲鱼注册用户已超6亿!首次将AI技术应用于闲置交易
快科技11月18日消息,在第29届联合国气候大会上的中国角边会上,闲鱼CTO陈举锋宣布平台注册用户数已突破6亿,并展示了“闲鱼AI智能体”这一AI模型
2024-11-18 18:23:00
大唐东营发电公司顺利完成2号机组同源核相、假同期并网试验
11月15日,东营发电公司顺利完成2号机组并网前同源核相、假同期试验。为确保整个试验顺利进行,继保专业提前制定同源核相
2024-11-18 18:51:00
室内充电起火 3辆电动自行车全部烧毁 夫妻俩无法逃生
据福建消防消息,11月15日21时38分,福建平潭海坛街道一居民房屋突发火灾,有人员被困。消防员迅速响应,到场后发现一楼门厅出口浓烟滚滚
2024-11-18 18:53:00
览邦Watch Ultra测评:腕上小手机,这才是该有的样子
在科技飞速发展的今天,智能手表已经从一种新兴的概念演变为众多消费者日常生活中不可或缺的伴侣。它不仅保留了传统手表的佩戴功能
2024-11-18 19:08:00
辽宁省40+高校升级5.5G:上传提升2倍 下载最快4.2Gbps
快科技11月18日消息,辽宁移动携手华为在辽宁各大高校进行5G-A网络升级行动,预计覆盖辽宁省40多所高校。目前,辽宁大学
2024-11-18 19:23:00
被蔚来抛弃的新造车:正败退上海滩
去年,合创汽车还带着全新MPV车型合创 V09,兴冲冲地参加广州车展。如今一年过后,热闹的广州车展,却没见这个广州本土品牌的身影
2024-11-18 19:23:00
全球罕见!女子腹痛查出怀孕 胎儿竟长在肝脏上
快科技11月18日消息,据报道,福建福州,一名女子因持续腹痛前往医院就诊,经过检查后惊讶地发现,原本应位于子宫内的胚胎竟然生长在了肝脏上
2024-11-18 19:23:00
孟晚舟透露华为用人评优标准:把平凡工作做到极致
快科技11月18日消息,在日前的香港中文大学(深圳)第九届研究生毕业典礼上,华为公司轮值董事长孟晚舟作为特邀嘉宾发表演讲
2024-11-18 19:23:00
【多彩新论】拆除职场“偏见围城”,释放人才活力
日前,教育部印发《关于做好2025届全国普通高校毕业生就业创业工作的通知》,要求严格落实校园招聘“三严禁”要求,即明确严禁发布含有限定985高校
2024-11-18 19:53:00
Linux Kernel 6.12正式发布!实时功能终于来了
快科技11月18日消息,Linus Torvalds在邮件中宣布推出Linux Kernel 6.12,带来了多项重大更新和新功能
2024-11-18 19:53:00
中国联通:6G 70%技术与5G重合 将有6大典型应用
时至今日,6G已经不是空中楼阁,正在从概念阶段转入原型阶段,全球统一标准也正在推进中。2024全球6G发展大会上,中国联通研究院中心总监李福昌在演讲中介绍了6G网路的六大特点
2024-11-18 19:53:00
华为将5G天线技术应用于Wi-Fi:一个设备无死角覆盖三个房间
快科技11月18日消息,陕西省企业数字化转型大会日前在西安召开。会上,陕西联通携手华为推出智企全光组网FTTO+ 2.0解决方案
2024-11-18 19:53:00