• 我的订阅
  • 头条热搜
stability邀请用户测试文本到图像生成模型
...StabilityAI近日更新其产品页面,邀请用户测试文本到图像生成模型StableDiffusion3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试,不过已经启动了早...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在...……更多
OpenAI 总裁:GPT-4 并不完美但却绝对与众不同
人工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格・布罗克曼(GregBrockman)在接受采访时表示,GPT-4并不完美,但却绝对与众不同。GPT-4在其前身GPT-3的基础上,在许多关键方面进...……更多
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;
AI应用Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。Midjourney推出Style Tuner工具,让用户自定...……更多
重磅!苹果发布AI功能测试版,未融入ChatGPT,仅面向付费开发者
...(WWDC)上,苹果介绍,Apple Intelligence基于个人场景发挥生成式人工智能(AI)模型的强大功用,深度集成于iOS 18、iPadOS 18和macOS Sequoia中,可做出多种跨App操作,同时结合个人场景,提供情景驱动通知、写作改进、图像生成等功...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...文档搜索和分析等,同时回答准确性显著提高,同时能够生成歌词、创意文本等。OpenAI表示,当任务的复杂性达到足够的阈值时,GPT-4就展现得比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。为了解这两种模型之间的差...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。其自研的MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...的相关问题。2、写作工具升级。新版iOS提供苹果的文本生成服务;同时支持AI生成邮件、信息,语音转录摘要等功能。3、视图工具升级。该版本提供更智能的图片搜索及电影回忆制作功能。仍有不少苹果在6月发布的AI功能未出...……更多
2023 的人工智能之年
...总结了 2023 年人工智能领域的主要进展,重点介绍了图像生成(如 Adobe Firefly, Midjourney V.6, DALL-E 3)、视频生成(如 Stability AI, Runway Gen-2)、文本生成(如 GPT-4, Bard and Gemini)等技术。同时,……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...据报道,该公司产品发布1年,用户突破700万人,平台共生成超过7亿张图像,并获得投资者青睐。2023年12月7日,Leonardo.ai宣布获得3100万美元种子轮融资,投资方包括 Blackbird、Side Stage Ventures、Smash Capital、TIRTA Ventur……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已在Azure中推出。Phi-3模型功能强大、经济高效,并且针对个...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...于中国本土——在美国,更常见的说法是Generative AI,即生成式AI。其实,AIGC 是 Generative AI 的子集。因此在本文中,我们将用 GA 来统称这一年的生成式 AI 的进展。AI 领域还有一个名词叫做 AGI(通用人工智能),可以被理解为一...……更多
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
Sora爆火96小时国内大模型进场
...专家认为,国内企业想弯道超车难度不小查睿OpenAI“文字生成视频”大模型Sora根据提示词“纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游弋”生成的20秒视频。 视频截图 ■Sora不仅可以理解用户的需...……更多
...发现》月刊网站12月22日发表题为《人工智能对话年——生成式人工智能工具开启了一个充满希望和陷阱的新世界》的文章,作者是斯蒂芬·奥尔内斯。文章摘编如下:2023年初,大型语言模型风靡全球。可以说,聊天生成预训练...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目,正文很大,清晰易读,机器人的手在打字机上打字。 5月14日,OpenAI发布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便...……更多
shutterstock新增“创意编辑”功能
...利用了公司对OpenAI最新技术的优先访问权,用户可使用AI生成新内容,或者对Shutterstock图库中的任何图片进行简单编辑、转换。这套“创意编辑”功能拥有6大类别,以及AI设计助手等辅助功能和号称是行业内“最先进”的滤镜等...……更多
AIGC工具测评:生成式AI的产品表现如何
过去这一年,全球涌现出了众多生成式AI产品。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。2023年,AI技术迎来了其发展史上的一次重大飞跃。随着技术突破和...……更多
谷歌gboard手机输入法测试ai新功能
...,谷歌似乎会在安卓版Gboard手机输入法中集成文本到图像生成器。外媒反编译了谷歌上传到Play商店的GboardBeta版应用(12.7.05.507749191),发现代码中有一些字符串引用了“ImagenKeyboard”。备注:Imagen是谷歌的文本图像模型,号称仅...……更多
苹果智能为iPhone、iPad和Mac引入强大的生成式模型
...d和Mac的个人智能化系统AppleIntelligence,基于个人场景发挥生成式模型的强大功用,结合用户情况提供有助益且相关的智能化功能。AppleIntelligence深度集成于iOS18、iPadOS18和macOSSequoia中,充分运用Apple芯片对语言和图像的理解与创作..……更多
英伟达超快stylegan回归
扩散模型的图像生成统治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T,一下子在网上火了。无论是在星云爆炸中生成一只柯基:还是基于虚幻引...……更多
苹果将在ios18中推出一系列新功能
...能回应框架及在苹果设备上运行的LLM技术,以此提升响应生成能力。未来,Siri生成回复和摘要时,能综合考虑人名、公司信息、日历事件、地点、时间等多重因素,使互动更加贴合实际情境。此前,有外媒报道了Safari18、AjaxLLM...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...开发商Moreh完成2200万美元B轮融资Zero123++:从单一图片,生成多张从不同角度看这个物体或场景的图像Anthropic AI发布论文,表示大模型存在“拍马屁”问题大事件高通骁龙峰会,新品碾压英特尔苹果10月25日,高通骁龙峰会推出了...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法,共提供超300套照片模板,用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照;此外,一个月前火爆全网的全民舞王应用也迎来上新,用户可...……更多
MWC联发科展台速览:端侧AI和移动通信黑科技有突破
...题的展厅,吸引了众多行业专家和媒体关注。特别是现场生成式AI技术演示,令众多与会者纷纷争相体验。 实时AI视频生成展示人气爆棚来到展会现场,今年联发科不仅重点展出了很多端侧生成式AI技术的创新应用,包括SDXLTurbo...……更多
更多关于科技的资讯:
我国科学家在钠离子层状氧化物正极材料研究上取得重要进展
IT之家 8 月 21 日消息,燕山大学于 8 月 19 日发布新闻稿,表示和中科院物理所合作,在钠离子层状氧化物正极材料中取得重要进展
2024-08-22 09:39:00
遭遇网络攻击:芯片大厂微芯被迫缩减运营!
8月21日消息,据媒体报道,美国芯片制造商Microchip(微芯)近日遭受网络攻击,导致其部分系统被迫关闭,运营规模缩减
2024-08-22 09:39:00
音质更出众的运动搭子:韶音新一代运动耳机OpenRun Pro 2首发评测
看到这篇文章的你,请起身活动一下。很多人上班一坐就是一整天,长此以往势必会影响身体健康,毕竟咱们还要“干到65岁”才能退休呢
2024-08-22 09:41:00
摩托罗拉 Moto G55 5G 手机渲染图曝光
IT之家 8 月 22 日消息,消息源埃文・布拉斯(Evan Blass,@evleaks)昨日(8 月 21 日)发布系列推文
2024-08-22 09:43:00
华为Pura 70 Pro+获得中国电信天通终端性能评测五星综合第一
在通信科技日新月异的今天,华为再次以技术创新引领行业潮流。8月21日,2024中国电信终端洞察报告(总第20期)显示,华为最新旗舰机型Pura 70 Pro+在通话短信时延
2024-08-22 09:43:00
摩托罗拉 Edge 50 Neo 手机偷跑:天玑 7300 芯片
IT之家 8 月 21 日消息,科技媒体 ytechb 昨日(8 月 20 日)发布博文,分享了摩托罗拉 Edge 50 Neo 手机的最新渲染图
2024-08-22 09:43:00
27款人形机器人齐聚「WRC 2024」,既能写毛笔、干家务,还可以做搬运和质检|最前线
8月21日,2024世界机器人大会(以下简称「WRC 2024」)在北京正式开幕。此次大会以“共育新质生产力 共享智能新未来”为主题
2024-08-22 09:44:00
LE WL Pocket无线监听耳返系统测评:直播、K歌、媒体创作最佳搭档
在当今数字化与互联网普及的时代背景下,直播和多媒体创作的需求日益增长,而专业的音、视频设备则成为提升工作效率和内容质量的关键
2024-08-22 09:44:00
华为迎来四则新消息:折叠屏、新机、激活率、官翻机都来了
对于华为手机来说,这几年真的是迎来了很多的改变,从一开始的风光无限到后来被限制,然后又进行突破,这一系列的变化都太大了
2024-08-22 09:44:00
造电池比造火箭更难:谁挡住了马斯克?
特斯拉迄今为止唯一一次“电池日”举办在2020年9月,由于疫情原因,电池日比原定日期推迟了5个月,参会者的防护措施也很新颖——坐在停车场的电动车里观看活动
2024-08-22 09:48:00
首个家庭国际象棋机器人来了!抓鹌鹑蛋都不会破
8月21日,2024世界机器人大会在北京隆重召开。商汤科技旗下家用机器人品牌“元萝卜SenseRobot”家族全系产品集体亮相
2024-08-22 09:49:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行
2024-08-22 09:49:00
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-08-22 09:50:00
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段
2024-08-22 09:51:00
养老机器人真来了!国产顶流泡茶喂猫练咏春,帮十亿人做家务
新智元报道编辑:编辑部【新智元导读】就在今天,国产顶流AI机器人星尘智能的Astribot S1秀真机了!在世界机器人大会上
2024-08-22 09:51:00