• 我的订阅
  • 头条热搜
ai自给自足,用合成数据做训练
AI生成的图像太逼真,为什么不能拿来训练AI呢?可别说,现在还真有人这么做了。来自香港大学、牛津大学和字节跳动的几名研究人员,决定尝试一下能否使用高质量AI合成图片,来提升图像分类模型的性能。为了避免AI合成的...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
...绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型从...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP 的 PaLI 在各种多模态基...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...。然而,由于语义分割任务的复杂性和数据的不足,单独训练一个语义分割模型可能会面临一些挑战,例如模型过拟合、模型泛化能力不足等。为了解决这些问题,微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型中。迁移学...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...因为黑客可能会未经授权地利用图像-文本数据进行模型训练,其中可能包括个人和隐私敏感信息。最近的工作提出通过向训练图像添加难以察觉的扰动来生成不可学习样本(Unlearnable Examples),可以建立带有保护的捷径.然而,...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,构建了图像分类融合模型,通过利用在大规模数据集上训练的模型的特征表示来提升小样本数据集上的分类性能。深度迁移学习可将已经在大规模数据集上训练好的深度学习模型应用于新的任务中。在图像分类中,深度迁移学...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...ohnSchulman在接受科技播客主持人DwarkeshPatel采访时透露,后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛?四大维度深度体验基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却在现...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代,一般...……更多
谷歌在AI赛道加速
...消息,Google 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究,Google 声称,该研究将大大提高训练速度和能效,比其他方法的性能高出 13 倍,能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温,...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...提示LLM生成能解释答案的「原理」(rationale),以便用于训练模型,起到类似于CoT的作用。整个构建过程的流水线如下图所示:这种「以代码为中心」的方式不仅更容易保证图像的细节、质量和多样性,也让LLM更容易生成相关文...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...s & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以看到,MM1是一个图文的多模态大模型,参数规模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...进行联合建模的大语言模型组成。输入将图像输入经过预训练的视觉编码器 CLIP-ViT-L/14 ,以提取图像嵌入 Z ∈ R H×W×C。对于文本输入,使用经过预训练的大模型标记器对文本序列进行标记,并将其投射至文本嵌入 T ∈ R L×D 当中...……更多
google发布imagen3图像生成技术
...rtexAI的开发人员和企业客户。Google通常不会透露太多用于训练人工智能模型的数据来源,这次也不例外。这是有原因的。大部分训练数据来自网络上的公共网站、资源库和数据集。而其中的一些训练数据,特别是未经内容创作者...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...天拥挤的车道、马路上奔跑的狗等,生成写实的Corner Case训练数据,进而训练自动驾驶系统对Corner Case场景的感知能力上限。 “书生2.5”还可根据文本快速检索出视觉内容。例如,可在相册中返回文本所指定的相关图像,或是在...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...方式。而在时间差方面,「Tiamat」从2021年开始进行模型训练,以自研并自主训练底层模型的方式,始终与海外技术节点、开源社区等保持着同频。“我们拼命地想告诉大家,这件事情很快就会成为风口。”「Tiamat」创始人青柑...……更多
较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发
...之前耗尽所有“高质量数据”。AI模型需要大量高质量的训练数据,才能生成准确、多样、无偏见的输出,但获取这种数据的成本和难度都很高——因此,合成数据成为一个有效解决手段。现在,包括微软、OpenAI、Cohere在内的公...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语言模型狂飙的元年...……更多
标贝科技上亿像素点图像标注能力 实现标注精度和效率双提升
...更大像素、更高分辨率的图像以提供丰富细致的信息进行训练和推理,标注数据的规模和复杂性也随之增加。如何提高超大像素图像数据标注的效率和精度,成为当前亟待解决的问题。例如,一张超大像素的医学影像可以更好地...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量和符合用户提示...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...提供API接口的闭源经营理念不同,LLaVA1.6的代码、模型与训练数据全开源,且在标准评测数据集上跑出了较为亮眼的成绩。一、LLaVA1.6:卷上加卷LLaVA是一种端到端训练的大型多模态模型,又被称为“大型语言和视觉助手”。LLaVa-...……更多
MSRA:视觉生成六大技术问题
...满足单调关系时,扩散模型是最大似然模型。然而,实际训练中,往往并不采用这样的损失函数权重。在测试阶段,Classifier-free guidance的采用也使得优化目标不再是最大似然。在评估阶段,直接用NLL损失作为衡量指标,并不能准...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...问题,ProcessPainter 通过在合成数据和人类画师绘画视频上训练时序模型,首次实现了让扩散模型生成绘画过程。此外,不同题材、画师的绘画过程差异巨大,风格迥异。然而,目前很少有研究将绘画过程作为研究对象。论文作者...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...能力的企业望持续成为产业受益者。以ChatGPT为代表的预训练大模型加速商业化落地,将带来大量算力需求,以政府为主导的城市智能计算中心AI算力卡国产化进度较快,建议关注华为昇腾生态圈核心厂商。ChatGPT等AI产业化的落地...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统、预测未来变化和制定决策规划...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多...……更多
...理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全球开源行业文本类数据集总量仅约1.2万亿字节。“这次开源的行业数据集,几乎每一项都...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...三维重建的过程。由于可以利用大量的 2D 图像数据进行训练,这类模型往往能够生成多样化的结果。但又因为 2D 扩散模型的 3D 先验能力不足,这类模型对 3D 世界的理解能力有限,容易生成几何结构不合理的结果(比如有多个...……更多
更多关于科技的资讯:
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-08-27 09:52:00
黑神话悟空背后140人:华科校友带队,核心团队平均合作超10年
一只黑吗喽引爆全世界,在座的都是天命人。国内首款顶级3A大作《黑神话:悟空》一上线,就创下诸多纪录,不仅快速成为多平台销量榜首
2024-08-27 09:52:00
49位科学家上榜,清华方璐、复旦周鹏等获得科学探索奖
今年获奖年龄平均 41 岁。今天,第六届科学探索奖获奖名单正式公布,共 49 位青年科学家获奖。科学探索奖设立于 2018 年
2024-08-27 09:53:00
合合信息:智能文档处理技术助力大学生探索AI创新边界
谈“糖”色变、追求养生、低卡生活……这些热门词汇频频在社交媒体上掀起讨论热潮。有这样一批年轻人不但捕捉到了这些词汇背后真实的用户需求
2024-08-27 10:45:00
36氪研究院 | 2024年中国烤鱼行业消费者洞察报告
烤鱼发源于川渝地区,历史悠久,是我国传统美食之一。历经百年发展,烤鱼逐渐形成腌、烤、炖三种有机结合的烹饪手法,口味也由最初的麻辣拓展至番茄
2024-08-27 11:11:00
4名MIT学霸两年造AI编程帝国,撼动全球2600万开发者!成立2年估值4亿美金
【新智元导读】4名MIT本科生创业,才两年公司就已经估值4亿美元。开发AI编码助手Cursor的Anysphere,最近在A轮融资中已经筹集超6000万美元
2024-08-27 11:55:00
数学系本科生卧室手搓「核聚变反应堆」,Claude 3.5立大功!0基础,狂肝1个月
【新智元导读】前段时间,Claude 3.5帮助右手骨折工程师一周肝出3000行代码。现在,又有00后数学系本科生借助AI
2024-08-27 12:02:00
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
【新智元导读】微调的所有门道,都在这里了。开源,就要开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发
2024-08-27 12:03:00
打破AlphaFold大模型局限,世界最大蛋白质相互作用数据集AlphaSeq横空出世
【新智元导读】虽然AlphaFold等系列的大模型已经在蛋白质预测方面取得了前所未有的突破,但依旧无法胜任蛋白质-蛋白质相互作用(PPI)这种复杂的任务
2024-08-27 13:32:00
脑机接口“升级”赛博人类!AI挑战燃爆《天府工匠》第三季
当前,我国人工智能产业蓬勃发展,在给各领域注入发展驱动力、促进产业转型升级的同时,也为加快形成新质生产力提供了重要支撑
2024-08-27 13:38:00
特斯拉CEO马斯克呼吁加州加强AI监管,市场关注国际贸易动态
特斯拉与AI监管:马斯克的倡议特斯拉(TSLA)首席执行官埃隆·马斯克(Elon Musk)周一在社交媒体上再次表达了他对人工智能(AI)监管的坚定立场
2024-08-27 13:38:00
第二十六届中国机器人及人工智能大赛全国决赛(宜兴)圆满结束
8月25日,第二十六届中国机器人及人工智能大赛全国决赛(宜兴)圆满结束。来自清华大学、哈尔滨工业大学、浙江大学、国防科技大学
2024-08-27 13:38:00
每年节约上亿元!法大大“音视频双录”助力深圳营商环境优化
8月26日,深圳经济特区迎来44周岁。深视新闻栏目推出系列报道,首篇便聚焦改革,并重点呈现了“音视频双录签名模式”如何帮助营商环境优化
2024-08-27 11:00:00
《逆水寒》手游玩家自创智能NPC突破500万!超过100个国家人口
近日,国内知名MMO游戏《逆水寒》手游上线了开创性的“自捏AI江湖友人”玩法,短短3天收件,玩家自创的智能NPC就突破了500万
2024-08-27 11:00:00
SpaceX首次私人太空行走任务推迟:火箭氦气泄漏
快科技8月27日消息,据媒体报道,SpaceX公司在其社交平台上发布推文,备受瞩目的“北极星黎明”(Polaris Dawn)任务将因技术原因微调日程
2024-08-27 11:00:00