• 我的订阅
  • 科技

较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发

类别:科技 发布时间:2024-05-31 13:59:00 来源:36氪

作者 | 邓咏仪

编辑 | 苏建勋

36氪获悉,「卓印智能」获得千万级天使轮融资,由天使湾创投独家投资。

如今,随着通用大模型规模的迅速扩大,数据短缺已经成为一个更现实而迫切的问题。早在2022年11月,就有MIT等研究人员发布相关论文,指机器学习数据集可能会在2026年之前耗尽所有“高质量数据”。

AI模型需要大量高质量的训练数据,才能生成准确、多样、无偏见的输出,但获取这种数据的成本和难度都很高——因此,合成数据成为一个有效解决手段。现在,包括微软、OpenAI、Cohere在内的公司都已经开始使用合成数据来训练AI模型。

Gartner表示,在2021年,所有人工智能训练数据中只有1%是合成数据,但到2024年底,合成数据可能会达到60%。而据plug and play预测,到2030年全球合成数据市场将会达到千亿美元。

「卓印智能」(Join AI)正是基于这样的背景,于2022年成立。团队先从自动驾驶赛道切入,为客户提供高质量的合成数据服务。截至2024年5月,团队已经获得自动驾驶、机器人领域多个头部客户超2000万的订单。

和传统的训练数据获取方式相比,卓印智能选择了“全自动”路线——端到端地生成训练数据。2023年,卓印智能基于自研扩散模型和世界模型技术路线,推出了AI训练数据生成模型“Simulaix”。

Simulaix可以生成媲美真实采集效果的生成数据,并可以在生成图像过程中直接根据生成逻辑自动提取同步生成标注区域,供企业客户直接使用。截至2023年Q4,Simulaix已经成功帮助企业客户提升了10%以上的模型效果。

较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发

Simulaix生成的数据 来源:卓印智能

创始人俞开文博士有多年AI算法、技术架构经验,曾经历任蚂蚁、百度等大厂中的资深AI架构师,有丰富的大型To B项目落地经验。他告诉36氪,从数据角度,优质数据的短缺一直是困扰AI赛道的难题。

“在各式各样的AI算法研究上,训练数据的获取都需要大量时间和金钱成本,AI工程师总是为数据所困。在很多项目里甚至会用超过一半的时间来处理训练数据。”俞开文博士表示。但他认为生成式AI技术的出现会为这个行业带来质的飞跃。

此前,在以识别为主的AI 1.0时代,训练数据的获取已经是一个较为成熟的“劳动密集型”行业:企业将需求外包给数据采集、标注公司,这些公司需要用带有传感器的设备采集原始数据,经过清洗、筛选后再交给标注员对数据进行切割和标注——指出图上A部分是红绿灯、B部分是车辆等等。AI模型则通过对「带有标注信息的训练数据集」进行“学习”,才会越来越智能。

而合成数据解决方案的出现会对这一现状产生根本性影响。

首先,在成本侧,数据采集的成本将会逼近于0,数据标注的成本也会迎来大幅下降。“从我们已经落地的客户案例来看,使用合成数据后,客户的数据成本能够下降80%-90%,”俞开文博士表示。

不过,合成数据能发挥更大作用之处,在于能够增加高质量数据的供给,从而撬动更多数据需求。

以数据需求为高质量图像数据的自动驾驶为例,相比大语言模型需要的文本数据,高质量图像数据的获取受限于更多的技术和法律障碍。数字化图像的采集不仅依赖于高级的传感器技术,还必须应对版权、隐私以及跨国法规等问题。

譬如目前广泛被用户所诟病的低矮障碍物识别问题——对路面低矮的石墩、倒地的自行车等识别不准等问题,就是因为训练数据中corner case(罕见案例,即低频遇到的现场情况)大量不足所导致的。这样的数据很难通过传统的数据采集和标注来获得。

合成数据则能很好地解决这些“稀缺但重要”的场景诉求。

从技术路线上看,卓印选择了端到端生成的技术方案。简单而言,卓印智能相当于是训练了一个专用的AI大模型,用以端到端地生成合成数据,省去大部分的人工成本。

事实上,合成数据赛道在AI出现时就已经存在,主流技术路线有数据增强、仿真、数据生成等。以数据仿真的合成方式为例,此前是通过类似3D图形的引擎,构建一个虚拟的世界,在“世界”中生成自己需要的数据。

但构建这样的虚拟世界,通常需要详细的领域知识和物理模型,来确保生成数据的真实性和有效性。反映到实际使用上,现在数据仿真的方式成本还是较高,并且受限于引擎的基础能力,数据真实性也有局限。

俞开文博士表示,虽然通过生成式AI来获取合成数据的技术路线还有不少挑战,但在成本和真实性上具有独特的优越性,且随着AI技术的发展,优势将会进一步放大。

目前,卓印智能选择先在场景复杂、数据需求大的领域切入市场,来完成早期的商业拓展,比如自动驾驶、工业等赛道。俞开文博士认为,比如在具身智能等其他大模型领域,客户也会有大量高质量数据的需求,这些都是卓印所看重的方向。

本轮融资后,卓印智能将着重投入到以Simulaix为核心的交付能力提升,以及自研世界模型“Terra-1”的商业落地验证上。

卓印智能希望,能够通过模拟各式各样的图像传感器“看到的”真实世界来助力AI对现实世界的理解,用技术创新推动AI行业前进。“未来,数据将像电力一样,变得便宜、易于获取,成为推动AI发展的基石。”俞开文博士表示。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-31 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

想做企业级智能体的「AutoAgents」,获数千万元天使轮融资 | 涌现好项目
...自研Multi-Agent架构,为企业提供部署到生产环节的智能体服务商。团队介绍:杨劲松(CEO):原达摩院产品/商业化总监
2025-03-11 05:56:00
36氪首发 | 后稷数农获千万级天使轮融资,专注于高标准农田智能化产品研发
...021年,是一家以网络连接为核心的农业数字化产品和技术服务商。创始人许朋朋是一位连续创业者,曾就职海康威视,后创办了东骏科技,打造了国内最大的电动二轮车充电管理平台。2020
2022-12-15 12:36:00
本周累积融资额超17.6亿元,保碧新能源获5亿天使轮融资 | 硬氪投融资周报
...源电力 5亿人民币 天使轮保碧新能源是一家综合能源管理服务商,公司由保利资本与碧桂园创投联手孵化,利用保碧产业生态圈深耕地产和建筑场景,拓展分布式光伏、储能、充电桩及能源管理
2023-02-25 10:34:00
用大模型一站式解决企业服务难题,「安安创新」完成1500万天使轮融资|36氪首发
...安创新为国家战略创新项目,是安安智慧公益基金的指定服务商。安安公益基金与安安5A企业家智慧平台相结合,以公益发现问题,商业解决问题的方式,形成服务闭环。以高效、可持续的公益商
2023-12-19 20:07:00
「方糖星球」完成数千万元天使轮及天使+轮融资,致力于打造生态级元宇宙空间 | 36氪首发
...辑 | 苏建勋36氪获悉,近日一站式虚拟空间场景解决方案服务商“方糖星球”完成数千万元天使轮及天使+轮融资,投资方分别为新宜资本和凯辉基金,融资资金将重点用于加速创新研发及团
2023-05-23 10:37:00
赛美特获5亿元融资,一金融公司E轮融了8千万美元|硬氪纪
... 科研及技术服务4、企业服务木白科技是一家工业互联网服务商,主要针对中小制造业企业的生产管理流程提供数字化SaaS工具。其产品基于云端PaaS平台,以行业SaaS套件形式落
2023-05-06 10:24:00
36氪首发|智慧托盘服务商「普拉托」获过亿元B轮融资,累计投入托盘300万片
文|韦雯编辑|彭孝秋36氪获悉,智慧托盘服务商「普拉托」完成过亿元B轮融资。本轮融资由深圳资本集团旗下远致投资领投,睿德信资本、大合募晟跟投,老股东泰亚资本、联润基金、力合天使追
2023-06-09 10:45:00
本周累积融资额超14.35亿元,合创汽车获6亿元融资 | 硬氪融资周报
...深圳市吉运昌餐饮管理有限公司是一家专注于螺蛳粉产品服务商,致力于成为家喻户晓的螺蛳粉品牌。餐营业2、房产家居BEEPLUS,定位于高端的空间产品打造运营商,已完成在北京、上海
2023-03-04 10:54:00
12家消费公司拿到新钱,bosie创始人辞任CEO,Q1出现15个6亿+高增长品牌|创投大视野
...年内门店增长超1000家,整体闭店率不足3%。• 咖啡品牌服务商「ZR自燃元素」获5000万元Pre-A轮融资36氪获悉
2023-05-13 20:07:00
更多关于科技的资讯:
日常活跃度不高、功能相对单一,维护和优化更新成本却高昂——金融机构“断舍离” App掀起“关停潮”□南京日报/紫金山新闻记者曹丽珍买理财
2025-11-11 08:02:00
艾拓生命“全自动液态悬浮芯片检测仪”获批
艾拓生命“全自动液态悬浮芯片检测仪”获批宁企“芯”突破,检测精度高艾拓生命“全自动液态悬浮芯片检测仪”。 企业供图南报网讯(通讯员江高轩记者张希)近日
2025-11-11 08:03:00
2025“直通乌镇”全球互联网大赛颁奖宁企斩获智能终端赛道一等奖南报网讯(记者徐宁实习生黄倩)11月9日上午,2025“直通乌镇”全球互联网大赛颁奖典礼在浙江乌镇举行
2025-11-11 07:30:00
南京企业发力“双11”,消费新意多热力足即时零售增长快 “即”刻满足体验佳□南京日报/紫金山新闻记者黄琳燕 实习生黄莹“3
2025-11-11 07:30:00
中新经纬11月10日电 据国家发改委网站10日消息,国家发改委、国家数据局等十部门印发《关于推动物流数据开放互联 有效降低全社会物流成本的实施方案》(下称《方案》)提到
2025-11-11 07:34:00
GMT for Kids七赴进博会,以科技创新构筑儿童护脊新高度
2025年11月5日,第八届中国国际进口博览会(以下简称"进博会")在上海隆重举行。作为全球首个以进口为主题的国家级展会
2025-11-10 14:09:00
近日,2025年广东省职工职业技能竞赛暨“羊城工匠杯”生成式人工智能系统应用员大赛决赛在广州拉开帷幕。在这场人工智能系统应用领域的巅峰对决中
2025-11-10 14:40:00
2025中国企业全球形象高峰论坛| 完美世界总编辑伊迪:中国文化“出海” 要与世界文明“相融”
大皖新闻讯 完美世界集团是全球领先的文化娱乐产业集团,涵盖影视、游戏、电竞等板块,旗下产品遍布美、欧、亚等全球100多个国家和地区
2025-11-10 15:14:00
近日,民生银行石狮支行通过开展上门为企业客户办理开户的专项服务,将高效便捷的对公账户服务直接送到企业身边,以实际行动诠释了“诚信专业
2025-11-10 15:36:00
2025中国企业全球形象高峰论坛|小红书副总裁许磊:企业形象不仅是产品特征的物理展示
大皖新闻讯 2025年初,随着一大批海外用户的涌入,“小红书”成为沟通中国与国外网民的绝佳窗口。那么,在当前中国企业扬帆出海的背景下
2025-11-10 15:50:00
折叠屏购物新突破 荣耀x淘宝联合推出购物比价功能
随着消费电子大屏化趋势的深化,国内大屏设备市场出货量连续快速增长,折叠屏已成为市场增长的核心引擎。恰逢双十一,“如何选到高性价比的商品”是消费者的核心需求
2025-11-10 16:57:00
随着毕业季的临近,众多广州高校的应届生面临着一个共同的课题:如何选择一家既符合个人职业发展,又具备长远成长潜力的优质企业
2025-11-10 16:57:00
力纳克荣膺EcoVadis可持续发展铜牌评级,跻身全球前35%阵营
近日,全球电动推杆系统领域的头部企业——丹麦力纳克(LINAK)正式宣布,于2025年5月荣获国际公认的企业可持续发展评估机构EcoVadis授予的铜牌评级
2025-11-10 16:57:00
双十一营销大战来袭!号百公司获客宝三大核心服务让中小商户生意更轻松
年底聚餐、亲友小聚、婚庆喜宴……当全网聚焦线上大促时,线下“3公里生活圈”也已进入消费旺季。对于沿街中小商户来说,这正是抢占本地流量的黄金窗口期
2025-11-10 16:58:00
2025华为鸿蒙智家深圳启幕,任鑫朦女士助力智能家居设计创新
2025年9月2日,2025华为鸿蒙智家设计大赛·深圳站开幕礼于鹏瑞莱佛士酒店云颂音乐厅盛大启幕。本次活动以“智美融合
2025-11-10 16:58:00