我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
本文转自:解放日报
启数光轮将AIGC与仿真技术深度融合,生成映射现实世界的合成数据
为人工智能发展生产“原材料”
王闲乐
本报记者 王闲乐
随着自动驾驶、ChatGPT等名词在互联网传播,越来越多人知道了人工智能技术。那么,你知道发展人工智能技术也需要“原材料”吗?
启数光轮科技(上海)有限公司就是这样一家生产人工智能所需要的“原材料”——数据的公司。
“现在人工智能大模型迅速发展,对数据的需求特别大,整个互联网的数据加一起都不够用了。”启数光轮创始人谢晨说,这时候就需要通过合成数据来推动人工智能发展。他之所以从蔚来汽车辞职创业,正是看到了这一领域的广阔前景。
为人工智能提供海量数据
谢晨曾在英伟达、Cruise、蔚来等企业担任自动驾驶仿真负责人。在英伟达工作期间,谢晨发现,要让自动驾驶变得更安全,需要大量的训练数据。如果完全依赖于现实世界中的数据,不仅难以采集,而且存在利用率低、标注成本高和长尾场景缺乏等问题。于是,他萌生了一个大胆的想法——能不能人工合成出这些训练数据?
“比较通俗的类比是,人工智能就像我们养殖的动物,需要吃饲料才能长大。可是单靠自然界中的饲料是不够的,所以我们得想办法去自己生产一些饲料。”谢晨说,他想到的办法是将生成式人工智能(AIGC)与仿真技术深度融合。
仿真技术本身并不罕见,但单靠仿真技术生成的数据真实度、泛化性与效率较低,通俗来讲就是“不够真实”,因此无法解决现有难点,还需探索如何与生成式人工智能相结合。谢晨结合自己负责的自动驾驶业务,开始验证两种技术融合的可能性。
经过反复验证,谢晨用了5年时间,终于摸索出了生成式人工智能与仿真技术最佳融合方法,由此可以生成映射现实世界的合成数据——图像或视频,通过训练算法理解和学习现有数据便可生成3D、物理真实、可泛化的新数据。
帮助中国企业追赶特斯拉
2023年,带着自己的研究成果,谢晨毅然决定从蔚来汽车辞职创业。
“我们希望,通过合成数据的应用,助力中国汽车企业在自动驾驶技术上缩小与特斯拉的差距,甚至实现超越。”谢晨解释道,特斯拉现在在全球拥有上百万辆汽车,它们源源不断地传回数据、帮助人工智能不断优化。而中国车企掌握的数据可能只有特斯拉的百分之一,长此以往,双方的人工智能差距也会拉大。
“启数光轮可以提供海量合成数据,相当于加了一个杠杆,来填补中国车企在真实数据量上与特斯拉的差异。”谢晨说,启数光轮成立后完成的第一单业务,就很好地证明了合成数据的价值。
在业务拓展过程中,有汽车厂商告诉谢晨,企业正在研制的自动驾驶有个问题始终难以解决,就是会将路边广告牌的人物图案识别为真人进而启动刹车。如果修改识别规则,又无法鉴别真正的行人,容易造成交通事故。
“其实这里的问题就在于企业缺乏足够多的路况数据。”谢晨的团队拿下这一单,生成了数千个包含人像广告的各类场景,并从中挑选出带有精确标注的数据。这些数据随后被该车企用于算法训练,果然有效增强了自动驾驶模型的表现。
由此,启数光轮在业界崭露头角,作为一家初创企业在业内迅速打响了名气。成立一年多,就获得了四轮融资,得到了多家头部创投机构的认可。
推动人工智能相关产业发展
从在大企业做创新研发,到自主创业,谢晨坦言,这一年多的经历给了他很大挑战,也让他感到十分兴奋。
从一开始,他就给自己的新公司定了一个长远的目标:成为数据界的英伟达。对此,谢晨很有信心。“我们有一个很棒的团队,平均年龄28岁,来自合成数据、生成式人工智能、仿真等领域的优秀技术人员占比超过90%,还有商业领域的人才。”
目前,启数光轮在谢晨的主导下搭建了国际领先的合成数据产线,拥有多项国内外技术专利,为多家海内外知名自动驾驶公司、国内外主机厂提供产品交付并形成合作伙伴关系,累计服务客户几十余家,交付数据上亿帧,积累场景数百万个。
“使用合成数据训练人工智能已经是硅谷的共识,但国内对这块认识还不够。”谢晨希望,通过启数光轮的一系列成功案例,让更多人意识到合成数据的价值,推动自动驾驶、具身智能等相关产业蓬勃发展。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-05-16 09:45:13
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: