• 我的订阅
  • 科技

聚焦产业级多模态大模型研发,清华团队「生数科技」完成近亿元天使轮融资 | 36氪首发

类别:科技 发布时间:2023-06-19 09:03:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

36氪获悉,近日AI创企“生数科技”完成了近亿元的天使轮融资。此轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前企业估值已达1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。

成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应用产品开发。团队成员主要来自清华大学人工智能研究院,前瑞莱智慧副总裁唐家渝出任首席执行官。

热潮席卷半年以来,大模型赛道的竞争壁垒变与不变共存。唐家渝认为,不变的是底层算法能力依然是企业的核心壁垒所在,“文本、图像应用虽然火热,但不可控性仍然很大,对用户意图、精确细节的把控有很大的欠缺,3D、视频等多模态的生成效果距离真正可商用也还有较大的距离,这意味着底层算法的迭代仍有较大的空间”。

但渐渐产生变化的是算法和工程相结合的能力,即训练大模型的全栈能力的重要性越发凸显。“不少人都可以用现成的开源模型做finetune,但目前开源模型的能力天花板仍不高。”唐家渝表示,“而拥有从0到1构建大模型能力的话,能在吸纳开源社区精华的同时,从底层更快更有效地优化模型表现。而且训练过程中存在很多的坑,只有真的懂底层原理,才能尽可能地避坑,既拥有对模型底层的深刻理解又拥有实际从0到1训练大模型经验的团队目前是很稀缺的。”

另外多模态作为发展趋势已成为行业共识,与大语言模型(LLM)不同,多模态大模型的研究仍然处于初步阶段,国内外的研究进度并没有形成代际差。唐家渝表示,这对国内团队而言是抢占大模型赛道的重要机会。

现阶段发展多模态的核心难点之一在于构建一套通用架构对图像、视频、语音等不同模态进行统一的建模。唐家渝告诉36氪,市面上不少的大模型宣称拥有多模态能力,但实际上是多个单模态或跨模态模型的“排列组合”,简单集成不同模型能力,而非在底层上将多模态进行真正的打通和融合。

“这不是真正的智能”,他打了个比方,“人类在与世界的交互过程中,能同时对不同模态间的信息进行理解和学习,虽然通过眼睛、耳朵、嘴巴、四肢等不同器官来获取和表达信息,但只用一个大脑来进行中转思考。声音、视觉、动作等多模态信息同时输入和输出,人类才能够将一个事物或者概念认识和表达得足够准确。”另外,在“排列组合”的模式下,通常需要训练承载不同跨模态任务的多个模型,从成本经济的角度也不是最优解。

生数科技团队于2023年初开源了基于Transformer的多模态扩散大模型Unidiffuser,使用U-ViT的Transformer架构首次在Diffusion Model(扩散模型)上实现多模态,实现基于一个底层模型高质量地完成文生图、图生文、图文联合生成、图文改写等多种生成任务。唐家渝介绍,Unidiffuser前期训练所用数据量达到了20多亿,目前公司自研中的全新大模型所用训练数据量达到了百亿级别。

再往前追溯,生数团队对多模态生成式模型的探索最早开始于2013年,在清华实验室阶段,团队早期成员就开始了生成式模型理论基础、高效学习和推理算法,以及音乐生成、人脸合成等多方面的研究工作。

自2020年扩散模型应用于图像生成领域以来,生数团队也是业内首批开展扩散概率模型基础理论和算法研究的队伍,于ICML、NeurIPS、ICLR等顶会发表扩散概率模型领域相关论文20余篇。团队先后推出自研的无训练推理框架Analytic-DPM、全球最快采样算法DPM-Solver,被DALL-E 2、Stable Diffusion等国际项目所采用。

目前,生数科技正在研发的产业级多模态大模型仍处于快速迭代阶段,但在图像生成、3D内容生成、视频生成等任务中已经实现高水平的生成效果。

例如,团队研发了业内首个实现基于三视图自动生成3D内容的技术,以及无需任何3D训练数据的文生3D内容技术。目前该模型的3D生成效果已接近产业级应用水平,并领先Shap-E(OpenAI)、DreamFusion(Google)、Magic3D(NVIDIA)等主流模型。其次,唐家渝表示,图像生成已超过Stable Diffusion最新版基础模型水平,预计将于年内赶超Midjourney最新版本。

在商业模式的探索上,生数科技坚持模型层与应用层两条腿同时走路。唐家渝表示,基于开源模型开发应用类产品能够让非专业领域的普通公众快速上手创作,偏向娱乐性的玩法能带来一定的用户基础,快速验证技术价值,但同时也要兼顾高价值的关键场景,例如产品设计、游戏制作、影视制作等专业领域,专业化、细节精确程度越高,对效果质量和可控性也提出更高要求,这需要与行业机构在场景、数据方面开展合作,结合底层模型的架构优化,进一步提升模型的专有能力。

因此,基于自研产业级多模态大模型,生数科技目前正面向图像创作、3D资产创建等细分场景打造垂类应用,服务范围覆盖C、B两端。面向C端用户,生数科技将为普通用户和专业创作者打造供图像创作助理,提供个性化的服务。面向B端用户,将为机构企业、垂直领域的技术服务商提供通用服务。目前,生数科技已与多家游戏厂商、设计平台建立初步合作,应用级产品也将于近期推出。

AIGC时代已经全面开启。唐家渝表示,生数科技希望通过打造领先的具备丰富模态感知与生成能力的AI产品,使每个人都能够从简单枯燥的任务和专业化工具的使用束缚中解放出来,不论是专业还是非专业人士都能将心中所想快速、自动化地实现,通过解放想象力进而提升创造力和生产力。

以下是投资方投资人观点:

蚂蚁集团:预训练模型、扩散模型等关键算法和模型的出现与演进推动了生成式AI的快速发展。生数团队在生成式模型、扩散模型、大模型研发探索与科研人才储备上具备坚实的基础,同时学术与产业深度融合的背景,也赋予了团队贯穿从底层技术研发到产品应用落地的独特能力。我们相信生数团队能够在这波AI浪潮中突围而出,同时也期待团队能够不断开拓多模态大模型的技术边界和应用场景,成为中国生成式大模型领域的佼佼者。

BV百度风投:多模态是大模型的重要发展方向且正处于高速发展阶段,未来有望在更广、更深的层面影响社会生活的多个领域,创造巨大的产业价值。大模型发展要取得突破需要对底层算法原理有深入理解,同时需要具备广泛的专业知识和经验,生数团队在深度生成式模型基础理论和算法研究方面拥有深厚的积累,同时创始团队在大模型研发能力、工程化能力和产品化创新能力等方面具有经验优势。我们对团队未来发展充满信心,也希望团队在扩散模型和多模态大模型方向上取得更多的突破和成就。

卓源资本:AIGC正在走向真实落地,这一过程需要保持对前沿技术的探索和深刻理解。生数科技孵化自是国内最顶尖的机器学习基础理论研究团队,在贝叶斯模型、高效算法和概率建模等方面拥有系统深入的研究成果,为团队在生成式大模型领域的工作开展提供了重要的底层支撑,同时也为团队构筑起领先的竞争优势。期待在团队的科研背景、创新精神以及对多模态发展的深入理解等多方优势的驱动下,生数团队在未来能快速实现令人瞩目的发展。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-19 12:46:00

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI数字人服务商「FOCO」获数千万元天使轮融资,创新工场领投 | 36氪首发
...基于自研AI算法,FOCO能通过AI技术实现生成并驱动拥有多模态交互能力的数字人。首先,在数字人的生成端,FOCO正在研发可以通过文字
2023-06-06 19:49:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和
2024-03-14 15:12:00
奇绩创坛2023春季路演日:60个项目,超一半与大模型相关,企服项目占比第二
...轮智能开创性的将生成式AI与仿真技术深度融合,提供多模态、高质量、大规模、低成本的合成数据,弥补AI时代的数据缺口。 团队介绍:团队成员在合成数据、生成式AI、仿真等领域均
2023-06-06 09:39:00
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研
2024-03-21 05:19:00
中国首个高一致性、高动态性视频大模型发布
...数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。
2024-04-29 11:26:00
...了来自奇绩创坛的种子轮融资。清昴智能创始团队来自于清华计算机系,在边缘计算和模型自动压缩方向有十余年积累;创始人关超宇曾获清华大学研究生特奖,在研究生期间主导开源了首个自动图
2023-06-25 08:51:00
融资超25亿元,他们的目标和OpenAI很像
...和突破。”“我们希望拥有应用于多场景、多任务甚至跨模态的技术,因此不会把模型局限在具体的任务、场景,甚至垂直的行业里。”张鹏表示,面向应用行业的大模型在现阶段可以使企业赚到钱
2023-11-13 07:44:00
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山
2024-09-24 14:21:00
...方面,公司原有产品的AI功能主要基于Bert模型以及其他多模态模型开发。目前,及时语已接入新的大型语言模型,并在此基础上开发了包括邮件内容自动生成、多轮对话、智能质检、智能知
2023-06-26 10:11:00
更多关于科技的资讯:
2274台!河北省国和投资集团有限公司国庆车展销量刷新同期纪录
图为活动现场。河北新闻网讯(吴建春)国庆黄金周期间,河北省国和投资集团有限公司(简称“国和公司”)成功举办“石家庄国和裕华汽车园省直员工购车盛典”大型车展
2025-10-11 20:06:00
浪潮智慧科技深耕标准建设:3项主导数字山东技术规范成功获批
近日,山东省大数据局正式下发《关于发布〈矿产资源数据治理规范〉等11项数字山东技术规范的公告》,其中由浪潮智慧科技主导编制的《智慧渔业养殖系统建设规范》《数字孪生机场模型构建规范
2025-10-11 10:24:00
长白时评评论员 杨飞近日,陕西西安等地出台政策,全面暂停网约车“一口价”等低价营销行为,严禁任何形式的价格欺诈和恶意压价
2025-10-11 10:47:00
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)集护眼、通透、高刷新率于一体的天马 “天工屏”;“全球最窄四等边设计”的手机屏幕……今年以来
2025-10-10 08:28:00
2025河北国际工业设计周活动观察:全球智慧赋能未来智造
全球智慧赋能未来智造——2025河北国际工业设计周活动观察9月20日,2025河北国际工业设计周主会场活动在雄安新区举行
2025-10-10 08:40:00
工信部日前公布首批制造业数字化转型促进中心建设主体名单,太原福莱瑞达物流设备科技有限公司入选。制造业数字化转型促进中心是国家落实产业数字化战略的核心公共服务载体
2025-10-10 08:42:00
10月9日,从太原第二热电厂获悉,为全力保障太原市冬季供热安全稳定,持续提升供热服务质效,太原二热秉持“早谋划、早部署
2025-10-10 08:43:00
齐鲁晚报·齐鲁壹点客户端 李孟霏在刚刚过去的国庆中秋“双节”,山东移动威海乳山分公司移动社区营销团队实现品牌口碑与业务发展的双赢
2025-10-10 11:07:00
优优绿能(301590)成立于2015年,是国内直流充电桩模块领军企业之一,2024年在国内充电模块市占率达16%,位居行业第二
2025-10-10 23:06:00
恒润达生信披“迷雾”:“消失”的研发总监与首席科学家?
除研发核心人员离职或在外创办同行业企业外,上海恒润达生生物科技股份有限公司(下称“恒润达生”)招股书对研发团队人员信披的真实性
2025-10-10 23:06:00
互联网贷款普及后,不少初次接触的用户常因平台选择难、流程不熟悉犯愁。其实只要按步骤操作执行,安全又高效,下面由榕易有钱为大家梳理了几项关键步骤
2025-10-10 11:34:00
从志愿翻译到时装新星 河南姑娘在非洲书写青春与梦想
大河网讯 非洲大陆,机遇与挑战并存。越来越多的中国人选择在这里扎根创业,为当地发展注入新活力。毕业于河南工业大学的何方方便是其中之一
2025-10-10 12:11:00
姜杰秀:心中有梦,创业有方,用执着与努力让喜龙果出海
鲁网10月10日讯“我父亲就是做农副产品加工的,从小受父亲的熏陶,我对农副产品加工就有别样的情愫。于是,我就在农副产品加工上有了梦想
2025-10-10 13:56:00
中新经纬10月10日电 “市说新语”微信号10日消息,近日,国家市场监管总局(国家标准委)批准发布一批重要国家标准,涉及助老扶幼
2025-10-10 14:06:00
解锁工业自动化密码,威图与易盼2025IAS硬核破圈瞬间
"新质驱动、高端引领、数智赋能" ,2025中国国际工业博览会聚焦新工业新经济,旨在拉开加快构建一流产业生态,开启智能制造新时代的帷幕
2025-10-10 14:59:00