• 我的订阅
  • 科技

聚焦产业级多模态大模型研发,清华团队「生数科技」完成近亿元天使轮融资 | 36氪首发

类别:科技 发布时间:2023-06-19 09:03:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

36氪获悉,近日AI创企“生数科技”完成了近亿元的天使轮融资。此轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前企业估值已达1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。

成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应用产品开发。团队成员主要来自清华大学人工智能研究院,前瑞莱智慧副总裁唐家渝出任首席执行官。

热潮席卷半年以来,大模型赛道的竞争壁垒变与不变共存。唐家渝认为,不变的是底层算法能力依然是企业的核心壁垒所在,“文本、图像应用虽然火热,但不可控性仍然很大,对用户意图、精确细节的把控有很大的欠缺,3D、视频等多模态的生成效果距离真正可商用也还有较大的距离,这意味着底层算法的迭代仍有较大的空间”。

但渐渐产生变化的是算法和工程相结合的能力,即训练大模型的全栈能力的重要性越发凸显。“不少人都可以用现成的开源模型做finetune,但目前开源模型的能力天花板仍不高。”唐家渝表示,“而拥有从0到1构建大模型能力的话,能在吸纳开源社区精华的同时,从底层更快更有效地优化模型表现。而且训练过程中存在很多的坑,只有真的懂底层原理,才能尽可能地避坑,既拥有对模型底层的深刻理解又拥有实际从0到1训练大模型经验的团队目前是很稀缺的。”

另外多模态作为发展趋势已成为行业共识,与大语言模型(LLM)不同,多模态大模型的研究仍然处于初步阶段,国内外的研究进度并没有形成代际差。唐家渝表示,这对国内团队而言是抢占大模型赛道的重要机会。

现阶段发展多模态的核心难点之一在于构建一套通用架构对图像、视频、语音等不同模态进行统一的建模。唐家渝告诉36氪,市面上不少的大模型宣称拥有多模态能力,但实际上是多个单模态或跨模态模型的“排列组合”,简单集成不同模型能力,而非在底层上将多模态进行真正的打通和融合。

“这不是真正的智能”,他打了个比方,“人类在与世界的交互过程中,能同时对不同模态间的信息进行理解和学习,虽然通过眼睛、耳朵、嘴巴、四肢等不同器官来获取和表达信息,但只用一个大脑来进行中转思考。声音、视觉、动作等多模态信息同时输入和输出,人类才能够将一个事物或者概念认识和表达得足够准确。”另外,在“排列组合”的模式下,通常需要训练承载不同跨模态任务的多个模型,从成本经济的角度也不是最优解。

生数科技团队于2023年初开源了基于Transformer的多模态扩散大模型Unidiffuser,使用U-ViT的Transformer架构首次在Diffusion Model(扩散模型)上实现多模态,实现基于一个底层模型高质量地完成文生图、图生文、图文联合生成、图文改写等多种生成任务。唐家渝介绍,Unidiffuser前期训练所用数据量达到了20多亿,目前公司自研中的全新大模型所用训练数据量达到了百亿级别。

再往前追溯,生数团队对多模态生成式模型的探索最早开始于2013年,在清华实验室阶段,团队早期成员就开始了生成式模型理论基础、高效学习和推理算法,以及音乐生成、人脸合成等多方面的研究工作。

自2020年扩散模型应用于图像生成领域以来,生数团队也是业内首批开展扩散概率模型基础理论和算法研究的队伍,于ICML、NeurIPS、ICLR等顶会发表扩散概率模型领域相关论文20余篇。团队先后推出自研的无训练推理框架Analytic-DPM、全球最快采样算法DPM-Solver,被DALL-E 2、Stable Diffusion等国际项目所采用。

目前,生数科技正在研发的产业级多模态大模型仍处于快速迭代阶段,但在图像生成、3D内容生成、视频生成等任务中已经实现高水平的生成效果。

例如,团队研发了业内首个实现基于三视图自动生成3D内容的技术,以及无需任何3D训练数据的文生3D内容技术。目前该模型的3D生成效果已接近产业级应用水平,并领先Shap-E(OpenAI)、DreamFusion(Google)、Magic3D(NVIDIA)等主流模型。其次,唐家渝表示,图像生成已超过Stable Diffusion最新版基础模型水平,预计将于年内赶超Midjourney最新版本。

在商业模式的探索上,生数科技坚持模型层与应用层两条腿同时走路。唐家渝表示,基于开源模型开发应用类产品能够让非专业领域的普通公众快速上手创作,偏向娱乐性的玩法能带来一定的用户基础,快速验证技术价值,但同时也要兼顾高价值的关键场景,例如产品设计、游戏制作、影视制作等专业领域,专业化、细节精确程度越高,对效果质量和可控性也提出更高要求,这需要与行业机构在场景、数据方面开展合作,结合底层模型的架构优化,进一步提升模型的专有能力。

因此,基于自研产业级多模态大模型,生数科技目前正面向图像创作、3D资产创建等细分场景打造垂类应用,服务范围覆盖C、B两端。面向C端用户,生数科技将为普通用户和专业创作者打造供图像创作助理,提供个性化的服务。面向B端用户,将为机构企业、垂直领域的技术服务商提供通用服务。目前,生数科技已与多家游戏厂商、设计平台建立初步合作,应用级产品也将于近期推出。

AIGC时代已经全面开启。唐家渝表示,生数科技希望通过打造领先的具备丰富模态感知与生成能力的AI产品,使每个人都能够从简单枯燥的任务和专业化工具的使用束缚中解放出来,不论是专业还是非专业人士都能将心中所想快速、自动化地实现,通过解放想象力进而提升创造力和生产力。

以下是投资方投资人观点:

蚂蚁集团:预训练模型、扩散模型等关键算法和模型的出现与演进推动了生成式AI的快速发展。生数团队在生成式模型、扩散模型、大模型研发探索与科研人才储备上具备坚实的基础,同时学术与产业深度融合的背景,也赋予了团队贯穿从底层技术研发到产品应用落地的独特能力。我们相信生数团队能够在这波AI浪潮中突围而出,同时也期待团队能够不断开拓多模态大模型的技术边界和应用场景,成为中国生成式大模型领域的佼佼者。

BV百度风投:多模态是大模型的重要发展方向且正处于高速发展阶段,未来有望在更广、更深的层面影响社会生活的多个领域,创造巨大的产业价值。大模型发展要取得突破需要对底层算法原理有深入理解,同时需要具备广泛的专业知识和经验,生数团队在深度生成式模型基础理论和算法研究方面拥有深厚的积累,同时创始团队在大模型研发能力、工程化能力和产品化创新能力等方面具有经验优势。我们对团队未来发展充满信心,也希望团队在扩散模型和多模态大模型方向上取得更多的突破和成就。

卓源资本:AIGC正在走向真实落地,这一过程需要保持对前沿技术的探索和深刻理解。生数科技孵化自是国内最顶尖的机器学习基础理论研究团队,在贝叶斯模型、高效算法和概率建模等方面拥有系统深入的研究成果,为团队在生成式大模型领域的工作开展提供了重要的底层支撑,同时也为团队构筑起领先的竞争优势。期待在团队的科研背景、创新精神以及对多模态发展的深入理解等多方优势的驱动下,生数团队在未来能快速实现令人瞩目的发展。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-19 12:46:00

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI数字人服务商「FOCO」获数千万元天使轮融资,创新工场领投 | 36氪首发
...基于自研AI算法,FOCO能通过AI技术实现生成并驱动拥有多模态交互能力的数字人。首先,在数字人的生成端,FOCO正在研发可以通过文字
2023-06-06 19:49:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和
2024-03-14 15:12:00
奇绩创坛2023春季路演日:60个项目,超一半与大模型相关,企服项目占比第二
...轮智能开创性的将生成式AI与仿真技术深度融合,提供多模态、高质量、大规模、低成本的合成数据,弥补AI时代的数据缺口。 团队介绍:团队成员在合成数据、生成式AI、仿真等领域均
2023-06-06 09:39:00
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研
2024-03-21 05:19:00
中国首个高一致性、高动态性视频大模型发布
...数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。
2024-04-29 11:26:00
...了来自奇绩创坛的种子轮融资。清昴智能创始团队来自于清华计算机系,在边缘计算和模型自动压缩方向有十余年积累;创始人关超宇曾获清华大学研究生特奖,在研究生期间主导开源了首个自动图
2023-06-25 08:51:00
融资超25亿元,他们的目标和OpenAI很像
...和突破。”“我们希望拥有应用于多场景、多任务甚至跨模态的技术,因此不会把模型局限在具体的任务、场景,甚至垂直的行业里。”张鹏表示,面向应用行业的大模型在现阶段可以使企业赚到钱
2023-11-13 07:44:00
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山
2024-09-24 14:21:00
聚焦2025中国国际数字经济博览会·记者观察|培育数据生态,构筑数字产业发展新优势
...定市成为7个国家数据标注基地之一。目前保定已标注多模态数据规模1612TB,形成了7个行业高质量数据集。放眼全省,数据标注及相关产业发展势头正盛。河北省以保定为引领,推动张家
2025-10-20 07:47:00
更多关于科技的资讯:
促进民营经济高质量发展·超能量的“中小微”(十九)|乡村小厂造出“搬运神器”
11月12日,智捷智能科技香河有限公司工作人员在室外场地对智能搬运叉车进行调试。 河北日报记者 刘英摄11月12日,天津滨海新区一处海滩上
2025-11-29 07:31:00
厦门网讯(厦门日报记者 许舒昕)在注意力被算法切割的当下,一张纸质报纸竟在粉丝圈掀起抢购潮——从常规售价2元到二手平台单份22
2025-11-29 09:13:00
一、大数据视域下高校学生资助精准识别与分配的核心概念界定大数据技术是对数据进行加工、整理与计算的技术。其核心在于通过信息存储
2025-11-29 12:02:00
大数据技术在高校学生资助工作中发挥了重要保障作用。相对于传统资助模式存在的问题。大数据通过整合多源数据、构建评估模型,能够实现从被动申请到主动发现的转变
2025-11-29 12:20:00
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00