• 我的订阅
  • 科技

无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的“淘宝”丨36氪专访

类别:科技 发布时间:2024-04-03 18:19:00 来源:36氪

作者丨邱晓芬

编辑丨苏建勋

国内大模型行业轰轰烈烈,算力却始终是卡脖子的难题。

数据显示,截至2023年,中国算力总规模位居全球第二,算力规模近5年更是年均增速近30%。尽管如此,AI行业至今的第一感受依旧是——算力不够用。

近期,有一家清华系创业公司瞄准了这一痛点。

这家公司叫「无问芯穹」,项目发起人则是清华大学电子工程系主任汪玉,创始人是他的学生夏立雪。因此,这家公司连名字都有着浓浓的清华印记——1924年清华大学国学部教授汪鸾翔写就的清华校歌,当中便有这么一句,“立德立言,无问西东”。

「无问芯穹」自从去年5月份成立之后,在五个月内就得到了互联网公司、AI公司、知名投资机构的支持。智能涌现发现,他们的股东名单包括百度、腾讯、智谱 AI、红杉中国、金沙江资本等等。

「无问芯穹」创始人兼CEO夏立雪告诉《智能涌现》,目前大模型落地的阻碍之一,是算力领域呈现巨大的需求和供给错配。

一方面,目前全球GPU芯片缺口巨大,英伟达一家又无法满足所有的全球AI大模型训练、推理的需求;另一方面,英伟达以外的多元异构GPU也在快速发展中,AI算力生态分散,难以被整合起来,供应给亟需算力的大模型公司。

夏立雪观察到,现下的算力焦虑,有几种常见的具象化表现:

有公司无法找到符合业务需求的算力;而有的公司找到了算力,但面对这些裸金属疙瘩,又不会用;还有的公司,纵使幸运找到了算力、也知道怎么用,但又因为匹配的工具链不好用,导致产品落地投产比严重不合理。

AI行业困于在算力不足的当下,整体已经出现了分化趋势。

目前,有AI公司“已经在犹豫干不干”,还有的公司更直截了当——“没必要再卷 GPT-5,不如先去探索GPT-4能做在哪些场景落地”。

不过,夏立雪不想让行业因为算力而坐以待毙。为了弥合需求和供给的裂缝,同时让算力更好用,「无问芯穹」也应运而生。而这家公司也是这次清华系AI创业公司中,罕见切入算力方向的一家。

不过,「无问芯穹」不是想要做英伟达,而是从更轻巧的角度切入。

据其介绍,「无问芯穹」相当于在大模型和芯片之间,打造了一个更灵活适配的中间层,让百花齐放的大模型层和多元异构硬件层,实现统一部署。

也可以这么理解,「无问芯穹」相当于做了一个大模型算力领域的“淘宝”,下游的大模型厂商和应用方,一键可以买到好用、高效的算力。而这些算力则是来自于多元的芯片。

目前,「无问芯穹」的「无穹Infini-AI」平台,已经能够支持了Llama2、Baichuan2在内的20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、英伟达等10余种计算卡。

无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的“淘宝”丨36氪专访

无问芯穹的大模型服务平台

而实现算力普惠,效果也是显著的。夏立雪表示,合作伙伴「同道猎聘」曾在部分城市发布了数字人面试官等由AI驱动的新功能,应用了「无问芯穹」所提供的算力方案,“第一阶段落地ROI(投入产出比)高出原先方案很多”。

相关的合作还在紧锣密鼓推进。

3月31日,「无问芯穹」还宣布了一系列的产业合作信息——包括与智谱AI发布大模型万卡训推计划,共建大模型训推万卡集群;与紫光展锐合作,探索大模型在端侧硬件上的部署与性能提升等等。

"我们定位在中间层,配合就很显得很重要,我们希望能够去连通产业的上下游资源,把大家团结起来,把国内的AGI落地到千家万户",夏立雪认为。

不过,要做好一个中间层产品,尤其是复杂的算力领域,对于团队的要求并不低。为此,「无问芯穹」也聚起了一支有着超大规模算力集群系统管理经验的团队。

在团队方面,「无问芯穹」创始人兼CEO夏立雪曾任阿里云用户增长产品技术负责人,曾经负责过阿里云大语言模型的压缩加速、生成式AI模型芯片的等战略项目;

无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的“淘宝”丨36氪专访

无问芯穹CEO夏立雪

联合创始人兼CTO颜深根曾是商汤科技数据与计算平台部执行总监,曾帮助商汤搭建过2万片GPU的大规模AI计算平台;另一位联合创始人兼首席科学家戴国浩,现任上海交通大学长聘教轨副教授,清源研究院人工智能设计自动化创新实验室负责人。

夏立雪表示,“只有真正在万卡集群上摸爬滚打过的这些人才能够知道里面有什么样的坑,如何做出一个好的平台产品。”

以下是《智能涌现》与夏立雪的交流(略经摘编)

算力行业的博弈

智能涌现:大模型公司在过去的一年怎么解决算力短缺问题?现在大家还会有这种算力的焦虑吗?

夏立雪:大模型公司目前资金还是比较雄厚的,他们的主要焦虑是找不到符合他们规模的算力量,而且很多云厂商自己也在做大模型,进一步导致了云上可用到的算力很少,这也迫使不少大模型公司直接去买机器。

美国这一次的限制打得大家都有点措手不及,模型规模又还在增长,算力焦虑是会持续的。做一个 GPT-4以上程度的模型,至少需要万卡规模的集群,没有这么多卡的人怎么办?

各大厂商、大模型创业公司基本上都想搭建自己的超大算力,但国内单集群规模能到5千卡以上的,也不是所有大厂都有。另一方面,推理的机器也在逐渐增长。

智能涌现:因为算力太贵,现在是否导致一些分化的趋势了?

夏立雪:有的。

最早英伟达H系列芯片5、6万的时候,大家都愿意租来用。涨到8、9万的时候,很多人就要考虑考虑自己要不要这么大投入了。

现在价格虽然整体是没有继续上涨了,但还是处于试探大家干不干的那个边界线上。很多企业可能觉得我没必要去卷GPT-5了,我先去探索GPT-4甚至3.5能在哪些场景落地,大家的路径就逐渐开始分化。

智能涌现:能否帮我们系统梳理下现在AI算力的价值链?

夏立雪:如果从完整的供应链来说,最上游是造算力的人,但其实这个行业本来利润没有那么高,奈何英伟达一家独大,相当于形成垄断。在这一层的玩家还有AMD。

再往下是IDC,就是把英伟达芯片那些硬件组合成一个集群的厂商,当于提供了数字时代水电煤这部分的价值。再往下,就是大模型公司,以及更下游的行业公司了。

但是还有另一种梳理方式,因为大模型本身是个技术突破带来的产业,所以大模型公司算是这个产业的基石,他们产出新的技术对下游应用产生影响,又产生新的算力需求对上游供应产生影响,可以看出这个产业的迭代是由大模型公司来驱动的,毕竟大家说起大模型时代,肯定都会说是openai带来的,而不是英伟达带来的。

总结来看,算力是最重要的供应源头,模型是最先进的技术源头,这两者的连接效率就非常重要了。

智能涌现:目前的行业现状是什么样的?

夏立雪:现在这个行业看起来好像既供不应求,又供过于求。

供不应求是整体市场上有一堆比大模型公司再往下游的、想要去用模型的公司,或者是基于自己的业务模型做行业落地的公司。这些公司他想要用算力,但又拿不到,拿到了他也没有办法把这些百卡、千卡裸金属很好运用起来的能力。

供过于求是许多算力拥有方也缺少这一层能力。

我们了解到各个地方的智算集群中存在着大量的算力,包括一些异构卡,但他们通常高只会去修改物理裸机配置来服务客户——比如,要么把一组100台的机器卖给同一个客户,要么就空着等下一个大客户,不会把100台机器拆分成10组机器再分给10个客户,因为动态调整问题对于基建层的玩家来说太费劲了。

除了技术外,还要配置对应的销售运营团队。偶尔他们需要把一批机器分给两个客户,他们就得单独为这些机器组一个网络,把它变成独立的、物理管理的空间,这个成本是很高的。

智能涌现:不过国内的这么多的云厂商,他们没有去做这个事?

夏立雪:云厂商本身业务重心是聚焦自身的。他有过去积累的渠道,更倾向于去自建非异构的算力集群,也就是市面上大家正在抢的这一批。

再加上云厂商们之前建设了非常多且复杂的业务场景要支持,还背着很多客户需求与盈利目标,如果要叠加上M×N(多种模型与多种芯片)这种底层的多维度适配业务,对云厂商来说会是一个“灾难性投入”。

智能涌现:要做这种智算中心的算力运营,难的点在哪?

夏立雪:第一,中间这一层云平台需要同时兼顾灵活性和效率,这不是实验室体系能够研发出来的,因为它需要纳管万卡规模的集群,是巨大的系统工程。所以在这种情况下,只有真正在万卡集群上摸爬滚打过的这些人才能够知道里面有什么样的坑,如何做出一个好的平台产品。

国内能把这样规模的卡管理起来的,主要都在大厂。我们团队包括从阿里、商汤出来的一拨人,在超大规模的系统搭建和管理上,有复合型经验。我们团结了很多算力行业的人,以轻资产的方式,为整个大模型行业提供计算基础设施。

如何用技术,缓解算力焦虑?

智能涌现:你们现在的客户类型是什么?

夏立雪:我们目前重点服务的客户有三类:大模型厂商,用大模型去升级自身业务的软件厂商,以及基于模型去做AI原生应用的小企业。

智能涌现:你们的上下游分别是什么厂商?

夏立雪:我们上游的话其实就是这些智算中心,下游是做大模型的一方和使用大模型的一方,比如说法律、金融这些行业的客户。

智能涌现:你们提供的是什么服务?

夏立雪:我们提供的是一个工具链,这个工具链包含了对他所用的这个模型和他所用的硬件进行一个最极致的适配,这个工具链可以使他已经训练好的模型跑到对应的硬件上,而且整体性能和性价比能提升。

我们有点像是大模型算力的一个淘宝套餐组合,让你去部署AI 应用的时候,就像在淘宝上购物时选择不同的尺寸、不同的颜色一样,把模型和芯片组合起来,我们就像是把模型和芯片组合成了一个套餐,直接就给客户就可以用了。客户可以自由地去组合,去选择最适合自己的套餐,相当于是我们是连接了算力层和模型层,让更多的人能够用得上大模型,也用得起大模型。

智能涌现:你们是如何解决你前面说的,算力焦虑和产业链上的利益博弈?

夏立雪:从算法到芯片,从芯片到集群,从模型到应用,是我们在技术能力上的三个层次。

我们首先是能够把单任务效率做到极致优化,包括训练和推理,其中推理的效率提升会更明显。其次,我们把多个任务在多台机器之间调度,把整个集群的效率提升得更高,让每一个任务能够最快速跑完,并且让整个集群一直跑。把这两个方面叠加起来,我们就能够为客户提供最极致性价比的云服务。我们把大家已经接受、能用的芯片,把它的效率发挥到极致,能够用同样的成本干更多的事。

我们有一个用做这个文生图的客户,用到了我们的优化能力之后,生成图片的调用量能够达到8倍以上的,同时延迟也缩到了1/ 10。

智能涌现:你们现在的商业模式?

夏立雪:我们想做的是,让商业化智算中心的算力,通过我的这套工具,被更多的场景客户用起来,另一方面能让客户算力使用的性价比得到极致提升。我们按照token的方式算价格。

智能涌现:相当于你们也有CUDA的接口,也有AMD ROCm的接口?

夏立雪:对的,我们是一个翻译的中间层,你说的这两个都是类似N(芯片)这层的接口,而M(模型)这层接口是pytorch的各种计算图,这两种语言之间的翻译工作是我们做的。不仅让你跑通、跑得正确,另外效率也是最高的。这是我们现在的核心的技术点。

智能涌现:它怎么实现的?

夏立雪:原本多模型和多芯片之间的这个翻译空间是M×N的,是一个非常错乱的交叉组合,我们事先做了中间表达,相当于我在这两个语言的翻译过程中实现了一个自己的内部语言,我先翻译成自己的语,再翻译成相邻层的语言,这样的话相当于我就把这个线条的数量从M×N,变成M+N。这套核心技术能力,我们实验室从08年开始就一直在做。

智能涌现:国内的那几家大模型公司,他们愿意接受这种模式吗?还是他们更倾向于自己搭一个集群?

夏立雪:国内大模型公司现在还是很需要更多算力伙伴的,因为国外的Meta、谷歌都在做开源大模型,不断地去发布它的新的模型来证明它的在这方面的科学价值,竞争也是比较白热化的。不过集群分为训练和推理集群,训练集群太大了,不是我们的核心目标,我们跟大家的合作更多的是在推理上。

这样也形成了分工,在模型怎么用起来方面,他们是需要借力我们这样的生态伙伴来探索的。另外在推理这边对性价比的要求更高,因为它最终是算账。比如,游戏行业上了一个大语言模型用于生成对话,我最后带来的用户体验的提升和留存,和这个成本之间是不是能够算得过来账,所以我们的优化价值也能帮到大家。

其实我们和大模型公司是有一个共同的使命的,就是最终推动大模型在千行百业落地,这里边需要大模型公司提供更好更高效的模型,我们来把端到端的系统效率做到极致。

智能涌现:提到项目的发起人是汪玉老师,汪老师对于您这次创业的助力是什么?

夏立雪:我们项目的发起人是汪玉老师,他是我的导师。我在清华大学从本科一直读到博士毕业,加入阿里之后,也一直和汪老师保持着非常密切的交流。所以我对电子系整个产研体系有比较长期的关注和持续的理解,汪老师为我们公司带来了很多有用的技术与经验输入。

电子系在清华是学生最多的系,清华一共有24万校友,电子系有两万多,积累了非常多在这个行业发光发热的人。

汪老师鼓励学生毕业后创办一些创新公司,基于自己在大学受到的训练,把大公司、政府和高校通过这些创新小公司连接起来。无问芯穹也承载了一部分这样的期待。然后我们在技术方面的积累确实是源自清华电子系,包括我毕业的这个实验室的技术。

智能涌现:你们和清华系其他AI大模型项目之间有没有联动?听说已经和智谱在推进合作了?后续的合作规划是什么?

夏立雪:这次大模型创业潮里,模型层有非常多知名的清华系企业。我们定位在中间层,因为整个市场是足够大的,配合就很显得很重要,我们希望能够去连通产业的上下游资源,把大家团结起来,一起把这个国内的AGI给落地到千家万户。

智能涌现:英伟达的生态壁垒如何构筑的?

夏立雪:CUDA是他的股价支撑点,是他最厉害的地方,但也是老黄最担忧的地方。因为大家在硬件能力上,本质上没有代际的差异,至少英伟达和 AMD之间没有的。软件的这部分护城河,是英伟达靠着历史上非常重的资金和精力投入做起。AI起来之后,他投入非常多的精力去支持这些开源生态,让大家都使用自己的硬件来开发模型。大概十几年,英伟达把这条路径打通了之后,他终于可以“躺着赚钱”了。现在大模型出来了之后,模型之间的结构差异变小了,生态的壁垒忽然变薄了。

原本需要几千个算子交叉组合成几万种以上的计算图的设计空间,有无数的人帮他做,这个壁垒特别厚。但是现在,这几万设计空间中只有那么80个算子组成的不到10种模型结构,就能够支持未来80%的市场,那AMD就可以干,很多硬件厂商都可以干。

智能涌现:您从大厂离开到自己创业,有没有一些思维的转变?科学家创业需要面临的困难和挑战是什么?

夏立雪:我已经算转型非常小的了。一方面是我在清华电子系读博的时候,博士课题是跟人工智能相关的,且电子系本身就是和产业走得非常近的细分专业。另一方面,我在阿里也不是纯做技术,而是做了内部的产品孵化,我需要去设计产品的目标、特色、投入、收益……相当于其实我已经在阿里内部做过一次成功的创业。

但是在大厂创业和自己出来创业又完全不一样,因为现在我要从海量的市场信息中,去调研、去定战略。不管从压力上还是从机遇上来说,和当年的能动空间都是完全不一样的,我觉得对我来说是一个最大的挑战。真的创业之后,我发现其实自己的时间会被拆得非常细碎,你不仅需要去看市场、抓商务、懂技术。大厂里面可能只需要负责最多不到10个任务,然后现在你可能同时负责1000个任务,怎么能够去完整地闭环这些事情,对于一个科学家来说是一个非常大的挑战。

无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的“淘宝”丨36氪专访

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-03 20:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

再融近5亿!清华系AI创业新势力,成最吸金“算力运营商”
...AI创业公司,是怎么炼成的?无问芯穹联合创始人、CEO夏立雪,在对话中给出了答案。融这么多的钱的,为什么是无问芯穹?去年5月31日,无问芯穹成立。但这家公司在AI领域积淀的开
2024-09-03 11:49:00
大模型重塑电商,淘宝、百度、京东讲出新故事
...就成为了AI大模型应用最大的试验场。于是,同赛道下的淘宝、京东等也都纷纷按下了AI电商布局的加速键。条条大路通“罗马”近年来,淘宝、百度、京东这三个平台相互之间的竞争早已屡见
2024-03-29 10:00:00
用大模型生成Lofi音乐,这款应用要做年轻人的情绪「疗养剂」|我爱黑「可颂」路演项目专访
...提到,生活在一二线城市的年轻人经常会感受到情绪上的焦虑和压抑。他希望通过大模型生成的音乐,为这一群体提供情感疏导。在这个过程中,用户只需要“阐述”当前情绪状态,大模型就可以根
2023-12-14 19:02:00
“军备竞赛”之后,算力新的破局点在哪?
...资源的稀缺导致了行业的集体焦虑。无问芯穹的创始人夏立雪在接受采访时表示,目前大模型落地的阻碍之一,是算力领域呈现巨大的需求和供给错配。作为算力第一供应商的英伟达,股价水涨船高
2024-10-27 13:44:00
...4月,36氪尝试在AI的帮助下,从0到1搭建出了一个真正的淘宝店。小到起名、做logo,大到服装设计、模特图和商品详情介绍文案生产,在短短几天内零成本完成了店铺的搭建和上线。
2023-09-12 19:50:00
CSDN蒋涛:国内独立开发者要赚到钱,需要软件的创造成本真正降下来|36氪专访
...板程序。写什么样板程序能让大家感兴趣?他就到闲鱼和淘宝上去看。所以这需要一个过程,36氪:这就相当于GitCode AI模型社区的角色是吧?把散户需求聚集起来,然后连接开发者
2024-09-29 09:48:00
36氪专访 | 美图创始人吴欣鸿:AI让我如履薄冰
...理解深度,才能把自己的工作做好。36氪:美图会有人才焦虑吗?吴欣鸿:会有。所以我们也在看一些对AI有很大兴趣、已经做出成绩的大牛。有热情,会学习,并且有成果,这种人是我们很缺
2023-06-30 09:25:00
...工具把它做到更好才是企业应该思考的问题。CIO们当下很焦虑,但未来的CIO、CDO应该承担更重要的职责数字时氪:新一波AI技术对数字化转型有什么影响?史喆:数字化已经是行业共
2023-06-08 18:31:00
...大程书院具有教书育人与理学传播的双重功能。 “程门立雪”的图景再现众所周知,理学人士杨时、游酢曾登门向程颐求教,其时程颐正在闭目静坐养心,二人为了避免打扰先生,耐心地等候了
2024-04-12 03:33:00
更多关于科技的资讯:
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:48:00
天津市优秀基层理论宣讲员风采展示
2025-12-24 17:49:00
2025长三角伴手礼名单揭晓,有道词典笔行业独家上榜
日前,长三角消保委联盟举办“2025长三角伴手礼”评测活动,经过专业测评优中择优,为消费者推荐各行各业的优质品牌和放心产品
2025-12-24 18:37:00
2025年最省电的空调推荐?跟着趋势选,节能与舒适一站到位!
随着绿色家居理念深入人心,2025年家电消费市场的“节能属性”愈发凸显,空调作为居家高频耗电大户,“省电能力”已成为消费者选购时的核心考量
2025-12-24 22:03:00
科技攻“尖”产业向“新”,盈康一生打造医工创新策源地
近日,“AI for Health助力健康中国2030——第二届海医汇医疗科技创新生态大会”在北京隆重举行。作为海尔集团旗下大健康生态品牌
2025-12-24 22:04:00
中国蓝新闻讯 随着全球多地气温骤降,“取暖需求”持续升温。作为全球小商品贸易的风向标,义乌市场早已嗅到商机,各类取暖、保暖设备进入产销旺季
2025-12-24 16:53:00
鲁网12月24日讯近期,工行临沂兰山批发城支行为全面贯彻国家关于深化普惠金融服务、支持实体经济发展的战略方针,积极响应金融监管机构关于加大普惠金融力度的政策导向
2025-12-24 14:44:00
《次第花开》首期圆满落幕,女性成长新时代启航
近日,她创美好赋能学园首期传承营——《次第花开》在学员的满载收获中圆满落幕。本次课程汇聚了来自各行业的优秀女性,通过为期三天的系统学习
2025-12-24 11:31:00
千企齐聚利雅得,深度链接沙特“2030愿景”---- 2025沙特中国出口品牌联展启幕
12月22日,2025沙特中国出口品牌联展(以下简称“沙特联展”)在沙特利雅得前沿会展中心开幕。作为首次落地沙特的中国出口品牌系列展
2025-12-24 11:34:00
凭何赢得央视频认可? 成都普济中医以专业实力诠释“身边的肿瘤康复专家”
在国家“健康中国”战略深入推进的背景下,树立医疗健康领域的优质标杆,传播科学、规范的实践模式,已成为推动行业高质量发展的重要途径
2025-12-24 11:44:00
大皖新闻讯 近日,安徽敏航科技有限公司与北京魔康科技发展有限公司进行“数智赋能·空域共生”无人机战略合作签约,双方建立全面战略合作伙伴关系
2025-12-24 12:32:00
数据驱动的仓储革命:中感智能清仓机器人如何成为企业积累工艺数据资产的关键
当前,全球工业领域正加速向智能化、无人化转型,国家政策亦持续鼓励“机械化换人、自动化减人、智能化无人”,以提升本质安全水平与生产效率
2025-12-24 10:31:00
中新经纬12月24日电 针对法国仓遭遇盗抢事件,京东回应中新经纬称,北京时间12月22日,位于法国巴黎地区的京东仓储遭遇盗抢
2025-12-24 10:32:00
厦门网讯(厦门日报记者 楚燕 通讯员 陈雯 李欣)在患者脑中植入电极片,设备就能实时解码患者意图,通过穿戴式设备帮助患者实现抬手
2025-12-24 08:04:00
太晓红摘要:金融科技的崛起对传统商业银行的经营影响极为深远,通过重塑其成本结构、拓展收入边界、优化资产质量,显著提升了传统商业银行的盈利能力
2025-12-24 06:39:00