• 我的订阅
  • 科技

早期项目丨推出芯片级多方安全计算方案,「紫先科技」将为大模型数据安全提供基础设施

类别:科技 发布时间:2023-05-23 09:36:00 来源:36氪

作者丨邱晓芬

编辑丨苏建勋

随着AI大模型的兴起,大模型的安全合规问题频发,逐渐引起了各国政府和行业各界对其数据安全的关注。

在意大利,由于有用户声称在ChatGPT的历史对话中看到了其他人的聊天内容。随后,意大利数据保护局于3月底暂时禁用大模型,并对其涉嫌违反隐私规则展开调查。

在国内,大模型相应创业风起云涌之时,数据安全保护行动已经开始。比如,4月11日,国家互联网信息办公室便发布了《生成式人工智能服务管理办法(征求意见稿)》,当中提出, 生成式人工智能服务者对于用户的输入信息和使用记录承担保护义务。在征求意见稿发布的前一日,中国支付清算协会甚至给从业人员发布了倡议,要求其不上传相关的敏感信息,保护金融行业的涉密数据和材料。

目前,还有部分公司明确规范了Chat GPT使用,比如三星此前还将ChatGPT的上传容量限制为1024字节;还有包括台积电、软银、沃尔玛等厂商也宣布限制使用生成式AI工具。

不过,随着大模型厂商增加, 相关的数据安全赛道却几乎是一片空白——大模型的安全计算是一项涉及千亿级参数的计算,而现有的隐私计算方案并没有办法同时满足大模型场景下的高安全性、高性能、高通用性的保障要求。 比如,同步加密的方法在使用的过程中可能将计算性能降低五个数量级, 联邦学习不适用于模型推理阶段等等。基于安全多方计算的方案是现有隐私计算方案当中最有可能在大模型领域应用落地的技术。

早期项目丨推出芯片级多方安全计算方案,「紫先科技」将为大模型数据安全提供基础设施

现有隐私计算方案的对比

针对大模型的数据安全隐患,国内已经有了相应的创业公司。「紫先科技」就是一家由硅谷AI科学家以及国内高校学者联合创立的、为大模型应用方提供基于安全多方计算方案的云服务平台厂商。

「紫先科技」CEO周兴博士向36氪表示,一般而言,大模型从产生到落地应用包括三个阶段,包括大模型训练阶段、大模型微调阶段、大模型的应用阶段。其中,数据安全问题一般高发于对模型定制微调和应用阶段。这主要源于,大模型落地的协作过程中存在着数据所有权和使用权的博弈。

一般而言,大模型的训练需要大量的数据、算力、AI人才,对于头部大模型厂商来说,未来大概率不会做出开源的决定。因此,各个领域的应用厂商若要开发出有竞争力的行业专属大模型,需要利用自身私域数据以及融合了本领域专业知识的高质量标注对基础大模型做定制微调,以强化大模型在本领域的专业能力。

这种流程尽管符合大模型厂商的数据诉求,但站在应用商公司的角度来看,用户的私域专业数据和微调后的增量参数均是其商业核心壁垒所在,并不愿意把宝贵资产所有权让渡。同时在应用阶段,调用大模型的交互信息也涉及到用户商业机密。

因此,数据安全是大模型实现大规模应用的必要基础,要解决这一悖论所衍生出的数据安全风险,周兴博士认为,如果能够基于多方安全计算架构做好大模型定制微调和应用服务,便可保证双方的隐私安全。

“我们希望通过隐私计算的方式,让大模型公司和模型应用商之间的桥梁可以顺畅搭建起来”,周兴博士表示。据介绍,在商业层面,「紫先科技」所提供的数据安全服务将建立在云上,未来将与大模型厂商合作,为下游的大模型应用商提供一站式的模型定制微调和应用服务。

这一方案如何切实保障数据安全?周兴博士表示,「紫先科技」的核心技术是一套基于FPGA芯片的安全多方计算方案“PPLMAC”,是目前全球唯一可满足大模型数据安全场景对高安全性、高计算性能和高通用性要求的解决方案。

早期项目丨推出芯片级多方安全计算方案,「紫先科技」将为大模型数据安全提供基础设施

PPMLAC框架技术

据其介绍,在保证数据安全的前提下,基于独创的芯片设计,该方案可以将隐私计算性能与明文计算性能差距缩小到一个数量级以内,并可应用于模型微调和推理环节。

周兴博士表示,为了降低使用门槛,「紫先科技」还为使用该方案的算法工程师们提供了大模型编程框架平台,可以较低成本的实现移植开发,不用对原来的算法程序做出改变。

目前,「紫先科技」已经完成隐私计算FPGA加速卡产品化,技术成果已提交专利申请,并于2022年6月在国际顶级计算机学术会议ACM ISCA发表相关论文。公司计划从金融、企业服务等刚需领域切入,目标是成为大模型数据安全基础设施服务提供商。

「紫先科技」在2022年曾经获得奇绩创坛的天使轮融资,目前正启动新一轮的融资。团队方面,创始人周兴博士曾经在Google、Facebook AI研究院有近10年的工作经验,在Facebook AI研究院带领团队创建隐私计算AI框架CrypTen并开源,并全程参与了Facebook系列大语言模型的研发。团队其他核心技术成员大部分出自清华计算机系。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-23 11:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...被芯片层、框架层、模型层和应用层取代,又迅速进化为基础设施、工具和应用的新「三层架构」。技术的发展,基础设施的成熟,让千行百业都产生了所有生意都值得在大模型时代重做一遍的信仰
2024-07-13 09:54:00
Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练
...急剧增长,Meta正执行一项宏伟计划——专为AI建设下一代基础设施。Meta公布了其为AI构建下一代基础设施的最新进展
2023-05-19 14:01:00
探秘中关村论坛人工智能领域新起之秀,北电数智是一家怎样的企业?
...点项目:北京数字经济算力中心项目即人工智能时代新型基础设施AIDC、先进计算迭代验证平台即AI算力可视化驾驶舱、可信数据空间即数字经济产业的重要基础设施。在人工智能集群展中,
2024-04-26 15:50:00
特斯拉,不仅仅是芯片
...式发展的秘诀。特斯拉目前拥有非常少量的内部人工智能基础设施,只有约 4000 个 V100 和约 16000 个 A100
2023-06-28 12:00:00
...力三方面因素,其中运力作为经济社会发展的战略性公共基础设施,对于算力基础设施建设、支撑数字经济高质量发展至关重要。应均衡配置算力、存力、运力《瞭望》:您提出广义算力的概念,并
2023-09-12 09:04:00
微软:从“软件老大”到“AI帝国”
...纷呈。微软一口气公布了100多项以 AI 为中心,在云计算基础设施、 模型即服务 MaaS 、数据平台、Copilot 人工智能助手等方方面面的新产品和新功能
2023-11-21 10:45:00
业内聚焦算力服务高质量发展:需优化布局、加强协同
...人民网北京9月7日电 (记者栗翘楚)当前,加快推进算力基础设施建设,已成为有效激发数据要素创新活力、加速数字化进程、支撑数字经济高质量发展的有力举措。日前,多位业内人士及专家
2023-09-07 15:31:00
谷歌云AIGC火力全开!推出新AI芯片TPU v5e,企业AI服务30美元/月,接入Llama 2等大模型
...23年的关注重点——生成式AI。首先,谷歌云基于AI进行了基础设施的优化,推出新型AI芯片Cloud TPU v5e
2023-08-30 10:13:00
2023 re:Invent——从云计算到AI未来的一场全面重塑之旅
...计算的开创者,陈晓建也认为,云计算的重塑要围绕底层基础设施展开。在云基础设施方面,亚马逊云科技持续扩大全球基础设施的覆盖区域和增加数据中心的数量和规模,其全球基础设施横跨世界
2024-01-03 15:17:00
更多关于科技的资讯: