• 我的订阅
  • 科技

一家2751亿元的数据巨头 要掀起企业“AI化”革命

类别:科技 发布时间:2023-06-30 16:21:00 来源:极客公园

作者 | 宛辰、Li Yuan

当地时间 6 月 28 日,美国知名数据平台 Databricks 举办了自己的年度大会——数据与人工智能峰会。会上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。

无论是从峰会的名称,还是新产品的命名,都能看出这家知名数据平台,正在趁着大语言模型的东风,加速向 AI 转变的脚步。

一家2751亿元的数据巨头 要掀起企业“AI化”革命

Databricks 公司 CEO Ali Ghodsi 所说的数据和 AI 普惠化 图源:Databricks

「Databricks 要实现的是『数据普惠』和 AI 普惠,前者让数据通向每一个雇员,后者让 AI 进入每一个产品。」Databricks 公司 CEO Ali Ghodsi 在台上说出了团队的使命。

就在大会开始之前,Databricks 刚刚宣布以 13 亿美元收购 AI 领域的新生力量 MosaicML,创下了当前 AI 领域收购纪录,可见公司在 AI 转型上的力度和决心。

正在前方参会的 PingCAP 创始人兼 CEO 刘奇告诉极客公园,Databricks 平台刚刚上线 AI 的企业级应用,就已经有超过 1500 家公司在上面进行模型训练,「数字超出预期」。同时,他认为 Databricks 由于之前在数据+ AI 方面的积累,让公司能在 AI 大火之际,迅速在之前平台基础上加入新产品,就能快速给出和大模型相关的服务。

「最关键的就是速度。」刘奇说道,在大模型时代,如何用更快的速度让大模型和现有产品整合,解决用户的痛点,可能是当下所有数据公司最大的挑战,同时也是最大的机会。

Talking points

通过交互界面的升级,不是数据分析师的普通人,也可以直接使用自然语言查询和分析数据。

企业将大模型部署到云端数据库将越来越容易,直接使用成品大模型工具分析数据,也将变得更加简单。

随着AI的进展,数据的价值还将越来越高,数据潜力将被进一步释放。

01.数据库迎来自然语言交互

在会上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承载着 Databricks 近期最大的发力方向之一——数据分析普惠化,即不掌握 Python 和 SQL 的普通人也能轻轻松松接入公司数据,用自然语言就能进行数据分析。

为达到这个目的,LakehouseIQ 被设计为一个功能合集,既可以被普通终端用户使用,也可以被开发者使用,针对不同的用户设计了不同的功能。

一家2751亿元的数据巨头 要掀起企业“AI化”革命

LakehouseIQ 产品图 图源:Databricks

对于开发者方面,发布了 LakehouseIQ in Notebooks,这项功能中,LakehouseIQ 可以利用大语言模型帮助开发人员完成、生成和解释代码,以及进行代码修复、调试和报告生成。

而对于普通的非程序员群体,Databricks 则提供了可以直接用自然语言交互的界面,背后由大语言模型驱动,可以直接用自然语言来搜索和查询数据。同时,该功能与 Unity Catalog 集成,让公司可以对数据的搜索和查询进行访问权限控制,只返回提问者被授权查看的数据。

自大模型推出以来,用自然语言对数据进行查询和分析,其实一直是一个数据分析方向的热点,许多公司在此方向都有所布局。包括 Databricks 的老对手 Snowflake,刚刚宣布的 Document AI 功能也是主打这个方向。

一家2751亿元的数据巨头 要掀起企业“AI化”革命

LakehouseIQ 自然语言查询界面 图源:Databricks

不过 Databricks 宣称,LakehouseIQ 做到了更好的功能。它提到,通用大语言模型在理解特定客户数据、内部术语和使用模式方面拥有局限性。而 Databricks 的技术,能够利用客户自己的模式(schema)、文档、查询、受欢迎程度、线程、笔记本和商业智能仪表盘来获取智能,回答更多查询。

Databricks 的功能与 Snowflake 的功能还有一个差别,Snowflake 平台的 Document AI 功能,仅限于对文档中的非结构化数据进行查询,而 LakehouseIQ 适用于结构化的 Lakehouse 数据和代码。

02.从机器学习到 AI

Databricks 与 Snowflake 在发布会上的相似之处还不局限于此。

此次发布会中,Databricks 发布了 Databricks Marketplace 和 Lakehouse AI,这与 Snowflake 这两天大会的重点也完全吻合,二者都主打将大语言模型部署到数据库环境中。

在 Databricks 的设想中,Databricks 未来既可以协助客户部署大模型,也提供成品的大模型工具。

Databricks 过去就有 Databricks Machine Learning 的品牌,在此次发布会上,Databricks 对其进行品牌全面的重新定位,升级为 Lakehouse AI,主打协助客户部署大模型。

Databricks 上线了 Databricks Marketplace。在 Databricks Marketplace 中,用户可以接入经过筛选的开源大语言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,还可以发现和获取数据集、数据资产。Lakehouse AI 还包括一些大语言模型操作能力(LLMOps)。

一家2751亿元的数据巨头 要掀起企业“AI化”革命

Lakehouse AI 架构图 图源:Databricks

Snowflake 也在对此进行积极部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供(与英伟达的合作正是 Snowflake 大会的重点之一,见极客公园的报道)。

在协助客户部署大模型方向,Snowflake 与 Databricks 显现出了分歧。Snowflake 选择积极地与合作伙伴进行合作,而 Databricks 则试图将该功能作为其核心平台的本地特性添加进去。

而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未来还将可以提供 Lakehouse Apps。Lakehouse Apps 将直接在客户的 Databricks 实例上运行,它们可以与客户的数据集成,使用和扩展 Databricks 服务,并使用户能够通过单点登录体验进行互动。数据永远不需要离开客户的实例,没有数据移动和安全/访问问题。

这点则与 Snowflake 公司的产品从命名到功能上都直接撞车。Snowflake 公司与之相似的 Snowflake Marketplace 和 Snowflake Native App 已经上线,是其发布会的重点之一。彭博社就在 Snowflake 的大会上宣布了一个由彭博社提供的 Data License Plus (DL+) APP,允许客户在云端用几分钟时间就能配置一个随时可用的环境,内部设有完全建模的彭博订阅数据和来自多供应商的 ESG 内容。

03.数据平台迎来新变革

开幕式主旨演讲上,Databricks 公布了一个数字:过去 30 天,已经在 Databricks 平台上训练 Transformer 模型的客户超过 1500 家。

在谈及这个令人印象深刻的数字时,PingCAP 刘奇认为,这说明企业应用 AI 的速度比预期的要快得多,「应用模型不一定要去训练模型,所以如果训练的都有 1500 家,那应用的肯定要比这个(数字)大的多得多。」

另一方面,这也表明 Databricks 在 AI 这个领域的布局相对完整。「它现在不仅仅是一个 Data Warehouse(数据仓库),一个 Datalake(数据湖)。现在它还提供:AI 的 training(训练)、AI 的 serving(服务),模型的管理等一整套。」

一家2751亿元的数据巨头 要掀起企业“AI化”革命

Ali Ghodsi 以计算和互联网的革命,类比大模型之于机器学习的变革 图源:Databricks

也就是说,底层模型可以通过 Databricks 的平台去训练,「最底层的模型改改参数就能训练」。在这个模型之上所需要的 AI 服务,Databricks 也布局了相应的基础设施——今天发布了 vector search(向量搜索)和 feature store(特征库)。

Databricks 全面向大模型升级。

过去,Databricks 在 AI 方面有很多积累,比如在建索引、查数据、预测工作负载等方面,用小模型来提高效率、降低时延。但是,以如此快的速度补上大模型的能力,还是让不少人意外。

在今天峰会全面展示的 AI 布局之前,Databricks 收购了 Okera(AI 数据治理),推出了自家的开源大模型 Dolly 2.0,又以 13 亿美元并购了 MosaicML,一连串的动作一气呵成。

对此,硅谷徐老师 Howie 认为,Databricks 和 Snowflake 这两个大会都可以比较明确地看出:两家公司的创始人认为,基于数据库、数据湖他们所做的行动、接下来会面临根本性的改变。按照一年前他们在做的思路,在未来几年行不通。

相应地,快速补齐大模型的能力,也意味着可以获得由于大模型带来的增量市场。

刘奇认为,没有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因为只有模型没有数据,干不了什么事情,特别是没有办法做出差异化。如果大家都是一个大模型,那你跟别人可能也没有差别。」

但比起大模型,峰会现场的观众似乎更关注小模型,因为小模型的几个优势:速度、成本、安全性。刘奇表示,基于自己独有的数据,做出差异化的模型,模型要足够小才能满足这三条:足够便宜、足够快、足够安全。

值得注意的是,Databricks 和 Snowflake 在日前都公布了它的营收数据,平台年营收增长在 60% 以上。相比整个市场软件支出放缓的大背景,这样的增长速度反映了数据越来越被关注。这次 Databricks 峰会的主题也是数据加 AI,但有了大模型,数据的价值还将越来越高。

大模型的到来,让数据自动生成成为可能,可以预见,数据量将指数级增长。怎么轻松地访问数据、怎么支持不同的数据格式、挖掘数据背后的价值,会成为越来越频繁的需求。

另一方面,今天很多企业还在还在探索观望将大模型接入企业软件,但考虑到安全、隐私、成本,敢直接用的,还很少。一旦通过将大模型直接部署到企业数据上,无需移动数据,部署大模型的门槛将被进一步降低,数据被消费的数量和速度都将被进一步释放。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-30 17:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

数据正在推动ai革命
...推动AI革命。苹果公司与Shutterstock的协议,以及其他科技巨头如Meta、谷歌和亚马逊的类似行动,标志着一个新时代的到来
2024-04-07 12:58:00
24万股民要嗨?千亿巨头突然放话:里程碑式的技术革命,重磅新品将发布!
1000多亿的人工智能龙头企业科大讯飞,突然发话最近最热门的ChatGPT概念,在股价近期暴涨50%之后,一番表态又引发市场关注,貌似再添一把火。在2月21日晚间发布的调研公告中
2023-02-22 05:00:00
民营石化巨头掀起“三反”风暴,东明石化何以刀刃向内?
...入狱。”这封公开信揭开了这家营收超千亿元的民营炼化巨头“反腐败、反贿赂、反舞弊”攻坚战的序幕。记者采访发现,历经38年发展,致力于“成为世界一流石油化工产业集团”的东明石化,
2025-06-28 17:18:00
...强大的科技力量又会导向事物的反面。 比如,美国科技巨头苹果、微软、谷歌、亚马逊、脸书等均牢牢占据行业头部地位,这种事实上的垄断带来了经济分配不均和新型的社会鸿沟,即便移动互
2023-04-23 05:46:00
在过去几年,美股“七巨头”在金融市场上风生水起、好不热闹。那么,若在未上市的美国独角兽企业中,挑选出一份类似的“七巨头”榜单,会有哪些企业在列呢?未上市企业股权交易领域的交易平台
2024-09-12 12:07:00
三六零2024财报的冰与火:从流量生意到“安全大脑”,一家老牌互联网公司的AI革命
...着诸多挑战。一方面,AI大模型赛道拥挤,阿里、百度等巨头加速布局,行业竞争加剧;另一方面,在安全市场,公司面临奇安信、深信服等专业厂商夹击,压力并不小。此外,智能硬件业务在海
2025-04-29 10:12:00
最前线 | CRM巨头Salesforce推出AI新品,聚焦营销与商务场景
文 | 张一弛编辑 | 邓咏仪美国时间6月7日, Salesforce推出两款生成式AI新产品,分别是Marketing GPT和Commerce GPT
2023-06-08 19:33:00
谷歌Willow激活量子计算产业!中国企业弯道超车的机会?
...至涨停了。量子板块股价集体飙升的原因在于全球互联网巨头谷歌日前官宣,全新量子计算芯片Willow取得重大突破,困扰了量子计算30多年的错误率被大幅降低,当前顶级计算机需要10
2024-12-12 14:23:00
王者出王炸!五家巨头联手抗衡!华为通信新模型加速赶来
华为即将在下周开启5.5G商用化的新纪元,极大提升了通信领域的技术水平,5.5G的到来将带来比5G更快的下行速率,为通信行业带来一场革命性变革。华为的通信大模型技术成果备受瞩目,
2024-02-27 14:48:00
更多关于科技的资讯:
汇川第二届酱香咖啡生活文化周延续精彩
多彩贵州网讯11月1日,酱咖“遵”有味·“汇”爱这一杯——中国咖啡冲煮大赛西部决赛暨汇川第二届酱香咖啡生活文化周活动第二天
2025-11-03 18:11:00
中拉如何以创新谋合作?听企业这样说——
大河网讯 向新向智,共赢未来。11月3日,第十八届中国—拉美企业家高峰会在郑州开幕。以创新合作谋长远,中拉合作将如何开辟出广阔且极具吸引力的“新蓝海”
2025-11-03 18:16:00
香港金融科技周开幕 蚂蚁集团井贤栋:以香港为支点,加速全球化发展
11月3日,2025年香港金融科技周开幕。蚂蚁集团董事长井贤栋在主论坛上表示,香港已成为蚂蚁集团及旗下多家公司的全球化战略支点
2025-11-03 18:46:00
中新经纬11月3日电 (龚宸芫)中新经纬获悉,香港大学机械工程学院与广州沃特海默新材料科技有限公司(下称沃特海默)近日签署合作协议
2025-11-03 19:11:00
破局香港高价蟹难题 京东超级供应链打造“产地-门店”空运直达新模式
今秋,香港“蟹友”有了省心又省钱购蟹的新选择。近日,恰逢京东11.11全球好物节,这也是香港佳宝超市加入京东后首次参与这一年度消费盛事
2025-11-03 20:49:00
2025年培育钻定制品牌榜出炉!6大TOP品牌工艺与口碑深度全解析
在可持续发展理念深入人心的今天,培育钻石行业正迎来前所未有的发展机遇。据《2024-2025全球培育钻石珠宝消费报告》数据显示
2025-11-03 21:26:00
前瞻布局未来产业 新奥以智能助力高质量发展
河北新闻网讯(张新)日前,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,将“构建以先进制造业为骨干的现代化产业体系”列为核心任务之一
2025-11-03 18:04:00
中央音乐学院发布音乐脑机接口“央音一号”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)音乐脑机接口“央音一号”,近日在中央音乐学院发布。中央音乐学院音乐人工智能与音乐信息科技系主任李小兵表示
2025-11-03 16:52:00
11.11提前抢!三联家电折扣让利,家电焕新正当时
鲁网11月3日讯随着11.11购物节的脚步日益临近,全国家电消费市场热度持续攀升,山东地区更是提前进入 “焕新倒计时”
2025-11-03 15:52:00
安徽牧羊人可持续时尚工业园项目开工 致力打造羊毛针织行业的佼佼者
大皖新闻讯 11月3日,安徽牧羊人可持续时尚工业园项目开工奠基仪式举行。项目建成后,将形成年产1000万件成衣,7200吨纺纱
2025-11-03 16:11:00
“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注,这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮,小众街巷因一条短视频迎来客流井喷
2025-11-03 12:25:00
乘AI之势,筑电子产业之基,CPCA Show Plus 2025 圆满闭幕,2026再相见!
2025年10月28日-30日,电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(以下简称:CPCA Show Plus)在深圳国际会展中心(宝安)盛大举办
2025-11-03 12:43:00
培育钻值得购买吗?超全选购攻略一篇搞定,附头部品牌深度测评
当越来越多的年轻人开始琢磨“如何高性价比的结个婚”,培育钻石凭借着价格优势、环保理念,正成为暗潮涌动的钻戒市场的新宠。据统计
2025-11-03 12:45:00
未来,AI有望打造口感逼真的植物蛋白
大河网讯 “人工智能(AI)正以前所未有的速度加速食品创新,它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方,还能辅助设计个性化营养食品
2025-11-03 13:10:00
2025 年,Facebook 依托 Meta 生态的 29.8 亿全球月活用户(Statista 数据),仍是企业海外拓客的关键阵地
2025-11-03 12:46:00