我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

databricks推出开源ai模型dbrx

类别：科技发布时间：2024-03-29 05:36:00 来源：浅语科技

3月28日消息，初创公司Databricks近日发布公告，推出了开源AI模型DBRX，声称是迄今为止全球最强大的开源大型语言模型，比Meta的Llama2更为强大。

DBRX采用transformer架构，包含1320亿参数，共16个专家网络组成，每次推理使用其中的4个专家网络，激活360亿参数。

Databricks在公司博客文章中介绍，在语言理解、编程、数学和逻辑方面，对比Meta公司的Llama2-70B、法国MixtralAI公司的Mixtral以及马斯克旗下xAI开发的Grok-1等主流开源模型，DBRX均优势胜出。

图1：DBRX在语言理解(MMLU)、编程(HumanEval)和数学(GSM8K)方面的表现优于已有的开源模型。

在语言理解方面，DBRX的分值为73.7%，高于GPT-3.5的70.0%、高于Llama2-70B的69.8%、Mixtral的71.4%以及Grok-1的73.0%。

模型

DBRXInstruct

MixtralInstruct

MixtralBase

LLaMA2-70BChat

LLaMA2-70BBase

Grok-11

OpenLLMLeaderboard2

(Avgofnext6rows)

74.5%

72.7%

68.4%

62.4%

67.9%

—

ARC-challenge25-shot

68.9%

70.1%

66.4%

64.6%

67.3%

—

HellaSwag10-shot

89.0%

87.6%

86.5%

85.9%

87.3%

—

MMLU5-shot

73.7%

71.4%

71.9%

63.9%

69.8%

73.0%

TruthfulQA0-shot

66.9%

65.0%

46.8%

52.8%

44.9%

—

WinoGrande5-shot

81.8%

81.1%

81.7%

80.5%

83.7%

—

GSM8kCoT5-shotmaj@13

66.9%

61.1%

57.6%

26.7%

54.1%

62.9%(8-shot)

Gauntletv0.34

(Avgof30+diversetasks)

66.8%

60.7%

56.8%

52.8%

56.4%

—

HumanEval5

0-Shot,pass@1

(Programming)

70.1%

54.8%

40.2%

32.2%

31.0%

63.2%

在编程能力方面，DBRX的得分为70.1%，远超GPT-3.5的48.1%，高于Llama2-70B的32.3%、Mixtral的54.8%以及Grok-1的63.2%。

Model

DBRX

Instruct

GPT-3.57

GPT-48

Claude3Haiku

Claude3Sonnet

Claude3Opus

Gemini1.0Pro

Gemini1.5Pro

MistralMedium

MistralLarge

MTBench(Inflectioncorrected,n=5)

8.39±0.08

—

8.41±0.04

8.54±0.09

9.03±0.06

8.23±0.08

—

8.05±0.12

8.90±0.06

MMLU5-shot

73.7%

70.0%

86.4%

75.2%

79.0%

86.8%

71.8%

81.9%

75.3%

81.2%

HellaSwag10-shot

89.0%

85.5%

95.3%

85.9%

89.0%

95.4%

84.7%

92.5%

88.0%

89.2%

HumanEval0-Shot

pass@1

(Programming)

70.1%

temp=0,N=1

48.1%

67.0%

75.9%

73.0%

84.9%

67.7%

71.9%

38.4%

45.1%

GSM8kCoTmaj@1

72.8%(5-shot)

57.1%(5-shot)

92.0%(5-shot)

88.9%

92.3%

95.0%

86.5%

(maj1@32)

91.7%(11-shot)

81.0%(5-shot)

WinoGrande5-shot

81.8%

81.6%

87.5%

—

88.0%

86.7%

在数学方面，DBRX的得分为66.9%，高于GPT-3.5的57.1%，也高于Llama2-70B的54.1%、Mixtral的61.1%和Grok-1的62.9%。

Databricks介绍，DBRX是一个基于MegaBlocks研究和开源项目构建的混合专家模型(MoE)，因此每秒输出token的速度极快。Databricks相信，这将为MoE未来最先进的开源模型铺平道路。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-03-29 09:45:11

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,模型,方面,语言,公司,马斯的资讯：

马斯克旗下人工智能大模型Grok已正式开源

...工智能初创公司 xAI 迈出了重大一步，开源了其大型语言模型 (LLM) Grok。这意味着企业家、程序员、公司和个人现在可以访问 Grok 的权重和文档

2024-03-18 09:57:00

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚

2024-08-13 09:50:00

马斯克 xAI 推出 Grok-1.5 大语言模型

...公司 xAI 今天在官方博客中宣布，正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度

2024-03-29 14:00:00

马斯克夺下AI.com域名；OpenAI提交GPT-5商标申

...名AI.comOpenAI已提交GPT-5商标申请亚马逊组建新团队开发AI模型微软计划将下架第一代“智能助手”Cortana软银成立SB Intuitions

2023-08-06 22:54:00

马斯克官宣！xAI正式推出API 允许Grok模型集成到其他

...旗下的xAI承诺，将通过应用程序编程接口（API）提供Grok模型。而现在，马斯克兑现了承诺，这个API接口已经出现了。Grok是该公司的旗舰生成式人工智能模型，为马斯克旗下

2024-10-22 17:24:00

周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛

昨日（6月13日）， 360正式发布“360智脑”大模型应用，360智脑从1.0迭代至4.0版本，包括360安全卫士、360安全浏览器

2023-06-14 13:00:00

马斯克打脸OpenAI！全球最大模型Grok-1开源

...：林志佳马斯克（Elon Musk）真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉，北京时间3月18日早上

2024-03-20 13:44:00

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒

...？你怎么看。在 AI 领域，几乎每个人都在谈论大型语言模型，其英文全称为 Large Language Models

2024-09-18 15:01:00

马斯克的AI大模型登场

...下社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。一直以来，马斯克把AI描述为“历史上最具颠覆性的力量”。他是这项技术的狂热粉丝，但又充满警惕。他称，这样的结果

2023-11-06 09:22:00

市场担忧Sora模型带来两大隐患，马斯克“坐不住”了，秀肌肉

据央视财经2月20日报道，近期，OpenAI发布的新模型Sora引发了关注，纽约时报报道称，现在OpenAI的估值或达到约800亿美元

2024-02-21 14:59:00

更多关于科技的资讯：

集思录｜读懂“包挂热”背后的新潮流

近来，“包挂热”在年轻消费者群体中持续升温。社交平台上，有关“包挂”“包搭子”等相关话题的浏览量超过亿次。数据显示，今年上半年

2025-11-25 08:41:00

基于企业核心竞争力提升的创新管理策略

摘要：在全球市场飞速发展、竞争日趋激烈的当下，企业获得并保持核心竞争力是长远发展的动力源泉。企业的静态核心竞争力易随着技术的进步与市场的变换而失去光彩

2025-11-25 07:04:00

大数据时代中小企业管理创新研究

摘要：随着大数据技术的快速发展，传统中小企业的管理模式面临前所未有的挑战与机遇。大数据的应用使得中小企业能够通过数据分析

2025-11-25 07:04:00

外卖大战结束？京东外卖App上线饿了么或更名淘宝闪购

外卖大战在不久前刚刚告一段落，市场就又有了新的动作：京东上线了独立App京东外卖，同时还发布了京东点评。而11月以来，也多次传出阿里的外卖平台“饿了么”要更名为淘宝闪购的消息

2025-11-25 07:22:00

社交媒体“信息茧房”的成因与破解路径探析

在高度媒介化的社会环境中，社交媒体作为关键基础设施，其算法推荐机制催生的“信息茧房”现象日益凸显。本研究聚焦大学生群体

2025-11-25 07:04:00

猛犸世纪AI智能体训练营开课，引爆“一人公司”新范式

AI时代，企业的核心竞争力是什么？在2025年11月19日至20日于深圳南山成功举办的“猛犸AI智能体增长训练营”上，答案被清晰地指向了同一个方向

2025-11-24 14:18:00

澳柯玛多款产品获市长杯工业设计大赛金、银、铜奖

鲁网11月24日讯近日，青岛市2025年第八届“市长杯”工业设计大赛获奖名单正式公布，澳柯玛生活电器凭借卓越的设计实力

2025-11-24 14:44:00

嘉必优捷报频传，瞄定中国生物制造踏新阶

近日，《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布，明确提出，推动生物制造、量子科技、氢能和核聚变能等成为新的经济增长点

2025-11-24 15:18:00

“一键注销”让用户彻底告别“注销难”

为规范大型网络平台个人信息处理活动，保护个人信息合法权益，促进平台经济健康发展，国家互联网信息办公室、公安部起草了《大型网络平台个人信息保护规定（征求意见稿）》

2025-11-24 15:29:00

富德生命人寿张家口中支开展合规与风险提示专项培训

为强化员工合规意识，切实保障SPACC+营销模式下老年客户的服务安全，富德生命人寿保险有限公司张家口中心支公司于11月12日至13日

2025-11-24 15:32:00

百年人寿银保精英深大研学圆满收官

10月29日至31日，百年人寿银行保险渠道在深圳大学举办“金鹏启梦，领行新程”主题研学班。本次活动聚焦专业能力跃升与价值成长路径

2025-11-24 15:33:00

邮储银行三明市分行携手商圈平台打造银客商共赢典范

多维促消费，畅享“双十一”——邮储银行三明市分行携手商圈平台打造银客商共赢典范东南网11月24日讯为紧抓“双十一”消费机遇

2025-11-24 15:44:00

王嘉琳女士受邀出席睿海希尔顿花园酒店开业盛典，共贺新章

日前，重庆渝北中央公园睿海希尔顿花园酒店（以下简称“睿海希尔顿花园酒店”）在渝北区中央公园片区盛大开业。作为全国首家开业的4

2025-11-24 16:30:00

“四轮驱动”，推动零售业实现可持续发展

11月21日，2025北京零售商品博览会在北京展览馆启幕，展会以“品质零售·融聚共生”为主题，联动生产商、品牌商、渠道商

2025-11-24 17:41:00

东湖评论：“良心产品”不应成为稀缺品

“这个锅的厂家还在吗？”一则寻锅视频在全网爆火，这口“用了三十年仍旧不锈不粘、耐用如初”的锅也被网友称为“传家锅”。感动之余

2025-11-24 18:26:00

头条订阅服务

databricks推出开源ai模型dbrx