• 我的订阅
  • 科技

databricks推出开源ai模型dbrx

类别:科技 发布时间:2024-03-29 05:36:00 来源:浅语科技

3月28日消息,初创公司Databricks近日发布公告,推出了开源AI模型DBRX,声称是迄今为止全球最强大的开源大型语言模型,比Meta的Llama2更为强大。

databricks推出开源ai模型dbrx

DBRX采用transformer架构,包含1320亿参数,共16个专家网络组成,每次推理使用其中的4个专家网络,激活360亿参数。

Databricks在公司博客文章中介绍,在语言理解、编程、数学和逻辑方面,对比Meta公司的Llama2-70B、法国MixtralAI公司的Mixtral以及马斯克旗下xAI开发的Grok-1等主流开源模型,DBRX均优势胜出。

databricks推出开源ai模型dbrx

图1:DBRX在语言理解(MMLU)、编程(HumanEval)和数学(GSM8K)方面的表现优于已有的开源模型。

在语言理解方面,DBRX的分值为73.7%,高于GPT-3.5的70.0%、高于Llama2-70B的69.8%、Mixtral的71.4%以及Grok-1的73.0%。

模型

DBRXInstruct

MixtralInstruct

MixtralBase

LLaMA2-70BChat

LLaMA2-70BBase

Grok-11

OpenLLMLeaderboard2

(Avgofnext6rows)

74.5%

72.7%

68.4%

62.4%

67.9%

ARC-challenge25-shot

68.9%

70.1%

66.4%

64.6%

67.3%

HellaSwag10-shot

89.0%

87.6%

86.5%

85.9%

87.3%

MMLU5-shot

73.7%

71.4%

71.9%

63.9%

69.8%

73.0%

TruthfulQA0-shot

66.9%

65.0%

46.8%

52.8%

44.9%

WinoGrande5-shot

81.8%

81.1%

81.7%

80.5%

83.7%

GSM8kCoT5-shotmaj@13

66.9%

61.1%

57.6%

26.7%

54.1%

62.9%(8-shot)

Gauntletv0.34

(Avgof30+diversetasks)

66.8%

60.7%

56.8%

52.8%

56.4%

HumanEval5

0-Shot,pass@1

(Programming)

70.1%

54.8%

40.2%

32.2%

31.0%

63.2%

在编程能力方面,DBRX的得分为70.1%,远超GPT-3.5的48.1%,高于Llama2-70B的32.3%、Mixtral的54.8%以及Grok-1的63.2%。

Model

DBRX

Instruct

GPT-3.57

GPT-48

Claude3Haiku

Claude3Sonnet

Claude3Opus

Gemini1.0Pro

Gemini1.5Pro

MistralMedium

MistralLarge

MTBench(Inflectioncorrected,n=5)

8.39±0.08

8.41±0.04

8.54±0.09

9.03±0.06

8.23±0.08

8.05±0.12

8.90±0.06

MMLU5-shot

73.7%

70.0%

86.4%

75.2%

79.0%

86.8%

71.8%

81.9%

75.3%

81.2%

HellaSwag10-shot

89.0%

85.5%

95.3%

85.9%

89.0%

95.4%

84.7%

92.5%

88.0%

89.2%

HumanEval0-Shot

pass@1

(Programming)

70.1%

temp=0,N=1

48.1%

67.0%

75.9%

73.0%

84.9%

67.7%

71.9%

38.4%

45.1%

GSM8kCoTmaj@1

72.8%(5-shot)

57.1%(5-shot)

92.0%(5-shot)

88.9%

92.3%

95.0%

86.5%

(maj1@32)

91.7%(11-shot)

81.0%(5-shot)

WinoGrande5-shot

81.8%

81.6%

87.5%

88.0%

86.7%

在数学方面,DBRX的得分为66.9%,高于GPT-3.5的57.1%,也高于Llama2-70B的54.1%、Mixtral的61.1%和Grok-1的62.9%。

databricks推出开源ai模型dbrx

Databricks介绍,DBRX是一个基于MegaBlocks研究和开源项目构建的混合专家模型(MoE),因此每秒输出token的速度极快。Databricks相信,这将为MoE未来最先进的开源模型铺平道路。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-29 09:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克旗下人工智能大模型Grok已正式开源
...工智能初创公司 xAI 迈出了重大一步,开源了其大型语言模型 (LLM) Grok。这意味着企业家、程序员、公司和个人现在可以访问 Grok 的权重和文档
2024-03-18 09:57:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度
2024-03-29 14:00:00
...名AI.comOpenAI已提交GPT-5商标申请亚马逊组建新团队开发AI模型微软计划将下架第一代“智能助手”Cortana软银成立SB Intuitions
2023-08-06 22:54:00
马斯克官宣!xAI正式推出API 允许Grok模型集成到其他应用
...旗下的xAI承诺,将通过应用程序编程接口(API)提供Grok模型。而现在,马斯克兑现了承诺,这个API接口已经出现了。Grok是该公司的旗舰生成式人工智能模型,为马斯克旗下
2024-10-22 17:24:00
周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛亮”将把守大模型应用入口?
昨日(6月13日), 360正式发布“360智脑”大模型应用,360智脑从1.0迭代至4.0版本,包括360安全卫士、360安全浏览器
2023-06-14 13:00:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上
2024-03-20 13:44:00
「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢
...?你怎么看。在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models
2024-09-18 15:01:00
马斯克的AI大模型登场
...下社交媒体平台X的AI团队发布公告,正式推出Grok大语言模型。一直以来,马斯克把AI描述为“历史上最具颠覆性的力量”。他是这项技术的狂热粉丝,但又充满警惕。他称,这样的结果
2023-11-06 09:22:00
市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
据央视财经2月20日报道,近期,OpenAI发布的新模型Sora引发了关注,纽约时报报道称,现在OpenAI的估值或达到约800亿美元
2024-02-21 14:59:00
更多关于科技的资讯:
企业家故事 | 追“光”传奇,山东宇影李正坤和他的透镜宇宙
齐鲁晚报·齐鲁壹点 李梦晴 李庆都 通讯员 朱雪松 刘长胜在德州市临邑县,一座占地160亩的现代化企业中,近700名员工正在各自岗位上有条不紊地忙碌
2025-09-16 18:56:00
DEKRA德凯百年庆典隆重举行:传承百年使命,共创安全未来
2025年,全球领先的检验检测认证机构DEKRA德凯迎来成立一百周年。值此世纪里程碑之际,DEKRA德凯亚太区于9月12日在上海隆重举行百年庆典
2025-09-16 13:38:00
中国品牌,全球奖项:及象教育双奖加身,引领银发教育“中国服务”时代
9月13日,第四届全球品牌经济大会在北京首钢国际会展中心举行,作为中国国际服务贸易交易会的重要组成部分,本届大会以“向远
2025-09-16 13:38:00
优机优补、有进有出:中国农机正迎来新的黄金时代
大众网记者 刘晓雨 通讯员 张一晓 潍坊报道当前,中国农机行业正站在转型升级的关键节点。国家通过“优机优补、有进有出”的补贴政策
2025-09-16 10:21:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿顺利完成SVG智能升级改造工程。该工程不仅破解了长期困扰安全生产的供电系统稳定性难题
2025-09-16 09:41:00
西贝真正的敌人,从来都不是罗永浩
近期最热的事,毫无疑问,罗永浩大战西贝。如果你还没关注,也没事,差评君给你简单说下来龙去脉。9月10号,罗永浩发了条微博
2025-09-16 05:14:00
江西超高压工程实现“智能”验收
本报讯(全媒体记者谢梦丽)9月12日,随着一架无人机平稳返航,国网江西省电力有限公司在赣州东500千伏输变电工程现场的全线数字化验收顺利完成
2025-09-16 06:53:00
南京天加环境攻克技术难题,“节能”和“减排”双路径绿色发展为地球控温1.5℃持续努力□南京日报/紫金山新闻记者黄琳燕当全球平均气温较工业化前水平上升超过1
2025-09-16 07:46:00
“法国经验”遇上“中国制造”,南山飞卓攻克大飞机产业链“关键一步”——全球主力民航客机今后将用上“南京造”□通讯员杨淏涵南京日报/紫金山新闻记者张希一个是欧洲排名第一的飞机精密零件制造商法国FigeacAero(下称“飞卓宇航”)
2025-09-16 07:46:00
最浪漫的潮州特产,统治美国人婚礼
凌晨3点,广东潮州。一家婚纱公司收到一封紧急邮件,屏幕那端,是美国客户的紧急恳求——“请务必保质保量,按时交货,拜托拜托”
2025-09-16 05:13:00
36氪合伙人、副总裁李政:中国产业的未来在哪?| 2025年36氪产业未来大会
9月10日,由36氪主办的2025年36氪产业未来大会在中国厦门盛大启幕。本次大会重磅携手商务部主办的“中国国际投资贸易洽谈会”
2025-09-16 01:03:00
核电“听诊器”打破卡脖子壁垒 中船集团携多款核心产品亮相烟台
齐鲁晚报·齐鲁壹点记者 于民星9月15日,2025山东清洁能源产业博览会和第18届烟台国际核电工业及装备博览会双展联动
2025-09-15 23:49:00
南方电网兴义供电局:职工自研装置投入使用 开启变电设备一键检测新模式
9月11日,在南方电网兴义供电局500千伏仁义变电站内,一套由该局文峰职工创新工作室历经3年自主研发的“无线传输型的氧化锌避雷器多组同步带电检测装置”成功投入使用
2025-09-15 23:11:00
人力资源管理专家汪江涛:以人才体系创新激活企业内生动力
文/许笑“人力资源管理的价值,在于精准识别组织痛点,通过体系搭建、机制创新与人才激活,将人力资源转化为推动企业前行的动能
2025-09-15 11:17:00
长白时评评论员 久泰平近日,围绕“预制菜”的争论持续发酵,引发广泛关注。表面上看,双方争执的焦点是“什么才算预制菜”,实则揭开了餐饮行业一个长期被回避的核心议题
2025-09-15 11:22:00