• 我的订阅
  • 科技

面壁智能发布开源大模型eurux-8x22b

类别:科技 发布时间:2024-05-04 08:57:00 来源:浅语科技

5月3日消息,面壁智能发布开源大模型Eurux-8x22B,包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO,主打推理能力。

官方测试中,Eurux-8x22B 在 LeetCode(180道LeetCode编程真题)与 TheoremQA(IT之家注:美国大学水准的STEM题目)测试上超越了 Llama3-70B,在 LeetCode测试上超越闭源的GPT-3.5-Turbo。

面壁智能发布开源大模型eurux-8x22b

▲ 官方测试结果

据介绍,Eurux-8x22B模型激活参数39B,支持64k上下文,是由Mixtral-8x22B模型对齐而来,在UltraInteract对齐数据集上训练而成。

面壁智能发布开源大模型eurux-8x22b

▲ 官方测试数据

UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集,包含了覆盖数学、代码和逻辑推理问题的12个开源数据集的86K条指令和220K偏好对,共有五十万条左右数据。

面壁智能发布开源大模型eurux-8x22b

面壁智能发布开源大模型eurux-8x22b

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-04 11:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练
2024-11-13 14:09:00
...外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的
2025-02-27 05:08:00
石油巨头牵手DeepSeek
昆仑大模型正式“牵手”DeepSeek2月8日,中国石油昆仑大模型正式完成DeepSeek大模型私有化部署,为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动
2025-02-14 22:37:00
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms
2024-06-25 09:45:00
模型即服务,卓世科技MaaS平台 2.0 正式上线
引言:MaaS(ModelasaService,模型即服务)是一种将人工智能算法模型及其相关能力封装成服务,以降低人工智能技术使用门槛
2024-08-07 09:45:00
...来网络研究院”)签署战略合作框架协议。各方将围绕大模型核心技术联合攻关,力争在3-5年内实现行业大模型技术创新能力江苏领先水平,在全国具有示范意义。同时,多方合作还将共建江苏
2023-08-25 05:54:00
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规
2024-02-03 16:03:00
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview
2024-09-18 15:01:00
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻
2024-08-19 13:49:00
更多关于科技的资讯: