国内国际社会时尚情感人文汽车健康

头条订阅服务

体育娱乐财经军事科技游戏教育育儿

三国以色列人工智能AI ChatGPT 数字经济

我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

360智脑7b参数模型采用3.4万亿tokens训练

类别：科技发布时间：2024-04-14 01:04:00 来源：浅语科技

4月12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长度最长的。

360智脑7b参数模型采用3.4万亿tokens训练

360表示，他们在OpenCompass的主流评测数据集上验证了模型性能，包括C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一，平均分为第三。

360智脑7b参数模型采用3.4万亿tokens训练

在LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测试中，360选择其中与中文长文本应用最密切相关的中文单文档问答、多文档问答、摘要、Few-shot等任务进行评测，360Zhinao-7B-Chat-32K模型取得了平均分第一的成绩。

360智脑7b参数模型采用3.4万亿tokens训练

在英文大海捞针测试（NeedleInAHaystack，是将关键信息插入一段长文本的不同位置，再对该关键信息提问，从而测试大模型的长文本能力的一种方法）中，360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试，同样做到了98%以上的准确率。

除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，大模型相关开发者可做到“开箱即用”。

据IT之家此前报道，周鸿祎曾表示，前段时间大模型行业卷文本长度，100万字“很快将是标配”。“我们打算将这个能力开源，大家没必要重复造轮子，定为360K主要是为了讨个口彩。”他还自称“开源的信徒”，信奉开源的力量。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-04-14 09:45:07

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,训练,参数,模型,文本,评测的资讯：

腾讯发布最大开源MoE模型，3890亿参数免费可商用

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...家本领，来挤开源赛道，突然发布了市面上最大的开源MoE模型。Hunyuan-Large，3890亿总参数，520亿激活参数

2024-11-07 09:54:00

百川智能发布baichuan3稳定语言模型

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中

2024-01-29 19:57:00

北京智源发布悟道3.0大模型系列

北京智源发布悟道3.0大模型系列

...京智源大会”上，北京智源人工智能研究院发布悟道3.0大模型系列，包含悟道・天鹰（Aquila）语言大模型系列、“天秤（FlagEval）”大语言评测体系及开放平台以及悟道・视界视觉大模型系列

2023-06-10 21:58:00

全模态对齐框架align-anything来啦：实现跨模态指令跟随

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）

2024-10-18 09:47:00

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日，商汤科技发布多模态多任务通用大模型“书生（INTERN）2.5”，在多模态多任务处理能力方面实现多项全新

2023-03-15 13:30:00

王小川新公司「百川智能」发布首个开源中英文大模型，开源免费可商用 | 最前线

王小川新公司「百川智能」发布首个开源中英文大模型，开源免费可

...氪获悉，6月15日，百川智能公司正式推出中英文预训练大模型——baichuan-7B，参数量为70亿。百川智能是搜狗创始人王小川于2023年4月成立的新AI公司

2023-06-15 16:53:00

模型即服务，卓世科技MaaS平台 2.0 正式上线

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛

2024-08-07 09:45:00

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

...机器之心编辑部在 OpenAI 发布会的前一天，来自中国的大模型公司零一万物，让开源大模型社区活跃了起来：Yi 大模型家族新成员「Yi-1

2024-05-14 09:56:00

Sora这就落伍了？Meta“最强视频模型”不用DiT，用Llama大力出奇迹了

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...量问题而导致难产的节骨眼，Meta毫不客气发了它的视频模型“Movie Gen”，并直接用一个完整的评测体系宣告自己打败了Sora们

2024-10-08 09:51:00

更多关于科技的资讯：

海外媒体发稿推荐：日本顶级新闻媒体投放&新闻发布

海外媒体发稿推荐：日本顶级新闻媒体投放&新闻发布

2024-11-21 21:57:00

越明打卡世界互联网大会Vlog｜ AI让“无障碍”生活成为可能

越明打卡世界互联网大会Vlog｜ AI让“无障碍”生活成为可

2024-11-21 22:31:00

《南京市数字人民币消费满意度情况调查报告》出炉超八成使用者

2024-11-21 22:37:00

为基层减负赋能，兴业数金助力零售智慧经营体系建设

2024-11-21 22:44:00

天眼看乌镇｜贵州大数据集团首次亮相世界互联网大会

天眼看乌镇｜贵州大数据集团首次亮相世界互联网大会

2024-11-21 23:12:00

2024年世界互联网大会乌镇峰会人工智能负责任开发与应用论坛举行

2024年世界互联网大会乌镇峰会人工智能负责任开发与应用论坛

2024-11-22 00:11:00

中国科学家在无能耗制冷领域获重大突破

2024-11-22 04:36:00

香港身份规划机构哪家强？空格盛世教育值得一看

香港身份规划机构哪家强？空格盛世教育值得一看

2024-11-21 18:17:00

中国第一个充气式柔性密封舱太空试验成功！空间站、登月都用得着

中国第一个充气式柔性密封舱太空试验成功！空间站、登月都用得着

2024-11-21 18:26:00

乐道2025年新车计划官宣：567座SUV全线齐发

乐道2025年新车计划官宣：567座SUV全线齐发

2024-11-21 18:26:00

飞凡电车充电盖频繁自动打开关不上车主下车怒锤充电盖

飞凡电车充电盖频繁自动打开关不上车主下车怒锤充电盖

2024-11-21 18:26:00

篡改猴Tampermonkey上架苹果商店！售价21元、Safari可用

篡改猴Tampermonkey上架苹果商店！售价21元、Sa

2024-11-21 18:56:00