推理,模型,参数,模型,吞吐量,吞吐头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

nvidia发布最新力作——x800系列交换机

...00系列的核心，它们是全球首批能够提供高达800Gb/s端到端吞吐量的网络平台。这一突破性的性能提升，对于处理日益增长的大规模AI模型和高性能计算（HPC）任务至关重要。X800系列交换机的设计充分考虑了现代数据中心对高带宽...……更多

2024-03-20 01:27:00力作,交换机,数据中心,交换机,网络,数据

氪星晚报｜阿里巴巴智能信息事业群发布夸克大模型；高盛：预计2

...able旗下的B2B平台持续提供技术投入。厦门空港：10月旅客吞吐量214.47万人次，同比增长158.71% 36氪获悉，厦门空港发布公告称，10月旅客吞吐量214.47万人次，同比增长158.71%；飞机起降15367架次，同比增长96.11%。传嘉能可牵头斥资90...……更多

2023-11-14 18:07:00夸克,尼卡,高盛,数千,阿里巴巴,阿里

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

重构计算，九章云极DataCanvas智算操作系统重磅发布

...升100%，单卡利用率提升50%；模型推理速度提高4倍，Token吞吐量增加5倍异构算力纳管与调度提供包含国内外多种算力资源的适配、纳管、调度和优化。通过实时监控和管理各智算中心的智算设备，以及创新的调度算法，成功实现...……更多

2024-04-19 11:55:00重构,重磅,系统,公司,智能,产业

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

旅客吞吐量29828人，济宁大安机场2024年春运圆满收官

...圆满收官。济宁大安机场共保障航班1066架次，完成旅客吞吐量12.72万人次，同比2023年春运期间旅客吞吐量增长4.5%、客座率增长17.5%。其中春节假期期间，机场旅客吞吐量29828人；同比2023年春节假期增长52.82%。加密航线优化航线...……更多

2024-03-07 13:50:00济宁,吞吐量,大安,吞吐,旅客,机场

AI时代已至，西部数据如何释放存储能量？

...在训练和推理的阶段，数据写得少，读得多，需要更高的吞吐量，以及对延迟、性能都有更高的要求，这一阶段的存储支持主要集中在高性能的SSD上。具体来说，在HDD领域，西部数据借助创新的OptiNAND技术、能量辅助磁记录(ePMR)...……更多

2024-01-22 19:09:00西部数据,能量,存储,西部,时代,数据

口岸吞吐忙创历史新高

本文转自：南方日报湛江港集团2023年货物吞吐量完成1.13亿吨，同比增加12%口岸吞吐忙创历史新高近日，记者从湛江港集团获悉，2023年，湛江港集团锚定高质量发展首要任务，积极开展“竞标争先”生产对标专项活动，聚力开...……更多

2024-01-04 07:06:00吞吐,口岸,新高,历史,湛江港,湛江

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练

...教育大模型的快速迭代，摩尔线程、师者AI还将在大模型推理上开展适配工作。摩尔线程夸娥方案是业内首个跑通、跑完国产大模型的千卡集群，基于全功能MTT S4000 GPU，提供软硬一体化的全栈解决方案，具备模型覆盖、推理加速...……更多

2024-06-14 11:37:00摩尔,师者,集群,线程,模型,训练

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里