推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

突破遥感基础模型关键技术！我国科研人员研发出遥感智能训推一体

...然而，遥感单幅影像幅宽大、基础模型参数规模大，导致推理速度与应用场景较为受限。近日，中国科学院空天信息创新研究院（空天院）科研团队基于自主研制的遥感智能解译基础模型，联合国内相关研发机构，共同研发出“...……更多

2023-10-27 11:57:00遥感,一体机,模型,科研,一体,突破

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

...闭源的商业模型会配套相应的工具链，包括训练工具链、推理工具链，这些工具链的性能要比开源的好，对于客户来说，训练就能省大概10~20%的硬件成本，推理的时候省得更多，业务规模越大，省得越多。第二层，看模型带来的...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...Hot Chips 2024大会上，Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示，WSE-3依然是采用了一整张12英寸晶圆来制作，基于台积电5nm制程，芯片面积为46225平方毫米，拥有的晶体管数量达到了4万亿个，拥有90...……更多

2024-09-02 13:36:00晶圆,芯片,生成,模型,性能,参数

提质降价，国产大模型加速奔跑

...据方面实现多模态统一，持续突破人工智能感知、理解和推理世界的能力边界。这些，拓展着大模型与各行各业融合的深度和广度。“如今，芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强，共...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

百度智能云两大基础设施再升级！打造AI时代最开放的智能基础设

...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点：推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力，实现算力性能与成本的双重突破。本次大会...……更多

2025-04-25 16:27:00基础设施,设施,智能,基础,升级,开放

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

大模型“免费”送，厂商们图什么？

...，零一万物CEO李开复接受采访时表示：“未来整个行业的推理成本每年降低10倍是可以期待的，而且这个趋势是必然的。”未来，大模型的成本将呈阶梯状下探，但目前大模型的价格却断崖式下探，甚至部分企业免费送，降价幅...……更多

2024-06-05 10:57:00模型,厂商,模型,企业,成本,商业

微软、英伟达纷纷押注小模型，大模型不香了？

...LLM之间的性能差距正在迅速缩小，特别是在多项选择题、推理和数学问题等特定任务中，顶级模型之间的差异极小。例如，在多项选择题中，Claude 3 Opus、GPT- 4 和Gemini Ultra的准确率均超过83%，而在推理任务中，Claude3 Opus、GPT-4和Ge...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

林达华谈大模型发展之路：未来会有更高效的模型结构出现

...模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起云涌...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

张云泉：集中力量，促进国产AI大模型发展

...法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力，且算力成本占据整体开销的大头。可以说，算力成为支撑大模型发展的关键因素，也是科技竞争的战略高地。在大规模的前端产品落地后，算...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

京东云发布八大领先智算产品，助力企业火速用上大模型

...云DeepSeek大模型一体机，通过自研的算力池化能力、智能推理加速引擎，充分融合软硬件，实现了性能的全面提升，推理速度提升50%，企业可以根据自己的需求灵活选择不同版本，开箱即用。目前，在河南鹤壁、江苏宿迁、山东...……更多

2025-02-27 14:14:00京东,模型,领先,产品,企业,京东

摩尔线程与360达成战略合作，将共同打造“360智脑大模型一

...模型一体机”集成了 360 智脑大模型，具备大模型管理、推理部署等功能，摩尔线程全功能 GPU 将为其提供底层算力，“以高性价比硬件方案确保大模型推理效率和成本的平衡”。双方还将共同研发和优化推理框架，在软件层面...……更多

2024-08-02 13:46:00摩尔,一体机,线程,模型,一体,战略

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...很多不同的GPU型号和显存大小。再加上，目前广泛应用于推理阶段的量化技术，比如可以用FP16或FP8精度，这会改变推理和训练/微调成本的比重。以上这些限制因素，都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

华为AI存储助力中国移动构建超大规模智算集群

...海量数据信息的投入。面对智算集群目前存在的可用度、推理体验等问题，华为推出业界首款AI存储——OceanStor A800，致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来，智能计算已...……更多

2024-12-19 18:16:00华为,集群,中国,中国移动,存储,规模

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...SIQA、HellaSwag、WinoGrande等多个数据集，来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。Yi能力。结果显示，Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平，但在数学与...……更多

2023-11-06 12:13:00李开复,万物,模型,能力,训练,阿里

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里