模型,参数,模型,训练,测试,时计头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

不必增加模型参数，计算资源相同，小模型性能超过比它大14倍的模型！谷歌DeepMind最新研究引发热议，甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

发布不到1周，OpenAI最强模型o1的护城河已经没有了。有人发现，谷歌DeepMind一篇发表在8月的论文，揭示原理和o1的工作方式几乎一致。o1突发内幕曝光？谷歌更早揭示原理，大模型光有软件不存在护城河这项研究表明，增加测试...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...成的博士论文代码，竟被 AI 在 1 个小时之内实现了。o1 模型已经强到，能够直出博士论文代码了！来自加州大学欧文分校（UCI）的物理学博士 Kyle Kabasares，实测 o1 preview+mini 后发现：自己肝了大约 1 年的博士代码，o1 竟在 1 小时...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练

快科技6月14日消息，摩尔线程与全学科教育AI大模型“师者AI”联合宣布，双方已完成大模型训练测试。师者AI基于摩尔线程夸娥（KUAE）千卡智算集群，完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周，训练...……更多

2024-06-14 11:37:00摩尔,师者,集群,线程,模型,训练

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

几天前 OpenAI 新模型 o1 的发布，再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”，是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域，还表现出超强...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型，阿里通义又上新！4月29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

huggingface公布“smollm”小语言模型家族

7月20日消息，如今小语言模型开始升温，许多厂商开始推出适用于手机等轻量级设备的“小模型”，本周HuggingFace便公布了“SmolLM”小语言模型家族，其中包含1.35亿、3.6亿及17亿参数模型。据介绍，这些模型号称是以精心策划的...……更多

2024-07-21 01:19:00小语,模型,家族,模型,小语,参数

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

常见电子邮件分类算法的性能分析

...值向量，进而利用监督学习的方法进行训练。通过训练，模型能够学习到从文本到类别的映射关系，从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词：TF-IDF；决策树...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...之心开源社区有福了。说到做到，马斯克承诺的开源版大模型 Grok 终于来了！今天凌晨，马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

全球最强开源大模型Llama 3发布：使用15T数据预训练，

就在刚刚，Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍，Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...家坚持开源的社交巨头，又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日，Meta在官网上发布了两款开源大模型，参数分别达到80亿和700亿，是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

专家模型不要专家并行！微软开源MoE新路径

...日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。继Phi家族之后，微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头（16 * 3.8B），却采用了截然不同的训练方法...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...，一大波测评刷屏全网。更惊喜的是，苹果AI背后的基础模型47页技术报告，也一并上线了。一大早，人们期待已久的「苹果AI」首个预览版，正式向开发者们推送了！iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1三大系统中，全都植入了苹...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

挑战Scaling Law，Meta发布移动端350M小模型

【新智元导读】Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B以下，两个版本分别只有125M和350M参数，但却实现了比更大规模模型更优的性能。从5月和6月...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

揭示Transformer「周期建模」缺陷！北大提出新型神经

【新智元导读】北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式，相比传统模型在多项任务中表现出色，同时降低了参数量和计算量，增强了对周期性特征的建模能力，应用潜力广泛。周期性现象广泛存在，深...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度，并提升人工智能技术的综合应用效能的模式。上新了...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

amd推出10亿参数语言模型系列amdolmo

...10月31日发布博文，宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo，为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列（LMs），在AMDInstinct™MI250GPU集群上训练，使用了超过1.3...……更多

2024-11-09 00:21:00模型,参数,语言,模型,开发者,训练

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上，马斯克在7月份就在X平台上确认，Gr...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

一块GPU都没用，苹果自研大模型干翻GPT-4？

...，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能：1、Siri升级。Siri唤醒后具备屏幕边缘发光特效，能理解用户表述不通顺的指令，且能回答关于苹果产品...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特...……更多

2025-05-28 14:17:00模型,团队,参数,能力,数学,代码

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

一句话、一张图，共绘古祠新名片！陈家祠商圈标识及宣传语邀您来

为提升陈家祠商圈品牌形象与文化内涵，扩大商圈影响力，进一步彰显岭南文化商圈特色，打造文化消费新地标，现面向全社会公开征集陈家祠商圈标识（LOGO）及宣传语

2025-12-12 09:23:00

直播天地的“杭州引力”

晚上6点半，杭州遥望科技大楼的直播间里，灯光亮如白昼。小五对着镜子最后检查了一下妆容，深吸一口气，走向镜头。五年前，她站在黑龙江齐齐哈尔的寒风中

2025-12-12 08:08:00

裸眼穿越桥隧极速补能充电智慧交通让你体验美好出行新变化

如果未来的高速公路能像人一样“思考”，预判几公里外的风险；如果跨海大桥有“专属医生”，能飞檐走壁进行体检；如果服务区不再只是简简单单的驿站

2025-12-12 08:09:00

曹妃甸农商银行开展2025年信贷专项培训

河北新闻网讯（杨春辉）如何深化信贷业务专业化能力，推动一线员工全面掌握产品体系与营销策略，从而为“一池两新万企”行动提供坚实支撑

2025-12-12 06:53:00

AI+3D 赋能！“剧想天开” 成果展造梦儿童剧新未来

12月10日-12日，由浙江传媒学院主办、浙江传媒学院实践教学与艺术创作中心协办的 “剧想天开”——《儿童剧人物造型设计创新人才培训》成果展在杭州时尚中心正式展出

2025-12-12 07:07:00

直播新局∣杭州之变②

站在4K摄像机前，主播“俍一”落落大方，此刻她站在演播室里，但直播间的观众们看到的却是由AI实时生成的背景。这样的场景在以前是不可想象的

2025-12-12 07:08:00

家电业创新驱动拓蓝海

家电业正朝着绿色、智能化方向升级，既精准匹配消费者需求，也开拓了市场新空间从电视、冰箱、洗衣机的传统“三大件”到智慧互联

2025-12-12 07:14:00

南京“双12”近百场活动掀起消费热潮

今年“双12”，南京企业捧出主题多元、内容丰富的促消费活动，推动消费市场提质扩容据悉，今年南京将“双12”作为南京市“四季有约·暖冬跨年庆”促消费活动的重要节点

2025-12-12 07:14:00

直播新局∣杭州之机③

在直播间买了商品退货难、赔付慢等情况一直是困扰消费者的难题，临近“双12”，由杭州高新区（滨江）市场监管局联合辖区内头部直播电商企业共同起草的团体标准《放心消费直播间管理与运营规范》（以下简称《规范》）正式发布

2025-12-12 07:38:00

建设银行泰安分行率先完成排队机轻量化试点工作

鲁网12月11日讯近日，建设银行泰安分行高效推进网点服务数字化转型，顺利完成泰安花园支行、新泰向阳支行、新汶翟镇支行、东平白佛山支行等4家网点的排队机轻量化叫号模式试点改造

2025-12-11 14:40:00

意大利ICA意卡亮相大湾区设计论坛：以色彩、技术与资源，赋能

2025年广州设计周于12月5日至8日盛大开幕，在广州保利世贸博览馆、广州国际采购中心及海珠国际会展中心三馆共18个展厅同时举行

2025-12-11 14:53:00

苏大课堂来了位虚拟数字人老师

近日，在苏州大学传媒学院副教授程曦的《新媒体运营》课堂上，迎来了一位与她外型一模一样的虚拟数字人老师，只要是关于课程中的问题

2025-12-11 14:57:00

抹黑诋毁汽车产品、恶意唱衰企业前景……“车曝台”等账号被处置

中新经纬12月11日电 11日，“网信中国”微信号发布汽车行业网络乱象专项整治行动公开曝光第二批典型案例。近期，国家网信办会同工业和信息化部等部门持续开展汽车行业网络乱象专项整治行动

2025-12-11 15:10:00

建设银行青岛市分行：”服务融合“破解金融转型难题

鲁网12月11日讯走进建行青岛市分行瞿塘峡路支行，大堂经理正俯身协助客户核对账单、同步讲解线上查询技巧；城阳支行营业部里

2025-12-11 15:17:00

【儒商风采】德州市恩锋企业管理咨询有限公司董事长李媛媛：先做

鲁网12月11日讯（记者赵洪斌通讯员赵慧）“让一个企业家在半小时内，向陌生人交底，说出自己公司的核心难题——这事儿

2025-12-11 15:17:00

头条订阅服务