架构,模型,优势,模型,训练,模块头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

...质。为此，北京大学李戈教授的团队提出了一种新型网络架构FAN（Fourier Analysis Networks）。通过引入傅里叶级数的思想，FAN能够将周期性信息直接嵌入网络的结构中，使模型更自然地捕捉和理解数据中的周期性模式。实验表明，...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...提供了分成计划，推动了AI技术的广泛落地。6.首提时空架构，谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发，推出了名为Lumiere的AI视频大模型，与传统的AI视频生成模型不同，Lumiere能够在一个连贯的过程中生成...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...了7个不同规模的Dense（稠密）模型，基于传统的Transformer架构，从规模最小的0.5B到最大的72B，不同大小的模型会有不同的能力和速度，以适配不同场景的需求。同时，在千问系列的迭代中，预训练数据的大小已经从Qwen1.5-72B时的3...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

联想提出混合智能，已开发“联想大脑”

...能化变革。六年前，联想围绕“端-边-云-网-智”新IT技术架构，开发了AI内嵌的智能终端、AI导向的基础设施和AI原生的方案服务，形成了全栈智能的产品及方案服务布局。此外，范建平博士还透露，联想已经开发了如“联想大脑...……更多

2023-12-07 22:02:00混合,大脑,智能,开发,范建平,模型

商汤科技发布日日新5.0大模型

...量合成数据，全新的“日日新SenseNova 5.0”采用混合专家架构，推理时上下文窗口可以有效到200K左右。技术交流日上，商汤科技董事长兼CEO徐立表示，本次更新主要聚集增强了知识、数学、推理及代码能力，全面对标GPT-4 Turbo，...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了非常强的适应性。混元T1正式版沿用了混元Turbo S的创新架构，采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型，有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

华为云发布大模型混合云十大创新技术

...变强，模型参数不断增加，对端、边、云算力协同的整体架构设计提出了更高的要求。华为混合云CTO刘征辉在会上发表《打造最优混合云底座，使能大模型创新》主题演讲。华为混合云CTO刘征辉刘征辉表示，依托全系列产品研...……更多

2024-06-24 10:45:00华为,混合,模型,技术,模型,华为

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...型权重、技术报告完全开源，免费商用，无需申请。模型架构本次开源的Skywork-MoE模型隶属于天工3.0的研发模型系列，是其中的中档大小模型(Skywork-MoE-Medium)，模型的总参数量为146B，激活参数量22B，共有16个Expert，每个Expert大小...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

玄武科技引领革新小A机器人大模型发布

...场产品发布会上展示了其最新研发成果——小A机器人大模型，标志着该公司在人工智能领域迈出了重要的一步。作为中国人工智能学会的理事单位，玄武科技再次证明了其在国内人工智能行业领先的创新能力。小A机器人大模型...……更多

2024-04-02 11:23:00玄武,革新,模型,机器,科技,人工智能

连云港唯一！悟空智算入围国家算力强基揭榜行动

...，包括资源调度策略、训推加速套件等并可支持多种硬件架构，屏蔽底层硬件差异，提升超大规模模型在训练、推理过程中稳定性、资源利用率和运行效率。到 2026年，研发一套支持万亿参数模型的超大规模训推一体化智算平台...……更多

2025-06-19 10:06:00连云,悟空,连云港,行动,国家,悟空

中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“

2024年1月10日，中国电信宣布，将自研星辰AI大型模型全面开源，以更好地助力客户业务的智能化升级。这一行动表明中国电信自研大型模型能力的成熟和完备，也展示了其在落地应用和拓展服务方面的强大实力。大模型开源，...……更多

2024-01-12 17:07:00中国,中国电信,创新成果,助推,星辰,模型

斯坦福发布ai基础模型“透明度指标”

...要包含“模型训练上是否准确介绍了模型的模式、规模、架构”，平均透明度为63%。表现最差的则是影响（Impact），主要评估基础模型是否会“调取用户信息进行评估”，平均透明度只有11%。CRFM主任PercyLiang表示，商业基础模型...……更多

2023-10-21 16:47:00斯坦,斯坦福,透明度,模型,指标,基础

智慧芯同频共创，大模型智引未来，星宸科技开发者大会暨产品发布

...、性价比最高的需求。唐本冰同步分享了基于SAC8542的CMS架构、DMS/OMS+DVR架构，基于SAC8904的前视ADAS架构等创新方案，“我们的车载芯片出货量已超千万，未来将继续与产业链伙伴加大合作力度，加速实现汽车领域入门及腰部市...……更多

2023-12-25 13:02:00共创,开发者,发布会,模型,智慧,大会

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...了全面的性能升级，其采用4000亿级参数MoE混合专家模型架构，是目前全球模型参数最大、性能最强的MoE模型之一。“天工3.0”的模型能力提升体现在以下四大方面：1、逻辑推理能力更强：更聪明逻辑推理能力的提升对于大模型...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

AI 面试：蓝海还是“难海”？

...的专业知识，以加强对上下文的理解。为此，以公司首席架构师 Dr. Laurence Lau 创造的 Talent-DNA 框架为基础，基于公司资深的 HR 行业专家知识，公司技术团队用结构化的形式总结人力资源知识，构建了自有知识图谱，通过带标签...……更多

2023-10-31 21:02:00还是,公司,算法,招聘,智能,候选人

合成数据企业「光轮智能」获数千万Pre-A轮融资，加速端到端

...，引领了端到端自动驾驶研发的新趋势。但FSD V12的技术架构和复杂环境适应性需求对训练数据提出了更高的要求。数据的数量、质量和丰富度直接决定了算法的成熟度、安全性和商业化进程。“数据饥渴”正成为端到端自动驾...……更多

2024-05-31 13:59:00光轮,数千,融资,驾驶,智能,商业

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...朝向之所以能够做到更自然的交互，和Gemini的原生多模态架构密不可分。Google解释了部分的训练细节。比如，Gemini的团队从一开始就针对不同的模态进行预训练，然后再使用额外的多模态数据对其进行微调，以进一步提升其能力...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

英伟达发布Llama-3.1-Nemotron-51B AI

... AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型将于 Meta 公司 2024 年 7 月发布的 ……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存