模型,训练,参数,数据,全球,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

让“私人助理”可随身携带

本文转自：科技日报把大模型装进手机让“私人助理”可随身携带图为一位女士正在使用手机查看数据。当大模型被装进手机后，人类与手机的交互方式或将发生改变。【AI世界】◎实习记者吴叶凡编者按在我国经济由高速增...……更多

2024-01-08 02:05:00助理,私人,模型,手机,王鹏,用户

OpenAI又放大招，一文看懂Sora对AI领域的影响

...破?2024年2月16日凌晨，OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限，而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是，Sora较好地表现出了...……更多

2024-02-21 19:01:00一文,领域,影响,模型,视频,文生

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...为什么不使用MoE架构？后训练与RLHF流程是如何进行的？模型评估是如何进行的？我们什么时候可以见到Llama 4？Meta是否会发展agent？恰逢Llama 3.1刚刚发布，Meta科学家就现身播客节目Latent Space，秉持着开源分享的精神，对以上问题...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

世界气象组织最新报告：AI 正在革新天气预报，更快、更便宜、

...存在的不足和未来展望。具体而言，在天气预测领域，AI 模型突破了基于物理模型的数值天气预报（NWP）模式，在预测某些天气变量及极端或危险事件（如热带气旋）方面已经超越了物理模型，如 Keisler、Pathak 等学者的研究展示...……更多

2024-09-24 13:42:00世界气象组织,革新,气象,更快,天气预报,预报

港媒：中国科学家开发出AI模型或可预测全球洪水

...5月11日报道，中国科学家开发了一种新的人工智能（AI）模型，可以预测世界各地的洪水风险和跨区域流量，甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM，不同于其他预测模型依赖历史流量数据，它使用海拔和...……更多

2024-05-20 15:46:00洪水,中国,科学家,模型,科学,开发

常见电子邮件分类算法的性能分析

...值向量，进而利用监督学习的方法进行训练。通过训练，模型能够学习到从文本到类别的映射关系，从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词：TF-IDF；决策树...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

自定义Llama 3.1模型的利器来了！NVIDIA打造生成

...务和NVIDIA NIM推理微服务，与刚推出的Meta Llama 3.1系列开源模型一起，为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVIDIA Tensor Core GPU上训练而成，并针对NVIDIA加速……更多

2024-07-25 09:30:00代工厂,代工,利器,生成,模型,服务

算力市场格局生变，谁能“拔得头筹”？

...源人工智能研究院发布了全球首个单体稠密万亿参数语义模型Tele-FLM-1T，成为国内首批发布稠密万亿参数大模型的机构。针对大模型训练算力消耗高的问题，TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系...……更多

2024-06-19 17:06:00头筹,格局,市场,模型,公司,平治

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型，并宣布全面开源。“源2.0”包括102B（1026亿）、51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

openai公司宣布改善微调api，进一步扩展定制模型计划

...闻稿，宣布改善微调（fine-tuning）API，并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch（将训练数据集中的所有样本都过一遍（且仅过一遍）的训练过程）...……更多

2024-04-05 16:22:00进一,模型,公司,模型,训练,数据

浪潮信息推出as13000g7-n系列

...步伐，于近日推出分布式全闪存储AS13000G7-N系列，专为大模型优化而设，为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎DataTurbo，通过盘控协同、GPU直访存储、全局一致性缓存...……更多

2024-06-16 10:27:00浪潮信息,浪潮,信息,模型,数据,训练

大模型手机密集下场：华为、荣耀、OPPO、vivo、小米杀疯

不出意外，AI大模型浪潮卷到了智能手机领域，智能手机厂商争先恐后地自研AI大模型或者联手AI大模型厂商，挖掘智能手机与AI大模型的融合发展的巨大潜力。10月26日，荣耀CEO赵明官宣新机荣耀Magic6的部分信息。他表示，新机...……更多

2023-11-06 15:03:00华为,荣耀,小米,模型,手机,模型

Meta推出Llama 3，号称“最强开源大模型”

Meta发布最新开源模型Llama3，号称“有史以来最强大的开源大模型”。在Llama3发布后没多久，就破纪录地登顶了全球开源AI社区HuggingFace排行榜，还使Meta股价在大盘小跌的情况下上涨了1.54%，影响力可见一斑。据了解，此次Meta推...……更多

2024-04-20 19:17:00模型,模型,越来,多语,版本,伯格

马斯克宣布训练“世界上最强大的人工智能” ！万卡集群背后的算

...张卡的训练集群，研发MegaScale生产系统，用于训练大语言模型；科大讯飞2023年建成了首个支持大模型训练的超万卡集群算力平台“飞星一号”。7月1日，腾讯宣布其自研星脉高性能计算网络全面升级，升级后的星脉网络2.0搭载全...……更多

2024-07-24 14:02:00马斯,马斯克,万卡,人工智能,集群,竞赛

微调大模型，AMD MI300X就够了！跟着这篇博客微调Ll

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。比如最近，Llama-3.1 登上了最强开源大模型的宝座，但超大杯 405B 版本的内存就高达 900 多 GB，这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛，...……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

如果MaaS是个伪命题大模型时代的“云”应该怎么建？

2024 年的大模型产业，注定将是会被反复提起的历史一页。这一年，被按下加速键的市场，刚刚过半，就已经显示出冰火两重天的格局：算法的单模态扩展到多模态，趋势如燎原之火，让全球陷入对世界模型畅想的狂欢中醺然欲...……更多

2024-07-13 09:54:00命题,模型,时代,亚马,亚马逊,模型

每月141元的ChatGPT Plus订阅重新开放，背后发生

...新的石油。」图/ X（Twitter）但算力依然受限，核心是大模型训练、推理都严重依赖于英伟达高端 GPU，而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底，还是算力不够用，「供给」赶不上...……更多

2023-12-15 11:26:00订阅,背后,开放,英伟,芯片,模型

千行百业加速拥抱大模型（AI前沿观察）

...术创新快应用渗透强国际竞争激烈千行百业加速拥抱大模型（AI前沿观察）潘旭涛陈斯达《人民日报海外版》（ 2023年12月22日第 08 版）在湖南省长沙市举办的2023世界计算大会专题展上，参观者在了解AI大模型。新华社记者 ...……更多

2023-12-22 03:26:00百业,模型,观察,模型,语料,数据

微软、英伟达纷纷押注小模型，大模型不香了？

...发展的道路上，科技巨头们曾经竞相开发规模庞大的语言模型，但如今出现了一种新趋势：小型语言模型（SLM）正逐渐崭露头角，挑战着过去“越大越好”的观念。视觉中国当地时间8月21日，微软和英伟达相继发布了最新的小型...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

信号表征指数级强、内存节省35%，量子隐式表征网络

...结果也证实了 QIREN 的确表现出超越信号表示任务上 SOTA 模型的优异性能，在参数量更少的情况下，拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收...……更多

2024-06-27 09:24:00量子,信号,内存,指数,网络,量子

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据