模型,参数,模型,训练,测试,时计头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

英伟达h100gpu再创多项新纪录

...推出了新的测试项目，专门针对微调（Fine-tuning）大语言模型和图神经网络（GNN），而英伟达H100创下了多项纪录。Fine-tuning是指在预训练模型的基础上，通过在特定任务上进行额外的训练来调整模型的参数，以使其更好地适应该...……更多

2024-06-15 03:42:00英伟,纪录,英伟,测试,英特,基准

图灵奖得主Yoshua Bengio新作：Were RNNs

自从 Transformer 模型问世以来，试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手，不仅要挑战 Transformer 的地位，还致敬了经典论文的名字。再看这篇论文的作者列表，图灵奖得主、深度学习三巨头之一的 Yoshu...……更多

2024-10-15 09:56:00图灵奖,图灵,得主,新作,序列,训练

腾讯自研大模型助力长三角打造世界级产业集群

...团副总裁、政企业务总裁李强表示，腾讯不仅通过自研大模型服务千行百业，也拥有坚实的AI基础设施服务，为中国大模型产业繁荣发展提供技术支撑。去年9月，腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多

2024-05-24 17:14:00长三角,腾讯,集群,模型,产业,世界

stabilityai推出小语言ai模型

...lityAI日前发布新闻稿，公布了一款名为StableLM21.6B的AI“小模型”，这是该公司今年推出的第二款模型，号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知，这款AI模型支持英语、西班牙语、德语、意大利语、法...……更多

2024-01-22 11:31:00小语,模型,模型,小语,新闻稿,新闻

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

360智脑成全国首个原生安全的大模型产品之一

...科技股份有限公司今天宣布，12月22日国内首个官方“大模型标准符合性测试”结果公布，360智脑成为首批通过的大模型产品之一。据介绍，360智脑是全国首个原生安全的大模型，官方声称其拥有自研千亿参数规模，核心能力位...……更多

2023-12-23 14:53:00模型,安全,产品,模型,符合性,用户

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

9月5日，腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

李开复回应旗下AI独角兽陷“套壳”争议：起步受益于开源，会进

...前“套壳”争议的官方回应，并在配文中写道：“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi，行业逐渐形成大模型的通用标准（就像做一个手机APP开发者，不会去自创iOS、Android 以外的全新基础架构）。01.AI.……更多

2023-11-16 16:45:00李开复,独角兽,旗下,争议,进步,模型

从0到1：国产化千卡集群的一小步，AI算力主动权的一大步

...。供求关系紧张是产生算力焦虑的根源所在。一方面，大模型训练与推理需求呈几何级数爆发——自2022年以来，人工智能算力需求每3~4个月就翻一番，每年训练AI模型所需算力增幅高达10倍，而生成式AI使上升曲线进一步陡峭，...……更多

2024-04-28 11:52:00小步,主动权,集群,大步,主动,国产

马斯克的AI模型登场！叛逆风格独树一帜数据优势成最大卖点

...，社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。（来源：xAI）Grok一词，是英国作家道格拉斯·亚当斯在知名科幻小说《异乡异客》造出来的概念。《牛津英语词典》对这个词的解释包括“直观地或通过同理心理解...……更多

2023-11-06 09:08:00马斯,马斯克,模型,时间,社交,团队

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

微软紧随英伟达发布芯片，老黄还不慌吗？

...显存具备更大的容量和更高带宽，可以支持超大参数的大模型训练与推理。官方给出的参数显示，H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。可以看出，从MI300X到H200，再到Maia100，大厂对训练参数量、训练...……更多

2023-11-23 09:36:00老黄,英伟,微软,芯片,芯片,英伟

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

自主研制！我国发布“全球首个”

...技术大会在山东济南开幕：全球首个百亿级遥感解译基础模型“空天·灵眸”3.0版正式发布；“北斗精准导航与高分遥感综合服务平台”正式发布。全球首个百亿级遥感解译基础模型发布中国科学院空天信息创新研究院科研团队...……更多

2024-09-23 13:45:00我国,全球,空天,遥感,模型,北斗

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

阿维塔07 Ultra版将在10月下旬开始生产

...竞争关系。近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型...……更多

2024-10-15 02:11:00阿维,生产,阿维,模型,别为,苹果公司

邬贺铨院士：金融大模型改变了金融科技范式

...本文转自：光明网10月17日下午，百度世界·度小满金融大模型前沿发展论坛在北京召开，中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式，重塑金融行业的工作方式，改变了金融服务生态。”中国工程院...……更多

2023-10-17 17:57:00邬贺铨,金融,范式,院士,模型,科技

清华提出时间序列大模型：面向通用时序分析的生成式Transf

【新智元导读】大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

OpenAI又放大招，一文看懂Sora对AI领域的影响

...破?2024年2月16日凌晨，OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限，而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是，Sora较好地表现出了...……更多

2024-02-21 19:01:00一文,领域,影响,模型,视频,文生

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...编辑｜邓咏仪1月30日，科大讯飞发布新升级的讯飞认知大模型星火V3.5，并发布了自研的语音大模型，以及星火开源大模型——星火开源-13B。过去一年，科大讯飞的重点都在大模型方向上，临近岁末放出大量更新，某种程度也展...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

超级人工智能会偷袭人类吗？

...预见它的到来并来得及向全世界发出警报？随着大型语言模型，如ChatGPT的兴起，这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象，即人工智能模型以一种骤然...……更多

2023-12-29 07:44:00人工智能,人工,人类,智能,模型,研究

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

全新小布助手开启新一轮公测！OPPO官宣与联发科技共建大模型

10月11日，OPPO宣布与联发科技合作共建轻量化大模型端侧部署方案，通过采用4位量化技术，实现精度不掉点效果下端侧化性能更优，共同推动 AndesGPT 大语言模型和多模态大模型在端侧逐步落地。 AndesGPT 作为OPPO自主训练的生成...……更多

2023-10-11 16:40:00小布,联发,公测,启新,一轮,助手

小扎新开源的Llama3.1，要带着套壳大模型追平GPT-4

...，开源 AI 界扛把子 Meta AI ，昨晚更新他们最新最强的大模型， Llama3.1 。这玩意跟上次 Llama3 一样也是三个版本，除了同参数量的 80 亿和 700 亿，这次最亮眼的是他们的超大杯，在老黄数万显卡的供应下，小扎的新模型用了足足...……更多

2024-07-25 09:20:00模型,训练,模型,伯格,数据,扎克

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微

【新智元导读】谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型，又上新了！就...……更多

2024-08-02 09:55:00小钢炮,显微镜,大脑,模型,编码器,特征