商用,模型,参数,模型,百川,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AIGC沸腾200多天后，投资人达成三大共识

...之前全球众多大模型基于Llama开发，但又受限于无法免费商用的情况。AI市场格局发生新变化，创投圈的关注点再次被锁定。当人们讨论人类人工智能奇点将近，AIGC时代全面到来时，随着AIGC的一路狂奔，事情慢慢起了变化。首先...……更多

2023-07-24 19:00:00多天,投资人,共识,三大,投资,模型

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

技术：大模型发展呈现“规模定律”，Transformer为技术基座1.1 大模型“大力出奇迹”的背后：Scaling Law大规模语言模型（Large Language Models，LLM）泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

麒麟商用大模型发布，有连云率先落地金融AIGC商业化

...与运营成本的高度浪费。有连云国内首款“麒麟金融场景商用AI大模型”，基于对金融行业敏锐的需求洞察力、以AIGC赋能革新传统解决方案，推出了云创、云连和云数的闭环产品矩阵，站在客户的角度打造全新的金融AIGC行业解...……更多

2023-07-28 16:40:00连云,麒麟,落地,商用,模型,金融

半年大模型，还在天上飞

...百度选择了推理文本数为付费标准，只是目前还无法cover商用隐性成本。如果采用B端喜闻乐见的月度付费，那也只是将成本支出方从用户转为自己，显然不是长久之计。ChatGPT面对C端用户20美元/月的定价之下，尚且存在偷工减料...……更多

2023-08-04 13:00:00模型,半年,模型,大厂,行业,数据

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

Yandex推出开源大语言模型训练工具，称可节省高达20%的

...球科技公司Yandex推出了YaFSDP，这是一种用于训练大型语言模型(LLM)的开源方法。据介绍，YaFSDP是目前在大型语言模型训练中增强图形处理器（GPU）通信并减少内存使用量的公开可用的最有效工具，与FSDP相比，根据架构和参数数量...……更多

2024-06-18 16:13:00处理器,图形,模型,高达,训练,语言

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...又多了一个选择！今日，腾讯宣布旗下的混元视频生成大模型（HunYuan-Video ）对外开源，模型参数量 130 亿，可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP，用户可在 AI 应用中的「AI 视频」板块申请试用。腾讯...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

这一代AI追随者的窘境

...个tensor（张量）”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。贾扬清的朋友圈之所以流传，很大程度是因为其戳破了AI圈一个人人皆知的秘密：所谓的自研大模型，其实“水分”很大。一位投资人曾对「暗涌Waves」...……更多

2023-11-27 15:12:00追随者,窘境,一代,模型,扬清,创业者

amd推出10亿参数语言模型系列amdolmo

...10月31日发布博文，宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo，为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列（LMs），在AMDInstinct™MI250GPU集群上训练，使用了超过1.3...……更多

2024-11-09 00:21:00模型,参数,语言,模型,开发者,训练

华为推出昇腾AI计算集群可支持超万亿参数大模型训练

华为推出昇腾AI计算集群可支持超万亿参数大模型训练【华为推出昇腾AI计算集群可支持超万亿参数大模型训练】《科创板日报》20日讯，华为今日推出全新架构的昇腾AI计算集群——Atlas 900 SuperCluster，可支持超万亿参数的大...……更多

2023-09-20 14:55:00华为,集群,模型,训练,参数,支持

1890美元，就能从头训练一个还不错的12亿参数扩散模型

...只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多

2024-07-30 09:37:00从头,模型,训练,参数,掩蔽,训练

1行代码改进大模型训练，Llama训练速度升至1.47倍，华

只要改一行代码，就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者，提出了大模型训练优化器Cautious Optimizers。在提速的同时，Cautious能够保证训练效果不出现损失，而且语言和视觉模型都适用。...……更多

2024-11-28 09:58:00训练,模型,团队,速度,代码,华人

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型，阿里通义又上新！4月29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...随着ChatGPT在法律、金融、营销等领域的广泛使用，确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性，我们根本无法验证其生成内容的准确性，这也就会出现输出“黑盒”的情况。为了...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

不必增加模型参数，计算资源相同，小模型性能超过比它大14倍的模型！谷歌DeepMind最新研究引发热议，甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

《长相思》AI角色火出圈，大模型厂商布局角色扮演情感陪伴

...宝app中。随着电视剧《长相思2》近日播出，腾讯旗下大模型应用“腾讯元宝”与腾讯视频联手推出相关AI角色，引发广泛关注。南都记者体验发现，观众可以在元宝app中与角色对话、进行剧情互动、玩角色COS等。据悉，在此次根...……更多

2024-07-16 13:42:00角色,角色扮演,长相,布局,模型,厂商

30多款大模型亮相，现阶段厂商比客户更需要大模型

...果不是在WAIC展会上，你很难有机会一口气见到这么多AI大模型。7月6日至8日，WAIC2023在上海举办，在这场人工智能领域规格最高的会议上，参与交流的大模型数量超30个，其中多个大模型是最新发布；在400余家参展商中，芯片企...……更多

2023-07-12 22:00:00模型,厂商,客户,模型,厂商,场景

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。春节假期后，国内多个行业龙头公司均宣布接入DeepSeek。2月8日，QuestMobile数据显示，DeepSeek在1月28日的日活跃用户数首次超越豆包，随后在2...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

微软被曝正自研AI大模型：5000亿个参数，与谷歌和Open

...巨头微软或正在研发参数达5000亿的全新AI（人工智能）大模型，将正面叫板谷歌和OpenAI。当地时间5月6日，据外媒报道，微软正在研发一款名为MAI-1的最新AI大模型，其规模远超出微软此前推出的一些开源模型，在性能上或能与谷...……更多

2024-05-07 14:33:00微软,模型,参数,竞争,微软,模型

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

huggingface公布“smollm”小语言模型家族

7月20日消息，如今小语言模型开始升温，许多厂商开始推出适用于手机等轻量级设备的“小模型”，本周HuggingFace便公布了“SmolLM”小语言模型家族，其中包含1.35亿、3.6亿及17亿参数模型。据介绍，这些模型号称是以精心策划的...……更多

2024-07-21 01:19:00小语,模型,家族,模型,小语,参数

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...务。每天有数十万客户依赖的Amazon Aurora，提供了企业级商用数据库的性能以及开源的灵活性和经济性。如今AWS再次重新构想关系数据库，让客户无需在低延迟或SQL之间做选择。Amazon Aurora DSQL是一种新型无服务器分布式SQL数据库...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

大模型行业资本暗流涌动，10亿元融资成入局门槛？

2024年，大模型发展势头依旧强劲，能力边界不断突破，不仅强化了自然语言处理能力，还在文生视频、辅助编程、数学推理等复杂领域攻城略地，催生了一系列创新应用，并获得了全球范围内的资本关注。据AltIndex（数据分析...……更多

2025-01-03 10:45:00暗流,门槛,融资,模型,资本,行业

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...而，构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外，高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日，由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...乎「配得上」这个体量？GPT-3.5只有200亿参数？今天，大模型圈都被微软论文中的一纸截图刷爆了，究竟是怎么回事？就在前几天，微软发表了篇论文并挂在了arXiv上，该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理