小语,模型,家族,模型,小语,参数头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。比如最近，Llama-3.1 登上了最强开源大模型的宝座，但超大杯 405B 版本的内存就高达 900 多 GB，这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛，...……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

大模型这把大火，烧到了手机领域

配图来自Canva可画AI大模型从年初一直火到了年尾，但似乎离普通人还有些距离。不过，现在情况似乎有了一些变化，各大手机厂商们，正在争先恐后地把大模型装进手机里，让AI变得“触手可及”。在很多人看来，手机厂商入...……更多

2023-12-15 10:18:00大火,模型,领域,手机,模型,手机

微软被曝正自研AI大模型：5000亿个参数，与谷歌和Open

...巨头微软或正在研发参数达5000亿的全新AI（人工智能）大模型，将正面叫板谷歌和OpenAI。当地时间5月6日，据外媒报道，微软正在研发一款名为MAI-1的最新AI大模型，其规模远超出微软此前推出的一些开源模型，在性能上或能与谷...……更多

2024-05-07 14:33:00微软,模型,参数,竞争,微软,模型

中国电信何忠江发布千亿参数大模型

...能科技总经理何忠江正式发布了"星辰语义"千亿参数的大模型。据介绍，星辰语义大模型是中国电信自研大模型的升级，由此前的百万参数量级升至千亿，并且各项能力均有显著提升。何忠江表示，星辰语义拥有超12亿风格数据...……更多

2023-11-11 16:50:00中国电信,中国,模型,参数,电信,模型

中国电信进一步开源12B星辰大模型

...：德宏团结报性能提升30%！中国电信进一步开源12B星辰大模型本报讯近日，中国电信开源12B参数规模星辰语义大模型TeleChat-12B，相较1月开源7B版本，内容、性能和应用等方面整体效果提升30%，其中，多轮推理、安全问题等领域...……更多

2024-04-28 11:38:00进一,中国电信,中国,星辰,模型,电信

界面财联社入局AI，国内首个千亿参数多模态金融大模型面市

...：人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会（GDC）上首发。该大模型由财跃星辰自研推出，上海报业集团旗下界面财联社与通用大模型公司阶跃星辰共...……更多

2024-03-24 00:30:00模态,联社,模型,界面,参数,金融

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上，马斯克在7月份就在X平台上确认，Gr...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

“最强开源AI模型”，4050亿参数版Meta Llama

...援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采...……更多

2024-07-13 09:52:00日发布,模型,参数,模型,伯格,媒体

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...之心开源社区有福了。说到做到，马斯克承诺的开源版大模型 Grok 终于来了！今天凌晨，马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

全球最强开源大模型Llama 3发布：使用15T数据预训练，

就在刚刚，Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍，Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

最新财报：腾讯混元大模型参数规模扩展至万亿

...绩报告，财报指出：“腾讯混元已经发展成为领先的基础模型，在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构，已扩展为万亿参数规模。自亮相以来，腾讯混元大模型持续迭代升...……更多

2024-03-20 19:32:00腾讯,模型,参数,规模,腾讯,模型

阿里巴巴即将开源目前国内参数规模最大的大模型

阿里巴巴即将开源目前国内参数规模最大的大模型【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯，阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露，阿里巴巴即将开源720亿参数...……更多

2023-11-09 10:53:00阿里巴巴,阿里,模型,参数,规模,阿里巴巴

规模化落地还需打造“超级应用”

本文转自：科技日报大模型发展仍处初级阶段规模化落地还需打造“超级应用”◎本报记者操秀英“一年前我跟ChatGPT对话可能还有一点郑重其事的仪式感，现在这种对话已经无缝嵌入到了思考之中。”近日，物理学家、科普作...……更多

2024-06-17 02:37:00落地,规模,应用,模型,腾讯,应用

大模型如何实现商业价值？小i机器人袁辉：与客户共创生态，落地

随着AI技术的不断突破和迭代，先前涌现的各大模型迎来了进一步的落地应用。近日，小i机器人在上海正式发布华藏通用大模型生态体系，迈出了通用大模型商业化变现的重要一步。在发布会上，工作人员通过华藏输入“帮我...……更多

2023-11-01 10:02:00共创,机器人,落地,模型,生态,机器

贾扬清：大模型尺寸正重走CNN的老路；马斯克：在特斯拉也是这

Transformer大模型尺寸变化，正在重走CNN的老路！看到大家都被LLaMA 3.1吸引了注意力，贾扬清发出如此感慨。拿大模型尺寸的发展，和CNN的发展作对比，就能发现一个明显的趋势和现象：在ImageNet时代，研究人员和技术从业者见证...……更多

2024-08-02 09:47:00特斯,马斯,马斯克,扬清,特斯拉,老路

比Stable Diffusion便宜118倍！1890美元

...研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱？之前最便宜的方法（Wuerstchen）用了28400美元，而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多

2024-08-13 09:42:00文生,高质量,模型,参数,模型,训练

我国发布首个亿级参数量地震波大模型：名为“谛听”

...，据成都科技局官方公众号介绍，日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，“谛听”也是目...……更多

2024-07-29 19:01:00地震波,地震,模型,参数,我国,地震

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...家坚持开源的社交巨头，又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日，Meta在官网上发布了两款开源大模型，参数分别达到80亿和700亿，是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

20亿参数！谷歌发布轻量级开源人工智能模型Gemma

...CNMO新闻】近日，谷歌发布了其首个重要的开源大型语言模型Gemma，这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来，在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的，旨在为开发人员和研究者提...……更多

2024-02-22 20:42:00轻量,轻量级,人工智能,人工,模型,参数

阿里巴巴智能信息事业群发布千亿级参数夸克大模型

阿里巴巴智能信息事业群发布千亿级参数夸克大模型【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电，记者今日获悉，阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型，将应用于通...……更多

2023-11-14 15:05:00夸克,阿里巴巴,阿里,模型,参数,事业

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

?Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等...……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

践行新课标，名师领航促成长

...有了更深刻认识。基于课标，丰富经历促进表达田园外小语文教研组在银都校区开展了校级语文教研活动，市区小学语文专家陈祳老师、朱新亚老师莅临指导，赵瑛群校长、何敏副校长、语文部分骨干教师和15位云南昭通骨干...……更多

2023-10-26 09:30:00领航,名师,教学,语文,老师,教师

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

page 4/1000 首页上一页 1 2 345 6 7 8 9 下一页末页

更多关于科技的资讯：

湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术

12月2日，法国巴黎，在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展（Food Ingredients Europe

2025-12-07 16:44:00

具身智能站上“C位” 上城将加快建设CID：打造“创新之心”

当城市核心区的物理空间增长几近饱和，未来的竞争力新高地何在？12月5日，一场发布会以别开生面的“数字气味”体验开场，为上城区加快建设中央创新区（CID）的战略发布

2025-12-07 07:21:00

恒真自主研发“真空发热玻璃”上市

日前，山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合

2025-12-07 07:32:00

坚定信心勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事

生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事（四）纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临

2025-12-06 08:04:00

厦门移动智慧康养产品亮相首届海峡两岸（厦门）银发博览会

市民现场体验移动随心屏（闺蜜机）的AI舌象问诊功能。厦门网讯（文/厦门日报记者许晓婷王玉婷通讯员陈奕珣图/厦门移动提供）伸出舌头拍一拍

2025-12-06 08:26:00

AI微短剧站上新风口多家厦企“跑步入场”

厦门网讯（厦门日报记者林露虹）刷到一部微短剧，不知不觉被剧情吸引，回过神来看介绍，发现竟是AI参与制作的。类似经历

2025-12-06 08:26:00

从“手搓”到“智造” 厦门跑步机“跑”向全球

厦门网讯（厦门日报记者詹文林健华）在位于同安工业集中区的生产车间里，一节一节钢板正传送上激光切割台，自动切割、打孔

2025-12-06 08:26:00

共建共享破局资源瓶颈：临沂联通与电信合作以5G RedCap

鲁网12月5日讯近日，临沂联通与临沂电信深度践行国家共建共享战略，成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地

2025-12-06 13:44:00

“面向文博场景的智能伴游导览系统研发及示范应用”启动会召开

中国青年报客户端讯（中青报·中青网记者张均斌）近日，“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会

2025-12-06 15:25:00

2025教室节能照明标杆盘点四大品牌绿色护眼解决方案解析

在“双碳”目标引领下，校园节能改造成为教育领域绿色发展的重要方向。据住建部统计，商业建筑能耗中照明系统占比高达35%，学校作为人员密集

2025-12-06 16:09:00

海尔智慧家电亮相迪拜

11月26日至28日，中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中，海尔智家针对当地高温、多尘等特点，集中展示了洗衣机

2025-12-06 16:10:00

豆包手机助手惊艳亮相 AI手机概念引关注

12月1日，豆包手机助手技术预览版正式发布，首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础，与手机厂商在操作系统层面合作开发的AI助手软件

2025-12-06 17:41:00

文化中国行|全场听觉无死角吉林省音乐厅声学揭秘

历经修缮重生的丰乐剧场，以“吉林省音乐厅”之名即将绽放春城。这座历史建筑，从伪满时期影剧院到音乐剧场的跨越，背后藏着一套极致考究的声学设计方案

2025-12-06 18:41:00

伊贝格：让机床行业不再为“头”烦恼

“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件，过去很长一段时间被欧洲部分知名厂商垄断

2025-12-06 22:07:00

山东重工潍柴集团2026年商务大会圆满召开

鲁网12月6日讯12月6日，以“乘势向上聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记

2025-12-06 22:43:00

头条订阅服务