新宠,模型,正在,模型,参数,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

我国发布首个亿级参数量地震波大模型：名为“谛听”

...，据成都科技局官方公众号介绍，日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，“谛听”也是目...……更多

2024-07-29 19:01:00地震波,地震,模型,参数,我国,地震

AI大模型有望再扩1000倍！剑桥耶鲁康奈尔：PNN是变革关

...一新兴的前沿领域还鲜少有人涉足，但绝对值得深耕！AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功，LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象，当前的模型规模如何能再扩大10倍...……更多

2024-07-15 09:33:00康奈尔,康奈,耶鲁,剑桥,变革,模型

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

浪潮信息推出as13000g7-n系列

...步伐，于近日推出分布式全闪存储AS13000G7-N系列，专为大模型优化而设，为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎DataTurbo，通过盘控协同、GPU直访存储、全局一致性缓存...……更多

2024-06-16 10:27:00浪潮信息,浪潮,信息,模型,数据,训练

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...量化」的基本概念和分支方法进行了全方位总结。大语言模型（LLM）通常过于庞大，无法在消费级硬件上运行。这些模型的参数可能超过数十亿，通常需要显存较大的GPU来加速推理过程。因此，越来越多的研究开始关注如何缩小...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

芯片战场丨瞄准大模型摩尔线程首个千卡智算中心落地

为满足大模型的“暴力”计算需求，国内GPU企业正加码算力基础设施建设。12月19日，摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍，这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多

2023-12-20 10:52:00摩尔,线程,落地,战场,芯片,模型

英伟达地表最强，黄教主被称作AI界“霉霉”

...多款重磅明星产品，目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练，行业内“一芯难求”的局面迟迟得不到缓解。而今年，按照英伟达每两年更新一次GPU架构的节奏，大家都对英伟达新一代计算平台翘首...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

AI探索宇宙结构新突破！超精准场级模拟，半秒完成冷暗物质仿真

...进行编码的样式参数。研究人员在六维N-body相空间上训练模型，将粒子速度预测为模型位移输出的时间导数，显著提高了训练效率和模型准确性。最终，模拟器在测试数据（训练期间未见过的各种宇宙学和红移）上实现了良好的...……更多

2024-09-20 13:34:00暗物质,仿真,宇宙,突破,结构,粒子

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型。12月1日，三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通义千问大模型也升级到...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

清华团队提出新型光计算架构，光训练速度提升1个数量级

...天贶（来源：该团队）研究团队通过建立光子传播对称性模型，未采用传统的电训练反向传播范式，化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚，基于通用的光计算原位训练系统，突破了电训练架...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

中国电信人工智能研究院发布首个支持30种方言混说的语音大模型

...TeleAI）发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型，打破单一模型只能识别特定单一方言的困境，可同时识别理解粤语、上海话、四川话、温州话等30多种方言，是国内支持最多方言...……更多

2024-05-27 14:51:00音大,中国电信,人工智能,方言,中国,研究院

国产GPU为底座，摩尔线程首个千卡智算中心落地

...2月19日，观察者网了解到，摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办，这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。与此同时，摩尔线程联合国内众多合作...……更多

2023-12-20 09:46:00摩尔,底座,线程,落地,国产,摩尔

苹果发布mm1.5-ui模型

...13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型文...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

从云栖大会，看阿里的科技本色

...火热的背景下，此次云栖大会上，阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布，通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多

2023-11-01 23:02:00阿里,本色,大会,科技,阿里,模型

类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究

视频生成模型虽然可以生成一些看似符合常识的视频，但被证实目前还无法理解物理规律！自从 Sora 横空出世，业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示，基于文本提示生...……更多

2024-11-09 09:59:00模型,豆包,系统性,字节,规律,团队

微软：从“软件老大”到“AI帝国”

从2009开始开发AI模型，到2019年投资OpenAI，微软正在一步一步成为AI时代的庞然大物。对于微软及其生态系统而言，今年的Ignite技术大会堪称异彩纷呈。微软一口气公布了100多项以 AI 为中心，在云计算基础设施、模型即服务 MaaS ...……更多

2023-11-21 10:45:00帝国,微软,老大,软件,微软,模型

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...，一大波测评刷屏全网。更惊喜的是，苹果AI背后的基础模型47页技术报告，也一并上线了。一大早，人们期待已久的「苹果AI」首个预览版，正式向开发者们推送了！iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1三大系统中，全都植入了苹...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

摩尔线程kuae千卡集群正式落地

12月19日消息，摩尔线程今日宣布，首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办，宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地，大模型智算加速卡MTTS4000也同步发布。...……更多

2023-12-20 06:02:00摩尔,集群,线程,落地,摩尔,线程

蜘蛛侠妖娆起舞，下代ControlNet来了！贾佳亚团队推出

...样的可控生成！而且SDXL、SD1.5等Stable Diffusion家族的常见模型都能适配，还是即插即用。同时还能搭配SVD控制视频生成，动作细节控制得精准到手指。在这些图像和视频的背后，就是港中文贾佳亚团队推出的开源图像/视频生成引...……更多

2024-08-19 09:37:00佳亚,蜘蛛侠,妖娆,蜘蛛,团队,控制

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品｜搜狐科技作者｜郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走？近日，清华大学计算机系讲席教授、人工智能研究院基础模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-7...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

反击OpenAI，谷歌放出最强悍大模型Gemini

...斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品，也是...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

oppofindx7系列带来行业首个端侧应用70亿参数大模型

...“AI”领域的布局，带来了行业首个端侧应用70亿参数大模型，以及领先的端侧视觉大模型性能。全新的FindX7系列带来了行业首个端侧应用70亿参数大模型，其可以通过“端云协同"架构实现在本地与云端协同运作的效果，让FindX7...……更多

2024-01-10 12:06:00模型,参数,应用,行业,小布,模型

字节“扣子”加入AI战场，2024大模型能搞到钱吗？

...源@视觉中国文 | 趣解商业，作者 | 张凯旌岁末年终，大模型厂商们又秀了一波“肌肉”。2月1日，此前在大模型领域一直保持“静默”状态的字节跳动终于有了新动作，其上线了“Coze扣子”AI Bot开发平台；与过往聊天机器人的...……更多

2024-02-04 14:00:00扣子,字节,战场,模型,模型,应用

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

广东：研发千亿级参数的人工智能通用大模型形成自主可控的大模

广东：研发千亿级参数的人工智能通用大模型形成自主可控的大模型完整技术体系【广东：研发千亿级参数的人工智能通用大模型形成自主可控的大模型完整技术体系】财联社11月13日电，广东省人民政府发布关于加快建设通...……更多

2023-11-13 10:49:00模型,人工智能,广东,人工,体系,参数