模型,性能,训练,模型,训练,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题，可谓是绞尽脑汁。目前来看，合成数据或许就是大模型的未来，也成为业...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

常见电子邮件分类算法的性能分析

...值向量，进而利用监督学习的方法进行训练。通过训练，模型能够学习到从文本到类别的映射关系，从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词：TF-IDF；决策树...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

Meta的开源大模型Llama 3在市场上遇冷，进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道，Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注，AWS的企业客户更倾向于使用Anthropic...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...而，构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外，高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日，由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。针对此，港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架，能够更好地捕捉用户的潜在偏好...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

比ChatGPT省电10倍 Google研训练AI模型新方法

...次数比现在少13倍而运算量也少10倍，成功超越最先进的模型。根据Google DeepMind研究团队发布的研究报告，数据品质是预训练表现的重要驱动因素。Phi-3、Gemma 2等模型表明，更少但高品质的数据可以实现更强大的性能。若要筛选...……更多

2024-07-09 17:41:00模型,训练,方法,数据,模型,人工智能

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训

...分认识并认可了表征学习的重要性，那么视觉领域的生成模型呢？最近，谢赛宁团队发表的一篇研究就拿出了非常有力的证据：Representation matters！扩散模型如何突破瓶颈？成本高又难训练的DiT/SiT模型如何提升效率？对于这个问...……更多

2024-10-23 09:55:00新作,速度,训练,学习,模型,训练

谷歌员工曝AI改进速度放缓，Gemini已成立新团队解决问题

...为提升其聊天机器人产品Gemini的性能而努力，该公司希望模型性能提升的速度可以与去年相当，这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称，OpenAI模型性能提升速度有所放缓，该...……更多

2024-11-15 09:51:00立新,团队,员工,速度,问题,模型

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限，Meta 官方称，在一系列任务中，其性能可与最好的闭源模型相媲美。下...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

连续无故障训练15天！摩尔线程发布夸娥智算集群KUAE 1.

...上多维升级，更高效、稳定，对生态系统更友好，可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点：▼MFU提升10% 最高可达55%在新版本中，使用千卡集群训练千亿模型，MFU(模型算力利用率)提升10%。稠密模型集群训...……更多

2024-08-19 20:22:00摩尔,集群,线程,训练,模型,训练

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

【新智元导读】大模型热，企业落地难？就在刚刚，百川智能推出「1+3」产品矩阵，一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」，仅需10分钟就能让企业自主成为模型定制增强专家，实现行业最...……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中，可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世，后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日，...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

openai新旗舰模型“orion”性能不及预期

11月11日，海外媒体表示OpenAI即将推出的新旗舰模型“Orion”在性能上的提升幅度不及预期。与GPT-3到GPT-4的显著进步相比，Orion相较于GPT-4的提升显得微不足道。Orion和GPT-4均基于变压器架构，但在设计上有所区别。GPT-4作为GPT-3的...……更多

2024-11-13 03:51:00旗舰,模型,性能,模型,训练,进步

“言”之有“力”，大模型背后的算力“推手”

...目——《云上之翼》，今天我们一起走进思必驰，探访大模型背后的算力“推手”。算力让AI“一路狂飙”思必驰是国内专业的对话式人工智能平台公司。以人机对话交互为核心，为智能汽车、智能家居、智慧政务等领域的客户...……更多

2024-01-05 12:48:00推手,模型,背后,天翼,模型,智能

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

清华郑纬民院士：AI for Science的出现，让高性能

...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础上，量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会：MEET大会是由量子位主办的智能科...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

最强算力设施练就“最强大脑”

...设施练就“最强大脑”本报记者曹政如果把人工智能大模型比作一位小学生，那么数据训练时所用的“语料”和“算力”，就相当于小学生“刷题”时使用的习题册和计算器，帮助他掌握知识点、更快给出正确答案。如今，北...……更多

2024-03-30 03:42:00大脑,设施,模型,人工智能,训练,人工

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

首个多模态连续学习综述，港中文、清华、UIC联合发布

...态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时，新的任务训练会严重干扰之前...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...流配送等关键领域具有重要意义。然而，现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题，限制了模型的泛化能力和实际应用范围。近日，来自于香港科技大学（广州）、南方科技大学、...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...【新智元导读】Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...点在于，Llama 3.2成为羊驼家族中，首个支持多模态能力的模型。Connect大会上，新出炉的Llama 3.2包含了小型（11B）和中型（90B）两种版本的主要视觉模型。正如Meta所说，这两款模型能够直接替代，相对应的文本模型，而且在图像...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

page 2/3000 首页上一页 123 4 5 6 7 下一页末页

更多关于科技的资讯：

以旧换新消费热！汇川区家电家居卖场客流倍增

多彩贵州网讯春节期间，消费市场迎来旺季，汇川区紧跟国家步伐，借力消费品以旧换新补贴政策，在家电、家居、汽车等关键领域精准发力

2025-02-12 22:48:00

雷军要学叉车了还号召同事一起学组织叉车比赛

快科技2月12日消息，此前在12月31日晚间，雷军在跨年直播时表示，他曾经想过开叉车，被告知还需要专门的驾照。雷军当场立下flag

2025-02-12 22:50:00

网友馋哭了！小米食堂好吃还不贵：午餐、晚餐平均仅16元

快科技2月12日消息，今晚雷军开启了元宵节直播，两个多小时里，带大家逛了小米食堂，还品尝了食堂最有特色的美食。据了解，小米食堂一共11800平方米

2025-02-12 22:50:00

贵州超算赋能动画电影《哪吒2》| 实现艺术性与工业美学完美结

2025年春节档的票房大战硝烟未散，一部以东方神话为底色的动画电影《哪吒之魔童闹海》（以下简称《哪吒2》）以雷霆之势横扫市场

2025-02-12 22:51:00

【观点摘登】许淑萍：深化科技创新，提升体育产业竞争力

加强科技创新是提升体育产业竞争力的关键。近年来，随着材料技术、人工智能、大数据等前沿科技与体育深度融合，体育产业科技含量越来越高

2025-02-12 22:51:00

买奥迪当嫁妆两个月无法提车 4S店：合格证在银行所有车都卖

快科技2月12日消息，据报道，浙江绍兴周女士介绍，去年12月8日，家里人在绍兴宏奥4S店，花费22.6万多给她外甥女购买了一辆奥迪A4L

2025-02-12 19:19:00

2.7万条三文鱼“出逃” 海产品公司竟以每条325元悬赏抓捕

快科技2月12日消息，据媒体报道，近日，总部位于挪威的全球知名海产品公司美威正在重金悬赏抓捕“出逃”的2.7万条三文鱼

2025-02-12 19:19:00

美味的深海怪物！一鮟鱇鱼海面游泳被人类偶遇：着实罕见

快科技2月12日消息，在常年见不到阳光的海洋深处，其实也生活着不少的动物，其中大多数长相丑陋，毕竟也见不到什么人，就随便长长算了

2025-02-12 19:19:00

23岁小伙两个月减肥40斤致秃头：不吃任何碳水化合物

2月12日消息，据媒体报道，宁波一名小伙遇到了“脱发危机”。据小伙介绍，他体重200斤，决心依靠“管住嘴”来减重，几乎不碰油脂

2025-02-12 19:19:00

最高频率近3.3GHz！索泰RTX 5080 AMP EXT

一、前言：支持双BIOS的索泰RTX 5080次旗舰1月29日，RTX 5080正式解禁，在实际功耗比上代RTX 4080低了近10%的情况下

2025-02-12 19:49:00

山东登上《哪吒2》全国各省票房榜第一名网友：山东人不语只是

2月12日消息，据媒体报道，截至2月12日11时，《哪吒2》全国各省份票房数据显示，山东登上全国第一位。对此，有网友表示

2025-02-12 19:49:00

ABC比基尼安睡裤卫生巾被抵制官方回应：非新品去年已停止

快科技2月12日消息，日前，ABC一款“比基尼安睡裤”卫生巾新品引发热议。有网友认为，该产品为“经期性感”牺牲舒适度，比基尼式还有偷工减料的嫌疑

2025-02-12 19:49:00

如何理解引力波效应？《张朝阳的物理课》推导测地偏离方程

上次物理课已讲完引力波的挤压模式和摇摆模式，本次物理课从测地线方程推导出弱场慢速近似下的形变方程。2月9日12时，《张朝阳的物理课》第二百三十三期开播

2025-02-12 19:56:00

江西定南：开足马力忙生产

本文转自：人民网-江西频道在生产车间内，智能“下片”机器人在抓取生产的光伏玻璃产品。近日，在位于定南县老城镇的赣悦新材料有限公司生产车间内

2025-02-12 20:04:00

雷军元宵节宴请SU7 Ultra车主称不少宝马Mpower

快科技2月12日消息，雷军元宵节直播时宴请了几位小米SU7 Ultra车主。在得知该用户是宝马M5车主后雷军表示：“不少宝马Mpower车主选择我们”

2025-02-12 20:19:00

头条订阅服务