模型,性能,训练,模型,训练,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

最强算力设施练就“最强大脑”

...设施练就“最强大脑”本报记者曹政如果把人工智能大模型比作一位小学生，那么数据训练时所用的“语料”和“算力”，就相当于小学生“刷题”时使用的习题册和计算器，帮助他掌握知识点、更快给出正确答案。如今，北...……更多

2024-03-30 03:42:00大脑,设施,模型,人工智能,训练,人工

首个多模态连续学习综述，港中文、清华、UIC联合发布

...态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时，新的任务训练会严重干扰之前...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

李飞飞团队“50美元”复现DeepSeek R1？真相是…

s1模型的训练并非从零开始，而是基于阿里云通义千问（Qwen）模型进行监督微调。s1模型的神奇“低成本”，是建立在已具备强大能力的开源基础模型之上，可谓依然是开源的胜利。作者 | 黄心怡今日一则关于人工智能领域的新...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...流配送等关键领域具有重要意义。然而，现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题，限制了模型的泛化能力和实际应用范围。近日，来自于香港科技大学（广州）、南方科技大学、...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...【新智元导读】Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...点在于，Llama 3.2成为羊驼家族中，首个支持多模态能力的模型。Connect大会上，新出炉的Llama 3.2包含了小型（11B）和中型（90B）两种版本的主要视觉模型。正如Meta所说，这两款模型能够直接替代，相对应的文本模型，而且在图像...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品｜搜狐科技作者｜郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走？近日，清华大学计算机系讲席教授、人工智能研究院基础模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

一个5月份完成训练的大模型，无法对《黑神话·悟空》游戏内容相关问题给出准确回答。这是大模型的老毛病了。因为《黑神话》8月才上市，训练数据里没有它的相关知识。众所周知，大模型的训练和微调会消耗大量计算资源...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

小模型正在成为AI界的新宠

大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼（Mustafa Suleyman）预测，仅在未来三年内，大模型规模以惊人的速度继续扩张，将增长 1000 倍。一方面，模型的参数量与其能够处理和学习的复杂性...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...为什么不使用MoE架构？后训练与RLHF流程是如何进行的？模型评估是如何进行的？我们什么时候可以见到Llama 4？Meta是否会发展agent？恰逢Llama 3.1刚刚发布，Meta科学家就现身播客节目Latent Space，秉持着开源分享的精神，对以上问题...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分

...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型，提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用，尤其是在图像分类任务上。然而，由于数据集的限制和模型的复杂性，深度学习模...……更多

2023-10-23 16:02:00图像,分类,全息,深度,模型,准确性

AI “早筛” 癌症，准确区分13种癌症，准确率98.2%，

...帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET，通过观察 DNA 甲基化模式，从非癌组织中识别出 13 种不同类型的癌症（包括乳腺癌、肝癌、肺癌和前列腺癌等），准确率高达 98.2%。相关论文以“Early de...……更多

2024-06-27 08:48:00癌症,准确率,人类,治疗,癌症,模型

DeepSeek的能力，到底从哪里来？

...ixabay撰文 | 张天祁● ● ●今年年初，DeepSeek发布DeepSeek-R1模型，引发全球的关注。在公开评测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

人工智能的第三支柱：数据存储

...据会因其功能性或娱乐性被保存。新型AI用例和更先进的模型令现有数据资源库和额外数据源对模型上下文和训练的价值更甚。数据的不断生成促成了更多的数据存储，而更多的数据存储又进一步推动数据生成，一个良性循环的...……更多

2024-09-05 14:25:00人工智能,支柱,人工,存储,智能,数据

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

【新智元导读】UrbanGPT是一种创新的时空大型语言模型，它通过结合时空依赖编码器和指令微调技术，展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖，即使在数据稀缺的情...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

人工智能训练师与数据科学家的区别

...重于数据的收集、清洗、分析和可视化，并通过构建数据模型来解释数据。另一方面，人工智能训练师的核心职责是训练和优化AI模型。他们专注于使用机器学习和深度学习算法来开发和改进AI系统。AI训练师需要对数据进行预处...……更多

2024-06-29 02:26:00人工智能,科学家,人工,训练,智能,科学

当大模型Scaling Law继续,万卡集群算力释放在百舸找

...一世纪什么最贵？人才！」而随着人工智能行业进入到大模型时代，这一问题的答案已然变成了「算力」。随着模型规模急剧扩张，参数已经飙升到了千亿甚至万亿级，业界开启了千模大战，AI 算力需求不可避免迎来爆炸式增长...……更多

2024-09-26 13:37:00万卡,百舸,通途,集群,模型,百舸

DeepSeek被美国质疑“偷窃”，遭OpenAI微软调查

...暂未回应。值得一提的是，此前许多外界人士认为通过模型蒸馏技术，DeepSeek可能在训练过程中使用了 ChatGPT 等模型的输出数据作为训练材料，而这些数据中的「知识」被迁移到 DeepSeek 自己的模型中。事实上，这种做法在 AI 领...……更多

2025-01-29 21:29:00微软,美国,调查,模型,英伟,训练

NeurIPS Spotlight｜从分类到生成：无训练的可

近年来，扩散模型（Diffusion Models）已成为生成模型领域的研究前沿，它们在图像生成、视频生成、分子设计、音频生成等众多领域展现出强大的能力。然而，生成符合特定条件（如标签、属性或能量分布）的样本，通常需要为...……更多

2024-12-06 09:52:00生成,训练,分类,生成,样本,指导

机器人训练更高效低成本！英伟达官宣Isaac Sim4.2，

... G6e 实例上提供，可以使机器人模拟的规模翻倍并加速 AI 模型训练。同时，借助云原生编排平台 NVIDIA OSMO，开发人员可以在其 AWS 计算基础设施中轻松管理复杂的机器人工作流。英伟达 Omniverse 高级产品营销经理 Akhil Docca 提到：...……更多

2024-12-05 09:45:00英伟,达官,机器人,机器,成本,性能

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...变得儒雅随和：开启Apple Intelligence后，苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈，不像其他家的AI那样动不动就是拒绝服务。与此同时，苹果自家大模型的报告也已出炉，披露了大量技术细节。报...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

如何让“机器不学习”？学会“遗忘”将使新一代AI更出色

...可能会泄露私人数据，计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难，但“机器不学习”的解决方案已经开始出现。这项工作除了能解除人们对隐私和错误信息的担忧外，还能起到一个至关重要的作用——如...……更多

2024-06-14 11:54:00新一代,机器,学习,模型,数据,训练

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

page 3/3334 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

以数字化转型驱动管理能级跃升，积极培育新质生产力

在数字经济浪潮奔涌、国企改革持续深化的时代背景下，绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台，勇立潮头，以深刻的变革意识和前瞻的战略视野

2025-11-27 10:07:00

厦门春节赴加拿大旅游市场热度攀升已有不少人预订

厦门网讯（厦门日报记者沈彦彦王元晖）“政策一出台，咨询电话就没停过！”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话

2025-11-27 08:12:00

“脑”力全开！江西抢滩脑机接口新蓝海

当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景，从科幻照进现实，一场关乎未来产业格局的竞赛已悄然启幕

2025-11-27 07:13:00

太原知识产权调委会力促专利侵权案和解

专利技术遭盗用，创新成果被侵犯，专利权人该如何维权？11月24日，市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法

2025-11-26 08:11:00

感恩节“心”守护：灵动生活集团全链条心理服务破局，让3000

当感恩节的暖意在街头巷尾流转，“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天

2025-11-26 08:35:00

省级产业云平台落户中北大学

省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告，建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目

2025-11-26 08:41:00

“晋塔”智能装备赋能太原建筑行业

为推动智能建造落地应用，搭建行业交流平台，近日，“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机

2025-11-26 08:42:00

经济热力站｜绿色转型为基金融创新为翼科技赋能为核——助推

11月19日，“京彩不设限・经济热力站”月度主题走访活动再度启程，记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心

2025-11-26 10:06:00

赞皇县：AI赋能“一网通办” 业务办理效率提升70%

河北新闻网讯（次柳静）近日，石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法，创新打造AI“智能填报”平台

2025-11-26 10:07:00

河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训

河北新闻网讯近日，河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校，开展了主题为“产品经理人才共创培养体系”主题培训

2025-11-26 10:09:00

南京生物医药：研发“拔节孕穗”，产业新星闪耀

第91届全国药交会在宁落幕南京生物医药：研发“拔节孕穗”，产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天，南京国际博览中心人流如织

2025-11-26 10:26:00

2025年两院院士增选结果揭晓南京地区7人入选在宁院士总

南报网讯（记者何洁张安琪）11月21日，2025年两院院士增选结果正式揭晓，选举产生中国科学院院士73人、中国工程院院士71人

2025-11-26 10:27:00

隐风文化：锚定四大理念，以精品力穿越短剧周期

由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度，上线后迅速跃居红果站内热播榜高位，这也是今年团队继《咬清梨》《怎敌她动人》之后

2025-11-26 11:06:00

视源股份荣获2024年度广东省科技进步一等奖

2025年11月20日，广东省人民政府正式发布《2024年度广东省科学技术奖通报》（粤府〔2025〕50号）。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目

2025-11-26 11:06:00

视源股份成为英特尔首批尊享级合作伙伴合作再升级

近日，英特尔合作伙伴联盟完成战略升级，联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累

2025-11-26 11:06:00

头条订阅服务