模型,训练,方法,模型,训练,视觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

硬件在人工智能基础教育中的角色: 机遇和挑战

...理方法、神经元架构以及联结方式（特别是近期对大数据模型如transformer和Mamba架构的研究），以及网络训练方法。二、人工智能在基础教学中面临的问题叶琛博士认为，在人工智能领域，两个研究领域各有优势和特点，在人...……更多

2024-06-26 14:45:00人工智能,人工,机遇,角色,硬件,智能

被字节起诉索赔 800 万的实习生拿下 NeurIPS 20

...顶级学术会议NIPS2024最佳论文近日出炉，字节跳动"破坏大模型训练"的前实习生田某某与字节合作论文被人工智能顶级会议NeurIPS评为最佳论文（BestPaper），引发关注。今年10月，字节跳动发布《关于"实习生破坏大模型训练"的事实...……更多

2024-12-04 21:05:00实习生,索赔,字节,实习,论文,字节

专家模型不要专家并行！微软开源MoE新路径

...日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。继Phi家族之后，微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头（16 * 3.8B），却采用了截然不同的训练方法...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

谷歌DeepMind展示大模型Genie，能从零制作类似超级

OpenAI 最近公布了其令人惊叹的视频生成模型 Sora，打破了文本到视频生成模型的天花板。近日，谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。（来源：GOOGLE DEEPMIND）这款名为 Genie 的新模型可以接受简短的文字描述、...……更多

2024-03-02 10:19:00马里,马里奥,模型,制作,视频,生成

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

推动大模型自我进化，北理工推出「流星雨计划」

...地与环境和自身频繁交互，并从中获取经验予以改进。大模型自我进化研究之所以重要，正是源于该思想，并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势，北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

谷歌deepmind公布ai模型训练法

...15日消息，谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法，号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind（下同）据悉，FunSearch模型训练...……更多

2023-12-16 02:20:00模型,训练,模型,问题,训练,研究人员

寒武纪神经网络模型量化训练方法专利获授权

...全资子公司安徽寒武纪信息科技有限公司“一种神经网络模型的量化训练方法、装置及设备”专利获授权。企查查专利摘要显示，该方法包括：在正向传播过程中，获取待量化层的第一输入数据和参数；分别对第一输入数据和参...……更多

2025-09-15 10:00:00神经网络,模型,神经,训练,专利,方法

科大讯飞申请对话模型训练等专利，提升多轮对话的生成质量

...局信息显示，科大讯飞股份有限公司申请一项名为“对话模型训练方法、对话方法、系统、设备及介质”的专利，公开号 CN119862964A ，申请日期为 2025 年 3 月。专利摘要显示，本发明提供一种对话模型训练方法、对话方法、系统...……更多

2025-04-26 21:25:00讯飞,对话,生成,模型,训练,专利

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级

...许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

2B多模态新SOTA！华科、华南理工发布Mini-Monke

...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

美国东北大学提出视频数据增强方法，能让视频模型学到更好的表征

...数据增强方法由于其缓解过拟合的特性，而被广泛使用在模型训练过程中，例如图像的旋转、缩放、颜色的改变等等。然而，美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性，色调（Hue）的变化却...……更多

2024-05-07 10:12:00东北大学,视频,美国,模型,方法,数据

中国石油发布700亿参数昆仑大模型建设成果

...月28日，以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办，标志着中国石油在人工智能领域又迈出坚实一步。发布会上，中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多

2024-11-29 09:25:00昆仑,中国,模型,成果,参数,石油

腾讯申请文本标签预测方法等专利，提高了综合标签打分模型的预测

...景，所述方法包括：将目标多媒体资源输入综合标签打分模型，得到目标文本标签以及目标文本标签的目标分数；综合标签打分模型为基于第一样本分数结果与第一样本分数标签之间的差异，对待训练标签打分模型进行训练得到...……更多

2025-05-24 11:17:00标签,腾讯,准确率,模型,文本,专利

OpenAI GPT-4 AI 模型无需额外训练可通过日本理

...消息，一项新的同行评审研究表明，OpenAI 的 GPT-4 大语言模型无需任何额外训练，即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究，测试了 GPT-4 的文字和视觉技能。IT之家注：日本国家物理理疗师考试包括 160 ...……更多

2024-09-02 09:54:00可通,理疗,日本,模型,训练,考试

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月，我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司，往往只聚焦在...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍

...科学家们已经建立了一个框架，通过将它们浓缩到更小的模型中，在不影响质量的情况下，给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明，由于一项技术可以将整个100个阶段的过程浓...……更多

2024-03-27 13:42:00麻省理工,麻省,生成器,人工智能,提速,科学家

自然语言处理：大模型理论与实践

今天分享的是：自然语言处理：大模型理论与实践报告共计：450页《自然语言处理：大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多

2024-10-23 20:38:00自然语言,模型,实践,理论,自然,语言

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模型间展现出强大的可迁移性。多模态对比学习（如CLIP）...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

DeepSeek V3小版本大升级：推理、前端开发加强这些

快科技3月25日消息，今晚，DeepSeek官宣，DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。虽然是小版本更新...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

真香！智谱大模型，有了首个免费的API

大模型API，正式进入Flash时代。最近一段时间，国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上，新发布的 Gemini 1.5 大模型序列中出现了 Flash 版，主打轻量化和响应速度。到 7 月，OpenAI 又在 GPT-4o 的基础上推出了 Min...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

广州视源电子科技股份有限公司申请图像分辨率放大模型训练专利，

...源电子科技股份有限公司申请一项名为“图像分辨率放大模型训练方法、装置、存储介质及设备”的专利，公开号CN 119693730 A，申请日期为2023年9月。专利摘要显示，本申请公开了一种图像分辨率放大模型训练方法、装置、存储...……更多

2025-03-29 11:17:00图像,分辨率,科技股,广州,模型,效率

京东方Ａ获得发明专利授权：“摘要生成模型训练方法、装置、电子

...（000725）新获得一项发明专利授权，专利名为“摘要生成模型训练方法、装置、电子设备和非瞬态计算机可读存储介质”，专利申请号为CN202110349303.4，授权日为2025年3月11日。专利摘要：本发明提供一种摘要生成模型训练方法、...……更多

2025-03-12 03:40:00京东方,京东,电子设备,介质,装置,生成

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

RLHF不够用了，OpenAI设计出了新的奖励机制

OpenAI 的新奖励机制，让大模型更听话了。自大模型兴起以来，使用强化学习从人类反馈（RLHF）中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致，我们需要定义期望行...……更多

2024-07-26 09:35:00不够,奖励,机制,设计,模型,安全

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

page 5/2667 首页上一页 1 2 3 456 7 8 9 10 下一页末页

更多关于科技的资讯：

葵花药业×淘宝闪购签署战略合作：共探“AI+超级入口”下的医

11月28日，在2025淘宝闪购“聚势共赢”医药即时电商峰会现场，葵花药业集团与淘宝闪购正式签署战略合作协议，成为淘宝闪购医药健康领域首批战略级合作伙伴之一

2025-12-03 10:11:00

解码三一重能：风电龙头的突围与出海

十月的北京，三一重能南口产业园区内，一座数十米高的风力发电机静静运转，园区内却是一派繁忙景象。作为三一集团在京重要产业集群

2025-12-03 10:11:00

不同地区互联网企业中统计学专业毕业生薪资对比分析

摘要：本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析，探讨薪资分布的现状及其影响因素。研究发现，一线城市和二线城市在薪资水平上存在显著差异

2025-12-03 06:16:00

中信银行石家庄分行以温情服务筑金融消费者幸福驿站

“张叔叔，这银行卡的密码可不能随便告诉别人，就连短信验证码也得藏好，那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水

2025-12-02 10:21:00

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

2025年11月27至29日，由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛

2025-12-02 11:03:00

腾讯云姚一兆：用全栈AI助力具身智能赛道加速发展

“具身智能是AI赛道中的焦点，其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力，助力具身智能赛道与广大企业共同发展

2025-12-02 11:03:00

2025年国内外麦角硫因补充剂深度测评：合成生物浪潮下的精选

在大健康消费升级与抗衰需求爆发的今天，麦角硫因作为“线粒体级”超级抗氧化剂，已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示

2025-12-02 11:31:00

企业级云服务器如何选？从可靠性到成本治理，看 AWS 的企业

企业数字化转型不断深化，业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座

2025-12-02 11:42:00

全维健康守护创造美好生活——富德生命人寿保险股份有限公司举

11月21日，富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护创造美好生活”为主题的健康险产品矩阵暨服务升级发布会

2025-12-02 12:11:00

深度解析GeneIII仅三麦角硫因胶囊：以合成生物技术，树立

GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书，成为兼具安全性

2025-12-02 14:27:00

从梅酒到书籍：梅见的文化升维之路

步入繁华的商业街区，不难发现一个耐人寻味的现象：店铺橱窗中的传统文化元素，正以近乎重复的方式不断上演。印着汉字 logo 的T恤

2025-12-02 14:35:00

丝玫瑰携手首玺丽格科创驱动美力升级

2025年12月2日，由键凯科技旗下医美产品线品牌——丝玫瑰®（SILKROSE）与北京首玺丽格联合举办的“中国‘智’造

2025-12-02 15:35:00

白酒+体育IP重构行业营销新范式，五粮液世界杯联名款京东首发

鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日，五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市

2025-12-02 15:36:00

从“车间老师傅”到“门店销冠”：飞书AI正在重塑吉利汽车研究

当AI逐渐褪去神秘面纱，谁是这场技术变革真正的操盘手？答案是：一线业务人。近日，首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官

2025-12-02 15:58:00

江瀚：即时零售不再打“补贴战”了

中新经纬12月2日电题：即时零售不再打“补贴战”了作者江瀚盘古智库高级研究员随着资本耐心减弱，单纯依赖补贴拉动的增长已难以为继

2025-12-02 16:09:00

头条订阅服务