模型,训练,方法,模型,训练,视觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

硬件在人工智能基础教育中的角色: 机遇和挑战

...理方法、神经元架构以及联结方式（特别是近期对大数据模型如transformer和Mamba架构的研究），以及网络训练方法。二、人工智能在基础教学中面临的问题叶琛博士认为，在人工智能领域，两个研究领域各有优势和特点，在人...……更多

2024-06-26 14:45:00人工智能,人工,机遇,角色,硬件,智能

被字节起诉索赔 800 万的实习生拿下 NeurIPS 20

...顶级学术会议NIPS2024最佳论文近日出炉，字节跳动"破坏大模型训练"的前实习生田某某与字节合作论文被人工智能顶级会议NeurIPS评为最佳论文（BestPaper），引发关注。今年10月，字节跳动发布《关于"实习生破坏大模型训练"的事实...……更多

2024-12-04 21:05:00实习生,索赔,字节,实习,论文,字节

专家模型不要专家并行！微软开源MoE新路径

...日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。继Phi家族之后，微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头（16 * 3.8B），却采用了截然不同的训练方法...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

谷歌DeepMind展示大模型Genie，能从零制作类似超级

OpenAI 最近公布了其令人惊叹的视频生成模型 Sora，打破了文本到视频生成模型的天花板。近日，谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。（来源：GOOGLE DEEPMIND）这款名为 Genie 的新模型可以接受简短的文字描述、...……更多

2024-03-02 10:19:00马里,马里奥,模型,制作,视频,生成

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

推动大模型自我进化，北理工推出「流星雨计划」

...地与环境和自身频繁交互，并从中获取经验予以改进。大模型自我进化研究之所以重要，正是源于该思想，并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势，北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

谷歌deepmind公布ai模型训练法

...15日消息，谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法，号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind（下同）据悉，FunSearch模型训练...……更多

2023-12-16 02:20:00模型,训练,模型,问题,训练,研究人员

寒武纪神经网络模型量化训练方法专利获授权

...全资子公司安徽寒武纪信息科技有限公司“一种神经网络模型的量化训练方法、装置及设备”专利获授权。企查查专利摘要显示，该方法包括：在正向传播过程中，获取待量化层的第一输入数据和参数；分别对第一输入数据和参...……更多

2025-09-15 10:00:00神经网络,模型,神经,训练,专利,方法

科大讯飞申请对话模型训练等专利，提升多轮对话的生成质量

...局信息显示，科大讯飞股份有限公司申请一项名为“对话模型训练方法、对话方法、系统、设备及介质”的专利，公开号 CN119862964A ，申请日期为 2025 年 3 月。专利摘要显示，本发明提供一种对话模型训练方法、对话方法、系统...……更多

2025-04-26 21:25:00讯飞,对话,生成,模型,训练,专利

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级

...许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

2B多模态新SOTA！华科、华南理工发布Mini-Monke

...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

美国东北大学提出视频数据增强方法，能让视频模型学到更好的表征

...数据增强方法由于其缓解过拟合的特性，而被广泛使用在模型训练过程中，例如图像的旋转、缩放、颜色的改变等等。然而，美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性，色调（Hue）的变化却...……更多

2024-05-07 10:12:00东北大学,视频,美国,模型,方法,数据

中国石油发布700亿参数昆仑大模型建设成果

...月28日，以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办，标志着中国石油在人工智能领域又迈出坚实一步。发布会上，中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多

2024-11-29 09:25:00昆仑,中国,模型,成果,参数,石油

腾讯申请文本标签预测方法等专利，提高了综合标签打分模型的预测

...景，所述方法包括：将目标多媒体资源输入综合标签打分模型，得到目标文本标签以及目标文本标签的目标分数；综合标签打分模型为基于第一样本分数结果与第一样本分数标签之间的差异，对待训练标签打分模型进行训练得到...……更多

2025-05-24 11:17:00标签,腾讯,准确率,模型,文本,专利

OpenAI GPT-4 AI 模型无需额外训练可通过日本理

...消息，一项新的同行评审研究表明，OpenAI 的 GPT-4 大语言模型无需任何额外训练，即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究，测试了 GPT-4 的文字和视觉技能。IT之家注：日本国家物理理疗师考试包括 160 ...……更多

2024-09-02 09:54:00可通,理疗,日本,模型,训练,考试

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月，我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司，往往只聚焦在...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍

...科学家们已经建立了一个框架，通过将它们浓缩到更小的模型中，在不影响质量的情况下，给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明，由于一项技术可以将整个100个阶段的过程浓...……更多

2024-03-27 13:42:00麻省理工,麻省,生成器,人工智能,提速,科学家

自然语言处理：大模型理论与实践

今天分享的是：自然语言处理：大模型理论与实践报告共计：450页《自然语言处理：大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多

2024-10-23 20:38:00自然语言,模型,实践,理论,自然,语言

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模型间展现出强大的可迁移性。多模态对比学习（如CLIP）...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

DeepSeek V3小版本大升级：推理、前端开发加强这些

快科技3月25日消息，今晚，DeepSeek官宣，DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。虽然是小版本更新...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

真香！智谱大模型，有了首个免费的API

大模型API，正式进入Flash时代。最近一段时间，国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上，新发布的 Gemini 1.5 大模型序列中出现了 Flash 版，主打轻量化和响应速度。到 7 月，OpenAI 又在 GPT-4o 的基础上推出了 Min...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

广州视源电子科技股份有限公司申请图像分辨率放大模型训练专利，

...源电子科技股份有限公司申请一项名为“图像分辨率放大模型训练方法、装置、存储介质及设备”的专利，公开号CN 119693730 A，申请日期为2023年9月。专利摘要显示，本申请公开了一种图像分辨率放大模型训练方法、装置、存储...……更多

2025-03-29 11:17:00图像,分辨率,科技股,广州,模型,效率

京东方Ａ获得发明专利授权：“摘要生成模型训练方法、装置、电子

...（000725）新获得一项发明专利授权，专利名为“摘要生成模型训练方法、装置、电子设备和非瞬态计算机可读存储介质”，专利申请号为CN202110349303.4，授权日为2025年3月11日。专利摘要：本发明提供一种摘要生成模型训练方法、...……更多

2025-03-12 03:40:00京东方,京东,电子设备,介质,装置,生成

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

RLHF不够用了，OpenAI设计出了新的奖励机制

OpenAI 的新奖励机制，让大模型更听话了。自大模型兴起以来，使用强化学习从人类反馈（RLHF）中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致，我们需要定义期望行...……更多

2024-07-26 09:35:00不够,奖励,机制,设计,模型,安全

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

page 5/2667 首页上一页 1 2 3 456 7 8 9 10 下一页末页

更多关于科技的资讯：

全球跨境电商产业基地启动

“直播+平台+跨境”生态加速“杭州智造”货通全球杭州日报讯近日，杭州综试区全球跨境电商产业基地在滨江阿里中心正式启动

2025-12-11 06:40:00

杭州具身智能机器人“加速起跑”

与未来共舞从图纸到现实，外骨骼机器人成为人类好帮手。患者使用外骨骼机器人进行康复训练。杭州日报讯具身智能，正从实验室快速走向产业化

2025-12-11 07:11:00

坚定信心勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事

关键设备共享为宁晋线缆带来什么——河北特色产业集群共享智造故事（五）11月26日，位于宁晋县的缆芯高导（河北）科技有限公司共享车间

2025-12-10 08:07:00

今年厦门空港跨境电商出口突破1亿单

厦门网讯（厦门日报记者吴晓菁通讯员许佳琦杨怡婷）昨日，厦门空港元翔货站跨境电商出口区一片忙碌景象，一辆辆满载货物的叉车来回穿梭

2025-12-10 08:38:00

警惕伪装成办公文件的木马病毒窃密国家安全机关提示

中国网12月10日讯据国家安全部微信公众号消息，国家安全部发布安全提示文章，“本月考勤公示”“年度放假安排”“高温补贴发放声明”等办公类文件

2025-12-10 08:41:00

清华、维信诺联合开发的pTSF技术破解OLED“不可能三角”

屏幕，作为用户感知数字世界的核心窗口，其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透

2025-12-10 11:13:00

智能机器人大赛昌平收官 73支队伍四大赛道沉浸竞技机器人实

本报讯（记者张月朦）12月8日至9日，2025智能机器人大赛决赛在昌平举办。大赛设制造业类、康复养老类、安全应急类和创新类四大赛道

2025-12-10 14:14:00

研究揭示：人生黄金期在55-60岁，整体能力达顶峰

鲁网12月10日讯人们普遍认为，“年轻即巅峰”。然而，一项发表于国际权威心理学期刊《智力》的最新研究，彻底颠覆了这一传统认知

2025-12-10 16:21:00

山东移动临沂分公司智能融通提升网络服务效能

鲁网12月10日讯山东移动临沂分公司坚决落实“以人民为中心”发展理念，强化“全心全意为人民服务”的宗旨意识，筑牢高质量发展生命线的服务方针

2025-12-10 16:24:00

潮评丨从独角兽榜单看浙江创新之势

全球独角兽企业数据库（Unicorn500)潮新闻讯据央视新闻报道，近日，2025全球独角兽企业500强榜单发布，我国共有150家企业上榜

2025-12-10 16:24:00

视频丨一支体温计的倒计时

大河网讯（记者李彤）大家好，我是水银体温计。我的时间，已经进入了倒计时。一直以来，我是每个家庭药箱里不可少的存在。我见证过无数滚烫的额头

2025-12-10 17:16:00

公益广告H5丨安全快门快乐连拍

扫描二维码进入H5

2025-12-10 17:28:00

福州一跨境电商企业向港交所提交上市申请

福州新闻网12月10日讯（记者吴桦真）记者10日获悉，福州企业米多多集团股份有限公司正式向香港联交所递交招股说明书，拟主板上市

2025-12-10 18:02:00

张家口数字经济拔节向上

大数据产业从“单点布局”迈向“生态闭环” 张家口数字经济拔节向上河北日报讯（郭晓通、王雯）“十四五”时期，张家口市把数字经济作为高质量发展的重要增长极

2025-12-10 18:34:00

QuestMobile报告：00后月活用户达1.79亿，闲鱼

12月9日，第三方数据机构QuestMobile发布《2025“00后”用户消费洞察报告》，显示闲鱼00后月活跃用户规模达到4361万

2025-12-10 19:13:00

头条订阅服务