模型,训练,方法,模型,训练,视觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。...……更多

2024-09-03 09:59:00线性,新作,混合,作者,模型,线性

技术最前沿|瞄准行业痛点， AI验布机赋能传统行业技术焕新

...验布机专场推介会上发布了由TeleAI自研，基于星辰视觉大模型的AI验布机产品，预计年检测布匹3亿米。赋能传统行业技术焕新针对当前纺织行业织布和验布分开进行，无法在针织纬编机上直接进行验布，而是依赖人工质检，导...……更多

2024-06-25 09:44:00痛点,验布机,验布,行业,技术,传统

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

...Zhang (https://zhangyuanhan-ai.github.io/)，主要研究领域为将基础模型适配于开放世界。本文的指导老师为 Ziwei Liu 教授 ((https://liuziwei7.github.io/) 和 Chunyuan Li 博士 (https://chunyuan……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目

美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

...，Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大...……更多

2024-12-03 13:34:00三洲,欧亚,开发者,模型,流程,训练

华能水电获得发明专利授权：“基于ONNX的目标检测模型库系统

...获得一项发明专利授权，专利名为“基于ONNX的目标检测模型库系统构建方法”，专利申请号为CN202410002724.3，授权日为2025年2月11日。专利摘要：本发明公开一种基于ONNX的目标检测模型库系统构建方法，根据图像数据集，采用适...……更多

2025-02-13 03:23:00华能,水电,模型,检测,专利,目标

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果发现...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

AI大模型，进入攻防阶段

AI大模型的本质，就是用大量的数据进行训练，使其能够了解并掌握各种数据，你所看到的文字回答、图画、视频、音乐，其实都是由一个个数据子集根据模型算法所构造的结果。实际上，我们的大脑在回答问题时，也是类似的...……更多

2023-11-06 16:53:00模型,阶段,数据,毒丸,模型,污染

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...量问题而导致难产的节骨眼，Meta毫不客气发了它的视频模型“Movie Gen”，并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是，Meta还“杀人诛心”，虽然这模型目前和Sora一样还没对外开放，但它把新模型的95页技...……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...流配送等关键领域具有重要意义。然而，现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题，限制了模型的泛化能力和实际应用范围。近日，来自于香港科技大学（广州）、南方科技大学、...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

AI检测AI：“矛”更利还是“盾”更坚

...根据差异进行识别？AI检测工具如何应对越来越聪明的大模型？带着这些问题，记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代，但到目前为止，AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多

2024-08-16 10:04:00检测,还是,检测,模型,文本,技术

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

火山引擎发布大模型训练视频预处理方案已应用于豆包

10月15日消息，火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前，该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示，在AIGC、多模态等技术的共同推动下，用户体验在多个维度上经...……更多

2024-10-15 15:07:00豆包,预处理,火山,模型,训练,引擎

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...合成高分辨率、高质量，且具有强文本-图像对其能力的模型。而且，它还能高效生成高达4096×4096像素的图像。项目主页：https://nvlabs.github.io/Sana/论文地址：https://arxiv.org/abs/2410.10629Sana的核心设计包含了以下几个要素：深……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

史无前例！Seq2Seq和GAN同获NeurIPS时间检验奖

...超过27,000次。官方也给出了对应评价：随着当前大型语言模型和基础模型的快速发展，人工智能和应用领域发生了范式转变，该领域受益于这项工作奠定的基础。这是建立编码器-解码器架构的基础工作，启发了后来基于注意力...……更多

2024-11-28 09:56:00获奖,检验,时间,生成,判别,生成器

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...Alignment。3. 黄灿：厦门大学数学系副教授随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

发布不到1周，OpenAI最强模型o1的护城河已经没有了。有人发现，谷歌DeepMind一篇发表在8月的论文，揭示原理和o1的工作方式几乎一致。o1突发内幕曝光？谷歌更早揭示原理，大模型光有软件不存在护城河这项研究表明，增加测试...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

NeurIPS 2024 | FaceChain团队新作，开

...直在进行深入研究。采用了新一代的 Transformer 人脸表征模型 TransFace 后，FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作，FaceChain-FACT。继 TransFace 之后，FaceChain 团队最近被机器学习顶级国际会议 NeurI……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸