模型,论文,模型,训练,论文,开发头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Llama3训练每3小时崩一次？豆包大模型、港大为脆皮万卡训

伴随大模型迭代速度越来越快，训练集群规模越来越大，高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点，检查点（Checkpoint）系统在训练过程中负责状态的存储和恢复，已经成为克服训练故障、保障训练进度和提...……更多

2024-08-09 09:37:00万卡,训练,豆包,脆皮,大为,模型

Nature重磅研究：AlphaFold绘制病毒「族谱」，揭

...，Nature上最近刊登的一篇论文又解锁了AlphaFold这类生物大模型的新用途——揭示生物的亲缘关系和进化史。今年7月，被Meta解散的ESMFold团队成功另起炉灶，，打出的slogan正是「用语言模型模拟5亿年进化。」论文地址：https://evolut...……更多

2024-09-19 13:39:00族谱,重磅,身世,病毒,研究,病毒

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

讯飞星火V3.0发布，打造每个人的AI助手

...讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型V3.0，七大能力持续提升，整体超越ChatGPT，医疗领域超越GPT-4。星火3.0升级启发式对话、AI人设功能，能够打造更个性化的AI助手。面向应用场景，讯飞星火面向行业进...……更多

2023-10-24 15:02:00讯飞,星火,助手,讯飞,星火,模型

microsoftstart天气预报开发团队介绍全新ai模型

...开发团队近日在arXiv网站发表论文，介绍了一种全新的AI模型，可以更准确预估未来30天的天气情况。该模型结合了5种不同的人工智能模型和3种深度学习架构，并训练了过去数十年的天气数据，从而做出更准确的预测。微软表示...……更多

2024-05-06 00:39:00天气预报,预报,模型,团队,天气,全新

研究人员提出版权授权方案，能将艺术家风格和IP版权授权给AI

...人工智能极大地改变了人类生活。与此同时，由于这类大模型的训练需要非常巨大的训练数据，不可避免地会使用到人类创作者的未授权数据。比如说在图像生成领域，像 Stable Diffusion 和 Midjourney 可以很好地复刻一些艺术风格。...……更多

2024-06-24 09:13:00版权,研究人员,艺术家,模型,风格,人员

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

用60%成本干80%的事，DeepSeek分享沉淀多年的高性

... 3 倍、DRAM 带宽增长 1.6 倍、互连带宽则仅有 1.4 倍。而大模型是大数据 + 大计算的产物，其参数量可达千亿乃至万亿规模，需要成千上万台 GPU 才能有效完成训练。这些实际情况提升了人们对高性能计算（HPC）的需求。为了获得...……更多

2024-09-07 09:44:00高性能,架构,深度,多年,成本,学习

Sora靠什么引爆科技圈（海外人才）

...人事报美国人工智能公司OpenAI近日推出的生成式人工智能模型Sora，震动全球科技界，其背后的研究团队也浮出水面。根据OpenAI官网介绍，Sora团队包括两名研发负责人威廉·皮伯斯和蒂姆·布鲁克斯，系统负责人康纳·霍姆斯，以...……更多

2024-02-28 10:40:00海外人才,人才,科技,布鲁克斯,克斯,布鲁

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

meta推出全新开源大模型codellama70b

近日，Meta正式宣布推出全新开源大模型CodeLlama70B，据悉，CodeLlama70B在HumanEval基准测试中的准确率达到了53%，超过了GPT-3.5的48.1%，并且接近OpenAI的一篇论文（PDF）报告的GPT-4的67%，是目前评分最高的开源大模型。据CNMO了解，Cod……更多

2024-01-30 10:46:00模型,全新,代码,模型,开发者,生成器

华为昇思MindSpore2.3发布

...之间的桥梁。作为软件根技术，它已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。在近日召开的昇思人工智能框架峰会上，华为发布昇思MindSpore 2.3。作为国内主流开源框架，可以让开发者更灵活地实现大模...……更多

2024-03-28 01:02:00华为,模型,华为,框架,人民政协,开发

NeurIPS 2024评审结果公布！AI大佬晒出成绩单，又

...非常微妙，即使在过度参数化的情况下也是如此。而对大模型而言，权重衰减则扮演者完全不同的角色。与最初一版arXiv论文相比，研究人员对其进行了很多更新。Andriushchenko表示，自己非常喜欢这项新实验，并且匹配了AdamW有效...……更多

2024-09-29 09:55:00大佬,成绩单,评审,成绩,结果,又是

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

【新智元导读】继去年初的第一代VALL-E模型之后，微软最近又上新了VALL-E 2模型，标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近，微软发布了零样本的文本到语音（TTS）模型VAL...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

贾扬清共一论文获ICML时间检验奖：著名框架Caffe前身

...觉任务。事实证明，这个想法在今天仍然与最好的多模态模型非常相关！两位老搭档也在评论区叙上了旧： ICML今年是其举办的第41届，投稿量9000+，接受率27.5%。除了时间检验奖，最佳论文奖也已出炉，Stable Diffusion 3论文等上榜...……更多

2024-07-25 09:33:00扬清,前身,框架,检验,时间,论文

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...著的能力跟进，可见其技术发展与创新的潜力。除了Gemini模型外，Gemma这一系列轻量级的SOTA开放模型似乎与我们距离更近。它基于Gemini模型相同的研究和技术构建，旨在让每个人都拥有构建AI的工具。谷歌持续扩展Gemma家族，包...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

AI检测AI：“矛”更利还是“盾”更坚

...根据差异进行识别？AI检测工具如何应对越来越聪明的大模型？带着这些问题，记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代，但到目前为止，AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多

2024-08-16 10:04:00检测,还是,检测,模型,文本,技术

开源助推AI技术落地

...业股份有限公司（以下简称浪潮信息）发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制（LFA），可以有效捕捉局部信息和短依赖信息，使模型能够更精准地掌握上下文之间的强语义关联，学习人类语...……更多

2023-12-04 03:07:00助推,落地,技术,模型,数据,浪潮信息

国际最新研究：机器学习用“化学直觉”或助力药物研发更高效

...最新发表一篇化学论文称，研究人员研发出一种机器学习模型，该模型能部分重现职业化学家在工作中积累的集体知识，这类知识通常被称为“化学直觉”。该研究认为，这或使今后的药物研发更高效。据论文介绍，传统上，药...……更多

2023-11-01 21:26:00习用,直觉,药物,机器,化学,研究

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...Alignment。3. 黄灿：厦门大学数学系副教授随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

最新迭代人工智能模型生物结构预测准确率显著提升将助力药物研

...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3，能以较高准确率预测蛋白质与其他生物分子相互作用的结构，其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多

2024-05-09 11:54:00迭代,准确率,人工智能,药物,人工,模型