模型,论文,模型,训练,论文,开发头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限，Meta 官方称，在一系列任务中，其性能可与最好的闭源模型相媲美。下...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

超越GPT-4o！开源科研神器登场，4500万论文检索增强生

只需几秒钟，开源模型检索4500篇论文，比GPT-4o还靠谱！这就是由华盛顿大学和艾伦人工智能研究所（Ai2）打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多

2024-11-27 09:58:00论文检索,神器,生成,科研,检索,论文

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果发现...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

一块GPU都没用，苹果自研大模型干翻GPT-4？

...，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能：1、Siri升级。Siri唤醒后具备屏幕边缘发光特效，能理解用户表述不通顺的指令，且能回答关于苹果产品...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中，可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世，后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日，...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

世界首个AI科学家连发10篇论文，横扫「顶会」！一篇仅需10

...eak Accept的水准。世界首个「AI科学家」诞生了！现在的大模型已经可以独立搞科研，甚至完全不需要人类插手。这不，它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码，再到GPU上执行实验，收集结果，AI承包了整...……更多

2024-08-14 13:55:00仅需,科学家,效率,科研,人类,科学

遗憾不?百度早研究过Scaling Law,Anthropi

...Scaling Law 的相关研究，并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scaling 关系。只是，他们当时用的是 LSTM，而非 Transformer，也没有将相关发现命名为「Scaling Law」...……更多

2024-11-28 10:00:00灵感,遗憾,研究,模型,学习,曲线

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

字节版Sora火爆24小时，同名论文再次被热议

...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型，支持文生/图生视频，时长可达10s。以PixelDance为例，其最大特色在于多主体交互，一致性多镜头生成。啥意思？？——直接来看几个官方demo。First kill，现在手上有这...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输

【新智元导读】哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因，发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出，大模型在处理有广泛共识的问题时表现较好，但在...……更多

2024-10-26 09:51:00哈佛大学,哈佛,等价,共识,幻觉,输出

大模型是否有推理能力？DeepMind数月前的论文让AI社区

最近一段时间，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂

如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多

2024-07-19 09:45:00遗作,输出,模型,团队,两个,模型

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...e Information 的一篇文章。这篇文章透露，OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升，因为高质量文本和其他数据的供应量正在减少，原本的 Scaling Law（用更多的数据训练更大的模型）可能无以为继...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

国际最新研究称，一人工智能模型能翻译200种不同语言

...工智能(AI)研究论文称，研究人员开发出一个Meta人工智能模型的底层技术，该模型能翻译200种不同语言，增加了能用机器翻译的语言数量。该论文介绍，神经机器翻译模型利用人工神经网络翻译各种语言，这些模型通常需要大量...……更多

2024-06-08 16:04:00人工智能,人工,模型,语言,智能,研究

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理

...P）在线发表刊登北航 PHM 团队最新研究成果：基于大语言模型的轴承故障诊断框架（LLM-based Framework for Bearing Fault Diagnosis）。这是北航 PHM 实验室在健康管理大模型领域的成功尝试，研究团队提出了基于大语言模型的轴承故障诊...……更多

2024-11-29 09:27:00北航,健康管理,难题,实验室,模型,实验

港媒：中国科学家开发出AI模型或可预测全球洪水

...5月11日报道，中国科学家开发了一种新的人工智能（AI）模型，可以预测世界各地的洪水风险和跨区域流量，甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM，不同于其他预测模型依赖历史流量数据，它使用海拔和...……更多

2024-05-20 15:46:00洪水,中国,科学家,模型,科学,开发

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

类人神经网络再进一步！DeepMind最新50页论文提出Al

...提出了一种新框架AligNet，通过模拟人类判断来训练教师模型，并将类人结构迁移到预训练的视觉基础模型中，从而提高模型在多种任务上的表现，增强了模型的泛化性和鲁棒性，为实现更类人的人工智能系统铺平了道路。近年...……更多

2024-09-23 10:00:00神经网络,框架,层次,神经,视觉,人类

首位AI科学家问世！已独立生成10篇学术论文，还顺手搞了AI

...就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码，到在GPU上执行实验并收集结果，最后完成论文撰写，一气呵成。全由这位“AI科学家”自动搞定。每篇论文...……更多

2024-08-14 09:40:00审稿人,学术论文,科学家,生成,独立,学术

SIGGRAPH上首个Real-Time Live的中国团队

...誉提名，其研究成果亦在快速走向产业化。作者使用生成模型的方法，开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode，二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多

2024-08-10 09:46:00中国,生成,团队,世界,生成,模型

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...乎「配得上」这个体量？GPT-3.5只有200亿参数？今天，大模型圈都被微软论文中的一纸截图刷爆了，究竟是怎么回事？就在前几天，微软发表了篇论文并挂在了arXiv上，该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...成的博士论文代码，竟被 AI 在 1 个小时之内实现了。o1 模型已经强到，能够直出博士论文代码了！来自加州大学欧文分校（UCI）的物理学博士 Kyle Kabasares，实测 o1 preview+mini 后发现：自己肝了大约 1 年的博士代码，o1 竟在 1 小时...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

火爆全球的AI音频大模型，最新技术细节揭秘

...月19日在Arxiv上分享了Stable Audio Open的研究论文，公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型，可免费生成长达47秒的样本和音效，还可生成44.1kHz高质量立体声音频，并且能在消费...……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球