模型,论文,模型,训练,论文,开发头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限，Meta 官方称，在一系列任务中，其性能可与最好的闭源模型相媲美。下...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果发现...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

一块GPU都没用，苹果自研大模型干翻GPT-4？

...，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能：1、Siri升级。Siri唤醒后具备屏幕边缘发光特效，能理解用户表述不通顺的指令，且能回答关于苹果产品...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

世界首个AI科学家连发10篇论文，横扫「顶会」！一篇仅需10

...eak Accept的水准。世界首个「AI科学家」诞生了！现在的大模型已经可以独立搞科研，甚至完全不需要人类插手。这不，它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码，再到GPU上执行实验，收集结果，AI承包了整...……更多

2024-08-14 13:55:00仅需,科学家,效率,科研,人类,科学

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

字节版Sora火爆24小时，同名论文再次被热议

...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型，支持文生/图生视频，时长可达10s。以PixelDance为例，其最大特色在于多主体交互，一致性多镜头生成。啥意思？？——直接来看几个官方demo。First kill，现在手上有这...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输

【新智元导读】哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因，发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出，大模型在处理有广泛共识的问题时表现较好，但在...……更多

2024-10-26 09:51:00哈佛大学,哈佛,等价,共识,幻觉,输出

大模型是否有推理能力？DeepMind数月前的论文让AI社区

最近一段时间，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂

如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多

2024-07-19 09:45:00遗作,输出,模型,团队,两个,模型

国际最新研究称，一人工智能模型能翻译200种不同语言

...工智能(AI)研究论文称，研究人员开发出一个Meta人工智能模型的底层技术，该模型能翻译200种不同语言，增加了能用机器翻译的语言数量。该论文介绍，神经机器翻译模型利用人工神经网络翻译各种语言，这些模型通常需要大量...……更多

2024-06-08 16:04:00人工智能,人工,模型,语言,智能,研究

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

港媒：中国科学家开发出AI模型或可预测全球洪水

...5月11日报道，中国科学家开发了一种新的人工智能（AI）模型，可以预测世界各地的洪水风险和跨区域流量，甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM，不同于其他预测模型依赖历史流量数据，它使用海拔和...……更多

2024-05-20 15:46:00洪水,中国,科学家,模型,科学,开发

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

类人神经网络再进一步！DeepMind最新50页论文提出Al

...提出了一种新框架AligNet，通过模拟人类判断来训练教师模型，并将类人结构迁移到预训练的视觉基础模型中，从而提高模型在多种任务上的表现，增强了模型的泛化性和鲁棒性，为实现更类人的人工智能系统铺平了道路。近年...……更多

2024-09-23 10:00:00神经网络,框架,层次,神经,视觉,人类

首位AI科学家问世！已独立生成10篇学术论文，还顺手搞了AI

...就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码，到在GPU上执行实验并收集结果，最后完成论文撰写，一气呵成。全由这位“AI科学家”自动搞定。每篇论文...……更多

2024-08-14 09:40:00审稿人,学术论文,科学家,生成,独立,学术

SIGGRAPH上首个Real-Time Live的中国团队

...誉提名，其研究成果亦在快速走向产业化。作者使用生成模型的方法，开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode，二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多

2024-08-10 09:46:00中国,生成,团队,世界,生成,模型

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...乎「配得上」这个体量？GPT-3.5只有200亿参数？今天，大模型圈都被微软论文中的一纸截图刷爆了，究竟是怎么回事？就在前几天，微软发表了篇论文并挂在了arXiv上，该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...成的博士论文代码，竟被 AI 在 1 个小时之内实现了。o1 模型已经强到，能够直出博士论文代码了！来自加州大学欧文分校（UCI）的物理学博士 Kyle Kabasares，实测 o1 preview+mini 后发现：自己肝了大约 1 年的博士代码，o1 竟在 1 小时...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

火爆全球的AI音频大模型，最新技术细节揭秘

...月19日在Arxiv上分享了Stable Audio Open的研究论文，公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型，可免费生成长达47秒的样本和音效，还可生成44.1kHz高质量立体声音频，并且能在消费...……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球