一鸣,霸主,模型,再次,模型,序列头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Mamba再次挑战霸主Transformer！首个通用Mam

【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天，阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

清华提出时间序列大模型：面向通用时序分析的生成式Transf

【新智元导读】大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

出门问问大模型「序列猴子」向全社会开放

来源：极目新闻11月4日，出门问问自研大模型「序列猴子」正式向全社会开放。即日起，广大用户可登陆基于「序列猴子」的AI写作助手奇妙文，或AI开放平台体验。今年4月，出门问问「序列猴子」开启邀测。「序列猴子」以语...……更多

2023-11-05 17:06:00全社,序列,猴子,模型,开放,序列

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Tr

...Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯！相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因：LLM没有足够空间，来存储计数向量。Strawber...……更多

2024-09-09 13:36:00小哥,原地,外国,论文,小哥,研究者

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...：乔杨好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

麻省理工学院联合metaai开发streamingllm框架

...研究人员日前开发了一款名为StreamingLLM的框架，为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案，号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的研究重点，是想解决实现流式语言模型（...……更多

2023-10-07 00:12:00麻省理工学院,麻省,理工,框架,联合,学院

图灵奖得主Yoshua Bengio新作：Were RNNs

自从 Transformer 模型问世以来，试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手，不仅要挑战 Transformer 的地位，还致敬了经典论文的名字。再看这篇论文的作者列表，图灵奖得主、深度学习三巨头之一的 Yoshu...……更多

2024-10-15 09:56:00图灵奖,图灵,得主,新作,序列,训练

值得收藏！2023 年，你应该知道的所有机器学习算法~

...今年，我想在去年发表文章的基础上提供各类别中更多的模型。希望提供一个工具和技术的宝库，你可以将其作为书签，这样就可以解决各种数据科学的问题了。说到这里，让我们深入了解以下六种最重要的机器学习算法类型。...……更多

2023-01-25 13:00:00算法,机器,学习,算法,数据,学习

出门问问亮相2024世界人工智能大会，再掀AIGC新审美浪潮

...“AIGC第一股”出门问问（02438.HK）携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵，包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会，为...……更多

2024-07-07 18:45:00人工智能,浪潮,审美,人工,大会,智能

当ChatGPT遇上CRISPR

...道，日前，研究人员公布了他们使用一种名为蛋白质语言模型的生成式人工智能工具，设计CRISPR基因编辑蛋白质的细节，并证明其中一些系统能够像预期那样工作。今年2月，另一个团队曾宣布，他们已经开发出一种基于微生物...……更多

2024-05-06 06:37:00基因,人工智能,蛋白,序列,设计,蛋白质

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

【新智元导读】继去年初的第一代VALL-E模型之后，微软最近又上新了VALL-E 2模型，标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近，微软发布了零样本的文本到语音（TTS）模型VAL...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

【新智元导读】音视频大语言模型在处理视频内容时，往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新：音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

上海交大团队研发通用人工智能，解决传统蛋白质工程难题

...而数倍乃至数十倍地减少时间和经济成本。此外，由于该模型具有通用性，对各领域都适用，决定了它将大大加速我国生物制造业、合成生物学、生物医药等领域的发展，帮助我国企业与国际头部公司进行良性互动与竞争。相关...……更多

2024-05-07 09:24:00上海交大,人工智能,交大,上海,蛋白质,蛋白

infini-attention：谷歌大内存机制

...歌大改Transformer，“无限”长度上下文来了。现在，1B大模型上下文长度可扩展到1M（100万token，大约相当于10部小说），并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中，拿下最新SOTA。这就是谷歌最新提出的...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

AI蛋白质折叠：在生命宇宙中漫游，远眺生物经济的流光

...对预测，要所有对一起预测，并又一次率先开发出端到端模型。相关成果于2019年8月在美国国家科学院院刊（PNAS）发表，全球范围内首次将AI应用至蛋白质氨基酸（原子）之间的距离预测，进一步提升了蛋白质三维结构预测的精...……更多

2024-09-18 15:04:00流光,蛋白质,漫游,蛋白,宇宙,生命

3天把Llama训成Mamba，性能不降，推理更快！

...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

生成式AI大模型：有望实现生命从头设计

...源：IC photo□ 王琳琳刘传波12月8日，谷歌发布最强AI 3个模型。其中，Gemini Nano 是一个更轻便的版本，可以在安卓设备上原生离线运行。谷歌首席执行官将其描述为“人工智能模型的一次巨大飞跃”。而最近发表在国际顶级期刊...……更多

2023-12-25 05:45:00从头,生成,模型,生命,设计,蛋白质

出门问问重磅发布全新2.5D数字人系统 WetaAvatar

在 AIGC 技术的推动下，视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务，以其领先的创新能力，提供了高度真实与生动的数字体验，吸引了众多用户的目光。目前，这一先进技术已经成功部署...……更多

2024-04-09 14:00:00重磅,全新,数字,系统,数字,系统

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...呢？很快，你就能知道了。三位哈佛辍学生，挑战AI芯片霸主英伟达成立于2022年，这家35人团队的初创公司Etched，坚信一定能够击败英伟达。到底是什么样的背景，能让三位哈佛辍学生，敢于挑战芯片行业目前最炙手可热的赛道...……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

...前在寻找 2025 fall 博士入学机会。最近，lvmin 带来了最新模型 Paints-UNDO。这款 AI 生成工具可以根据图片还原整个绘画过程，整个 AIGC 社区都为之震撼。Paints-UNDO 的演示 demo。早在 1 个月前，NUS，SJTU，Tiamat 等机构联合已经发布……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

1890美元，就能从头训练一个还不错的12亿参数扩散模型

...只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多

2024-07-30 09:37:00从头,模型,训练,参数,掩蔽,训练

出门问问入选「中国AI大模型平台排行榜TOP10」

5月21日，AI大模型工场发布「中国AI大模型平台排行榜」。出门问问凭借在开放进度、模型能力和商业化进度的优异表现，成功入选TOP10。出门问问是一家以生成式AI与语音交互技术为核心业务的AI企业，拥有全栈式语音交互能力...……更多

2024-06-06 11:45:00中国,模型,排行榜,平台,模型,模态

大模型的未来，快手在自己身上找答案

...检票口久违的出现了许多黄牛，这一切都意味着国内对大模型的关注从 2023 年小圈子里的迅速升温，到现在的白热。所有人都在想尽办法靠近大模型，所有公司都在寻找一种对大模型来说合适的描述方式，但从目前来看，大多都...……更多

2024-07-11 14:20:00快手,模型,答案,快手,模型,小芳

仅用4块GPU、不到3天训练出开源版GPT-4o，这是国内团

...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型（LLM）已成为强大的通用任务解决器，但大多数 LLM 仅支持基于文本的交互，这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多

2024-09-24 13:42:00团队,训练,这是,研究,语音,文本

谷歌 VS OpenAI：当搜索霸主和屠龙少年迈入同一条河流

...歌通过 Gemini 赶了个晚集，想要再度证明自己在AI时代「霸主候选人」的实力。而OpenAI 和谷歌，一个是经历了「宫斗」后的屠龙少年，另一个则是领先的搜索霸主，在关于谁究竟能成为大模型时代的最终赢家这一问题上，也存在...……更多

2023-12-08 11:02:00霸主,河流,少年,搜索,模型,模态

Nature重磅研究：AlphaFold绘制病毒「族谱」，揭

...，Nature上最近刊登的一篇论文又解锁了AlphaFold这类生物大模型的新用途——揭示生物的亲缘关系和进化史。今年7月，被Meta解散的ESMFold团队成功另起炉灶，，打出的slogan正是「用语言模型模拟5亿年进化。」论文地址：https://evolut...……更多

2024-09-19 13:39:00族谱,重磅,身世,病毒,研究,病毒

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练