推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

本周（4.8-4.14）AI界发生了什么？

...模型中，只需一次API调用，该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B，参数规模高达1760亿，仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑，搭载AI功能当地时间4月11...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力，使其能够自我进化在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

2023内容科技应用典型案例：农业银行大模型ChatABC

...解决模型并行、数据并行等训练难题，提升AI大模型训练推理效率。应用：探索大模型知识融合新架构。构建异构知识库，支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架，支持文档类知识的高性能精...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

加速替代CUDA！摩尔线程开源vLLM-MUSA 加速国产G

...科技11月5日消息，近日，摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本，为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示，正努力围绕自主研发的统一系统架构GPU、MUSA软件...……更多

2024-11-05 21:09:00摩尔,线程,国产,摩尔,线程,移植

“女巴菲特”预期2030年人形机器人进入家庭，通用AI出现，

...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新，以提高性能并降低成本。随着生产用例的出现，AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后，研究人员现在正在优先...……更多

2024-02-05 09:41:00马斯,马斯克,巴菲,巴菲特,人形,机器人

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...佳论文奖。大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时，LLM 通常依赖记住特...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

如何让人工智能更节能

...阶段：训练和日常使用，后者用信息技术语言来说就是“推理”。萨莎·卢乔尼说道：“推理可能比训练带来的影响更大。一次使用可能并不需要很多计算，但时常更新就不一样了，例如人们熟知的谷歌翻译每天要更新数十亿次...……更多

2024-04-24 17:42:00人工智能,人工,节能,智能,研究,法国

李彦宏：开源模型将会越来越落后 | 最前线

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。其中，推理成本的大幅下降，对于大模型降低应用门槛意义最大。也就是说，客户原来如果一天调用模型1万次，现在同...……更多

2024-04-17 11:51:00李彦,越来,落后,模型,越来越,模型

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「废话」，OpenAI ...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

谷歌推出aihypercomputer超级电脑架构

...型，承载学术实验及较短的训练任务，或进行蒸馏、离线推理及批量性的任务，计费标准主要基于AI任务所使用的GPU与TPU量。而Calendar模式则可替AI任务预留开始时间，适用于需要精确开始时间及模型训练持续时间的任务，计费标...……更多

2023-12-08 03:32:00架构,电脑,架构,深度,任务,硬件

NeurIPS 2024|水印与高效推理如何两全其美？最新理

... sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效果和生成速度上达到了现有最...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

苹果黑科技将彻底改变iPhone 已有重大进展

...已经攻克了其中的重要技术挑战，可以最大限度减少AI在推理过程中，对于闪存和内存的占用，从而将推理延迟降低了4-5倍。而且，如果将其运行在GPU上，那么加速效果将提升20-25倍。一旦实现，就可以让智能手机真正部署大语...……更多

2023-12-24 19:50:00进展,苹果,科技,语言,智能,论文

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

... 和 ChartQA，它们不仅需要理解，还需要对图表进行强大的推理能力。对于这两个基准，PaLI-3 稍微落后于 PaLI-X。另外，研究人员还扩展了 PaLI-3 的功能，使其能够通过语言类似的输出来预测分割遮罩。实验结果表明，对于这种类...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

大模型应用疯狂加速，洗牌却在静悄悄进行了

...大能力，分别为：文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力，并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量，科大讯飞也做了多方面的准备。一方面，科大讯飞积极展开与业内巨头的合...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本