推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

李彦宏：开源模型将会越来越落后 | 最前线

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。其中，推理成本的大幅下降，对于大模型降低应用门槛意义最大。也就是说，客户原来如果一天调用模型1万次，现在同...……更多

2024-04-17 11:51:00李彦,越来,落后,模型,越来越,模型

谷歌推出aihypercomputer超级电脑架构

...型，承载学术实验及较短的训练任务，或进行蒸馏、离线推理及批量性的任务，计费标准主要基于AI任务所使用的GPU与TPU量。而Calendar模式则可替AI任务预留开始时间，适用于需要精确开始时间及模型训练持续时间的任务，计费标...……更多

2023-12-08 03:32:00架构,电脑,架构,深度,任务,硬件

chatgpt低成本复现流程开源

...。相比原生PyTorch，单机训练速度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

苹果黑科技将彻底改变iPhone 已有重大进展

...已经攻克了其中的重要技术挑战，可以最大限度减少AI在推理过程中，对于闪存和内存的占用，从而将推理延迟降低了4-5倍。而且，如果将其运行在GPU上，那么加速效果将提升20-25倍。一旦实现，就可以让智能手机真正部署大语...……更多

2023-12-24 19:50:00进展,苹果,科技,语言,智能,论文

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

... 和 ChartQA，它们不仅需要理解，还需要对图表进行强大的推理能力。对于这两个基准，PaLI-3 稍微落后于 PaLI-X。另外，研究人员还扩展了 PaLI-3 的功能，使其能够通过语言类似的输出来预测分割遮罩。实验结果表明，对于这种类...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

大模型应用疯狂加速，洗牌却在静悄悄进行了

...大能力，分别为：文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力，并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量，科大讯飞也做了多方面的准备。一方面，科大讯飞积极展开与业内巨头的合...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

神州数码生成式AI战略升级，聚焦算力和AI应用工程平台研发｜

...于训练的高速成长阶段，基于我们对市场的理解，训练和推理的出货量大概在1：5 到1：6。随着未来人工智能在行业的深入应用，推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前，企...……更多

2024-03-30 20:30:00应用工程,神州数码,神州,生成,战略,升级

掰开安卓手机满屏都是三个字：大模型

...的内存单元，是大模型进手机面临的第二道难关：大模型推理需要大量计算资源做支撑，与此同时，内存大小决定了数据处理速度的上限以及推理的稳定性。另外，在手机上跑大模型，也给电池带来了更大的压力。因此芯片能耗...……更多

2023-11-16 20:30:00安卓,三个字,模型,三个,手机,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

小模型正在成为AI界的新宠

...算法，超越了同等大小和稍大一号的模型，在各种语言、推理、编码和数学基准测试中表现优异。苹果紧随其后，发布了 OpenELM，包含了 2.7 亿、4.5 亿、11 亿和 30 亿四个参数版本。与微软的 Phi-3 一样，OpenELM 也是一款专为终端设...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

OpenAI没有放弃的机器人梦想

...人团队，理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据，研发受到了阻碍。当时，在美国创业孵化器Y Combinator的论坛上，BuzzFeed数据科学家马克思·伍尔夫（Max Woolf）直言：“一种可能准确但带有讽刺意味的观...……更多

2024-03-18 10:00:00机器人,机器,梦想,机器人,机器,模型

chatgpt低成本复现流程来了

...。相比原生PyTorch，单机训练速度最高可提升 7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量 3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...当天开始，谷歌聊天机器人Bard将使用Gemini Pro来实现高级推理、规划、理解和其他功能。明年初，谷歌将推出Bard Advanced，其将使用Gemini Ultra，这代表了Bard发布以来的最大更新。从发布会当天开始，Pixel 8 Pro手机的两项功能将由Gem...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...外，HuggingFace上还发布了7B模型的指令微调版本，在数学推理任务GSM8K上的性能实现大规模提升，分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本，1.4B版本也同步上线。神奇的是，训练数据量相比7B版本不……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

苹果计划年底推出M4处理器：全力提升AI性能

...通等竞品处于同一水平，此外考虑到大语言模型的训练与推理需要超大容量的存储，因此M4Ultra处理器或许将会支持512GB的内存，比现在的192GB提升了不少。苹果对于AI时代大幅落后于友商的现状其实还是很焦虑的，希望借助AI处理...……更多

2024-04-16 14:12:00处理器,全力,性能,苹果,处理,苹果

手机数读 | Q1华为、荣耀并列国内市场第一，小米再次被挤出

...日凌晨，苹果在Hugging Face平台上发布了“具有开源训练和推理框架的高效语言模型”，名为 OpenELM，共有2.7亿、4.5亿、11亿和30亿这四种参数规模。王翔认为，各家都在AI上有布局，但苹果在国内市场受到的竞争压力还是非常大的...……更多

2024-04-30 11:00:00华为,荣耀,列国,小米,再次,手机

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...新包含Qwen-VL-Plus和Qwen-VL-Max两个版本，模型在图像相关的推理能力、图中文字识别和提取能力，以及支持高分辨率三个方面做了升级。据通义千问数据，相比于开源版本的Qwen-VL，这两个模型在多项图文多模态标准测试中获得了堪...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

ChatGPT 火爆，程序员会不会被取代？答案都在这里！

...评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起：吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华：大模型绝不仅仅是模型系统和算力，数据是非常重要...……更多

2023-02-28 09:00:00程序员,火爆,答案,程序,人工智能,智能

ChatGPT一周年，机会在大厂还是小公司？

...。大模型还存在一些不足，包括如何做更高效果的架构、推理加速，训练加速等。如果面向未来智能体的发展，大模型仍然有很多模块欠缺，比如记忆能力、推理能力、规划能力等，包括现在大模型背后的一些机理，都不足以支...……更多

2023-12-07 09:42:00大厂,还是,机会,公司,模型,王小川

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

英特尔发布全新软硬件平台，全速助力企业推进AI创新

...碎片化、数据可靠性和合规性等需求。推出用于AI训练和推理的Gaudi3英特尔Gaudi3AI加速器将为AI系统提供动力，该AI系统可通过以太网的通用标准连接多达数万个加速器。与上一代产品相比，英特尔Gaudi3将带来4倍的BF16AI计算能力提...……更多

2024-04-10 17:08:00英特,英特尔,软硬,全新,平台,企业

斯坦福“草泥马”火了：100美元就能比肩gpt-3.5

...记本部署LLaMA的方法来自GitHub项目llama.cpp，使用纯C/C++做推理，还专门对ARM芯片做了优化。作者实测，M1芯片的MacBookPro上即可运行，另外也支持Windows和Linux系统。还是这个C++移植版本，有人成功在4GB内存的树莓派4上成功运行了LL...……更多

2023-03-15 22:40:00斯坦,斯坦福,能比,斯坦,斯坦福,模型