推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

精准狙击Llama 3.1？Mistral AI开源Larg

...l Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后，Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来，而这一模型的特点是 ——「足够大...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

轻量化模型架构catvton的优势在哪里

...分简洁高效：2个网络模块（VAE+UNet）899.06M总参数量<8G推理显存（输出图像1024×768）轻量化的架构来源于CatVTON对现有方法模块冗余的观察：基于Warping的方法依靠几何匹配对服装进行形变再利用试穿模块融合，结果生硬不自然；...……更多

2024-08-01 08:52:00架构,模型,优势,模型,训练,模块

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...率基础上，并通过改进视觉指令数据集和SGLang，提升了“推理、OCR等方面的性能”，意味着人类向AGI（通用人工智能）探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文二、更适合中国人体质的GPT-4V...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

从0到1：国产化千卡集群的一小步，AI算力主动权的一大步

...紧张是产生算力焦虑的根源所在。一方面，大模型训练与推理需求呈几何级数爆发——自2022年以来，人工智能算力需求每3~4个月就翻一番，每年训练AI模型所需算力增幅高达10倍，而生成式AI使上升曲线进一步陡峭，未来大模型...……更多

2024-04-28 11:52:00小步,主动权,集群,大步,主动,国产

AIGC落地应用：腾讯云如何助力产业智能化升级？

...同的模型形态，采用混合专家模型(MoE)结构，提高训练和推理效率及专业领域适应性，具备强大的中文创作能力。腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构：上层为自研高速网络互联来支撑模型训练，预计20...……更多

2024-06-26 12:45:00腾讯,落地,升级,智能,产业,应用

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

京东云曹鹏：AI变革之下，大模型技术如何为企业未来赋能？

...提高工作效率；在模型服务方面，提供一站式的模型训练推理服务，降低大模型训练和使用门槛；在基础设施方面，提供极致的数字基础设施能力，满足大模型的算力需求。随着通用大模型训练进入万亿参数级别，超大规模算力...……更多

2024-07-31 11:34:00京东,变革,模型,技术,企业,京东

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

最新大模型产品抢先看

...其中，千亿参数大模型Step-1耗时2个月训练成功，在逻辑推理、中文知识、英文知识、数学、代码方面表现出色，性能全面超越GPT-3.5，拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力，同时能够实现单卡低...……更多

2024-06-26 00:34:00模型,产品,模型,星环,人工智能,智能

挑战Scaling Law，Meta发布移动端350M小模型

...做个假设，如果把GPT-4（大约有1万亿参数）以50tokens/s的推理速度部署在生活中，你需要什么样的硬件？答案是1亿个H100 GPU。别说是移动设备了，家里都放不下。那如果降低标准，用LLaMA-v2 7B这样的模型，再加上8-bit量化呢？简单...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

收入占比40%、电话会议点名16次，英伟达：推理端的需求被低

...让人印象深刻的是，英伟达在财报电话会议的一个观点：推理端的爆发，可能很多人还是低估了。据英伟达电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。而在这次财报电话会议里，...……更多

2024-03-02 13:38:00英伟,电话会议,推理,收入,需求,端的

微软被曝未来3年花1000亿美金囤芯片；杨元庆：AI不是取代

...柱。开源大模型Llama3推出，百度智能云支持其全系列训练推理北京时间4月19日凌晨，Meta公布期待已久的多模态开源大模型Llama 3系列，目前包括80亿和700亿两个参数的调优版本。与此同时，Meta还推出了其首款基于Llama 3开源模型的...……更多

2024-04-30 11:00:00杨元庆,微软,美金,芯片,人类,智能

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

乔布斯时代之后，会迎来黄仁勋时代吗？

...flops的FP4计算能力，这是由其2080亿个晶体管提供的。高效推理：当与Grace CPU结合形成GB200超级芯片时，它能在LLM推理工作负载上提供比单个GPU高出30倍的性能，同时在成本和能源消耗上比H100 GPU高出25倍。训练能力：使用Blackwell GPU...……更多

2024-03-20 09:11:00乔布,时代,芯片,模型,英伟,布斯

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

...数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B，推理2K长度文本内容仅需3G显存，可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音...……更多

2023-12-01 13:33:00通义,模态,模型,尺寸,参数,模型

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...经理。CTO鲍凡在清华大学计算机系获得博士学位，在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说，2023年...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

9月13日，OpenAI发布具有推理能力的人工智能模型“o1”，备受行业瞩目。o1通过模仿人类的思维过程，强化学习和“思维链”技术，引导模型自主解决问题。这一特点在解决复杂问题，尤其是在科学、编码和数学等领域，展现出...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...外，HuggingFace上还发布了7B模型的指令微调版本，在数学推理任务GSM8K上的性能实现大规模提升，分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本，1.4B版本也同步上线。神奇的是，训练数据量相比7B版本不……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据