推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

掰开安卓手机满屏都是三个字：大模型

...的内存单元，是大模型进手机面临的第二道难关：大模型推理需要大量计算资源做支撑，与此同时，内存大小决定了数据处理速度的上限以及推理的稳定性。另外，在手机上跑大模型，也给电池带来了更大的压力。因此芯片能耗...……更多

2023-11-16 20:30:00安卓,三个字,模型,三个,手机,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...I正在壮大。能力一览11B和90B这两款模型，不仅支持图像推理场景，包括图表和图形在内的文档级理解、图像描述以及视觉定位任务，而且还能基于现有图表进行推理并快速给出回答。比如，你可以问「去年哪个月销售业绩最好...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

如果MaaS是个伪命题大模型时代的“云”应该怎么建？

...的认知与针对性解法。算力层，做厚用于基础模型训练和推理的基础设施。这一层主要服务于有大模型训推能力的企业，为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色，是亚马逊云科技的核心优势。...……更多

2024-07-13 09:54:00命题,模型,时代,亚马,亚马逊,模型

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...mazon Nova Premier：亚马逊最强多模态大模型，可处理复杂的推理任务，也可用于蒸馏客户定制化的模型。在现场，Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出，其在检索增强……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力，使其能够自我进化在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

ASC24超算大赛启动会在京举行，大模型推理等成为赛题

...在上海大学举行的总决赛。据悉，今年的赛题包括大模型推理优化、渗流数值模拟，以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多

2024-01-07 19:35:00启动会,推理,模型,大赛,模型,上海大学

苹果发布mm1.5-ui模型

...从10亿到300亿的多种参数规模，拥有图像识别和自然语言推理能力。在新版本中，苹果公司的研发人员改进了数据混合策略，极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知，...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

芯片“围城”加剧，如何通过“算力运营”加速国产商业落地?

...找客户的能力。其次，当前大模型训练需求显著下滑，而推理需求的增长是一个循序渐进的过程，整体而言，算力采购市场也正经历明显的冷却期。狂飙两年后，大模型的发展开始从狂热回归到冷静。国外方面，OpenAI、Anthropic相...……更多

2024-12-05 09:55:00围城,落地,芯片,运营,国产,商业

微软紧随英伟达发布芯片，老黄还不慌吗？

...一款AI加速芯片，基于Arm架构设计，主要用于云端训练、推理以及Azure的高负载云端运算。不过纳德拉否认了将向云计算客户供货的传闻，这款自研芯片将优先满足微软自身的需求，并在合适的时机向合作伙伴和客户开放。Azure芯...……更多

2023-11-23 09:36:00老黄,英伟,微软,芯片,芯片,英伟

人工智能大模型陆续上线加速赋能产业发展

...8.3倍。效率方面，文心大模型训练速度达到原来的3倍，推理速度达到原来的30多倍。科大讯飞董事长刘庆峰介绍，自5月6日首次发布讯飞星火认知大模型以来，已进行两次重大迭代升级，在文本生成、语言理解、知识问答、逻辑...……更多

2023-10-17 07:35:00人工智能,产业发展,人工,模型,智能,产业

史上最快AI芯片「Sohu」，速度10倍于B200，哈佛辍学

机器之心报道编辑：泽南、杜伟生成式 AI 推理性价比是 GPU 的 140 倍。大模型时代，全球都缺算力，买铲子的英伟达市值被炒上了天。现在，终于有一家公司带着自己的 AI 芯片来叫板了。今天凌晨，科技圈迎来了一个重要新闻...……更多

2024-06-27 09:24:00辍学生,哈佛,芯片,速度,芯片,模型

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

当AI大模型卷向服务机器人，会有哪些新故事？｜硬氪分析

...莫拉维克悖论提出，和传统假设不同，计算机要实现例如推理等人类所具备的高阶智慧、仅需少量的计算能力，而若要直觉、感知等能力，却需要巨大的运算能力。简单来说，电脑可以在和人类围棋对弈中轻松取胜，但如果让...……更多

2024-03-13 12:10:00机器人,模型,机器,故事,分析,服务

百度云升级模型服务，百度版GPTs即日开放 | 最前线

...在侯震宇看来，是AI生态发展的关键一年。一方面，算力推理层和模型训练工具链的优化，将是2024年的重点。他表示：“2024年我觉得算力的整体供应不确定性或紧张程度较大，所以如何能够更有效使用算力资源，是一个大家都...……更多

2023-12-21 14:31:00模型,升级,开放,服务,模型,应用

超越GPT-4o！开源科研神器登场，4500万论文检索增强生

...成数据训练并微调了Llama 3.1 8B。4.迭代自我反馈生成：在推理过程中，团队使用迭代自我反馈来通过自然语言反馈精炼模型输出。每次迭代都额外检索更多论文，使模型能够提高回答质量并缩小引用差距。为了评估 OpenScholar，团...……更多

2024-11-27 09:58:00论文检索,神器,生成,科研,检索,论文

恒生电子：金融大模型技术升级，国内AI芯片危机互现

...此次升级的LightGPT，面向金融机构实现LightGPT-7B的开源，推理和训练全面适配华为昇腾系列。恒生电子推出金融大模型，背后经历了怎样的转向？落地应用金融行业，金融大模型具备哪些共通性和特殊性？当前大模型所需的AI算力...……更多

2023-10-22 15:30:00恒生,芯片,模型,危机,升级,金融

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

观薇智能“玄黄大模型”发布，展示AI+健康领域创新实力

...自主预训练，进行可信、可控设计，旨在降低开发门槛和推理成本，重点服务于端侧应用。T系列大模型拥有极其庞大的神经网络，能够处理海量的数据和信息，应对复杂的语言、图像任务，提供精准的语义分析和生成能力，通...……更多

2024-07-22 17:33:00玄黄,模型,实力,领域,智能,健康

邬贺铨院士：金融大模型改变了金融科技范式

...思维链的模式，通过专家介入诱导它一步一步地进行思维推理。中国工程院院士邬贺铨（左）与度小满CEO朱光（右）交流“此外，还需要建立专门的监控系统，例如微软专门构建内容管理系统，它与语言模型协同工作，并使用特...……更多

2023-10-17 17:57:00邬贺铨,金融,范式,院士,模型,科技

大模型到了该「验收」的时候

...万亿级分层异构MoE结构，不仅模型效果大幅提升，其训练推理效率也提升了超过100%，并带来了50%的推理部署成本下降。而Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

字节、阿里云、百度大模型价格混战：低价背后是数据竞争，爆款尚

...云事业部总裁刘伟光表示：“阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”上周，字节跳动刚刚高调入局大模型战场，豆包主力模型在企业市场的定价...……更多

2024-05-22 07:41:00阿里,字节,模型,尚未,背后,竞争

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

权威AI开源标准1.0版发布：Llama也不算开源

...、验证和测试、支持库（如分词器和超参数搜索代码）、推理代码和模型架构。参数：模型参数，例如权重或其他配置。参数应根据 OSI 批准条款提供。例如，训练中间阶段的检查点以及优化器状态。对于机器学习系统，模型...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...er模型取得了比扩散模型更好的结果，只有900M参数，但在推理时间上比StableDiffusion1.4版本快3倍，比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比：文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展