推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

观薇智能“玄黄大模型”发布，展示AI+健康领域创新实力

...自主预训练，进行可信、可控设计，旨在降低开发门槛和推理成本，重点服务于端侧应用。T系列大模型拥有极其庞大的神经网络，能够处理海量的数据和信息，应对复杂的语言、图像任务，提供精准的语义分析和生成能力，通...……更多

2024-07-22 17:33:00玄黄,模型,实力,领域,智能,健康

邬贺铨院士：金融大模型改变了金融科技范式

...思维链的模式，通过专家介入诱导它一步一步地进行思维推理。中国工程院院士邬贺铨（左）与度小满CEO朱光（右）交流“此外，还需要建立专门的监控系统，例如微软专门构建内容管理系统，它与语言模型协同工作，并使用特...……更多

2023-10-17 17:57:00邬贺铨,金融,范式,院士,模型,科技

大模型到了该「验收」的时候

...万亿级分层异构MoE结构，不仅模型效果大幅提升，其训练推理效率也提升了超过100%，并带来了50%的推理部署成本下降。而Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

字节、阿里云、百度大模型价格混战：低价背后是数据竞争，爆款尚

...云事业部总裁刘伟光表示：“阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”上周，字节跳动刚刚高调入局大模型战场，豆包主力模型在企业市场的定价...……更多

2024-05-22 07:41:00阿里,字节,模型,尚未,背后,竞争

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

权威AI开源标准1.0版发布：Llama也不算开源

...、验证和测试、支持库（如分词器和超参数搜索代码）、推理代码和模型架构。参数：模型参数，例如权重或其他配置。参数应根据 OSI 批准条款提供。例如，训练中间阶段的检查点以及优化器状态。对于机器学习系统，模型...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...er模型取得了比扩散模型更好的结果，只有900M参数，但在推理时间上比StableDiffusion1.4版本快3倍，比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比：文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

大模型应用疯狂加速，洗牌却在静悄悄进行了

...大能力，分别为：文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力，并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量，科大讯飞也做了多方面的准备。一方面，科大讯飞积极展开与业内巨头的合...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

清华团队提出新型光计算架构，光训练速度提升1个数量级

...智能计算的“潜力股”，为后摩尔时代带来新的希望。推理和训练是 AI 大模型核心能力的两个重要阶段，正是看到了这一点，该团队在推理和训练方面进行了同期的并行研究。今年 4 月，他们在 Science 报道了通用智能光计算芯...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

AI大模型有望再扩1000倍！剑桥耶鲁康奈尔：PNN是变革关

...围内吗？能在智能手机或传感器这些边缘设备上进行本地推理吗？要回答这些问题，我们需要重新思考AI模型的工作和训练方式，尤其是要转换视角，首先考虑底层硬件的物理约束。或许，物理神经网络PNN（physical neural network）...……更多

2024-07-15 09:33:00康奈尔,康奈,耶鲁,剑桥,变革,模型

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...能力，但只使用了一半的训练资源。之后，他们对模型的推理和编码能力进行了重大改进，最终开发出了 Grok-1，这是一款功能更为强大的 SOTA 语言模型，在 HumanEval 编码任务中达到了 63.2% 的成绩，在 MMLU 中达到了 73%。xAI 使用了...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

开源版OpenAI再出「神作」，小模型吊打Llama 3！M

...持高达128k上下文（目前在vLLM上为32k）。在知识、常识、推理、函数调用、效率等方面，为低于10B参数模型设立了新标杆。而且，Ministral 8B还有配备了滑动窗口注意机制（sliding-window attention），以实现更快和内存高效的推理。不...……更多

2024-10-23 09:56:00模型,边缘,革命,模型,指令,性能

搞医学影像，为什么都青睐于CPU？

...ACS/RIS产品中，就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下，融合影像分析等技术，让医务人员通过旋转、缩放、分割、图像增强等操作，从多角度清晰了解到医学影像中各结构之间的空间位...……更多

2024-06-02 15:41:00医学影像,影像,医学,英特,英特尔,三维

“华米OV”的新战场：手机大模型

...的算力，一定都会在云端进行。而手机端的应用，其实是推理。在推理的时候，模型可以只激活一部分的模块、一部分的神经元来计算，”小米技术委员会 AI 实验室大模型团队负责人栾剑表示。另外，云端和端侧的大模型具体...……更多

2023-10-26 18:02:00战场,模型,手机,模型,手机,厂商

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...碾压谷歌此次发布的Llama3大模型，相较于上一代在编码、推理等性能上取得了显著进步。Meta公布的九项行业基准测试评测结果显示，Llama3-8B参数版本几乎全面碾压谷歌的Gemma和Mistral的70亿模型。Llama3-70B参数版本则在7项评测中超...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

微软发布旗下最小语言模型phi-2

...写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数，规模虽然比此前版本翻番，但相比较其它主流语言模型，...……更多

2023-11-17 14:00:00微软,旗下,模型,语言,模型,微软

英特尔第五代至强可扩展处理器发布：AI推理性能提升42%！

...器，相比上代至强平均性能提升了21%，能效提升了36%，AI推理性能提升了42%，总拥有成本降低了77%！最高64核心，整体性能提升21%、AI推理性能提升42%、总拥有成本降低77%！据介绍，第五代至强（Xeon）延续了上代的Intel 7制造工...……更多

2023-12-16 13:49:00英特,英特尔,推理,处理器,性能,处理

跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功

...单纯的计算资源提供者，他们需要向客户提供大模型训练推理等增值服务，以减少客户在模型开发过程中的成本负担，助力客户进行人工智能转型，从而实现双赢。”超新星分布式微算力中心——AICC建设运营高性价比选择本次...……更多

2024-04-03 17:00:00鸿沟,集群,发布会,成功,产品,科技

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

微软：从“软件老大”到“AI帝国”

...Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。这款芯片采用了 5 纳米工艺制造，拥有 1050 亿个晶体管。 Azure Maia 100 美颜照｜Microsoft微软自己的DPU——Azure Boost也已全面上市。微软在今年早些时候……更多

2023-11-21 10:45:00帝国,微软,老大,软件,微软,模型