高性能,最先,模型,代码,模型,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，IBM在年度THINK大会上宣布，IBM现已开源其“最先进”和高性能的Granite（花岗岩）代码模型。IT之家附开源链接如下：GitHub：点此进入HuggingFace：点此进入Granite代码模型的参数范围从3B到34B，并且有基础模型和指令跟随模型两种...……更多

2024-05-22 10:19:00高性能,最先,模型,代码,模型,代码

阿里云CTO周靖人：全面投入升级AI大基建

...，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，同时上架语言、音频、视觉等100多款...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家，每次只激活其中的一...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理，在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。超高速推理：Gemma 2经过优化，能够在各种硬件上以惊人的速度运行，无论是强大的游戏笔记本、高端台...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

开源低代码平台“碰撞”浪潮海岳大模型，打造高效智能开发新体验

...点。张政馗表示，大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势，这些技术趋势将推动大模型持续进步，不断拓展应用领域。浪潮海岳大模型定位于企业服务领域，以垂域...……更多

2024-06-07 11:05:00海岳,浪潮,碰撞,模型,代码,体验

用AI自动设计智能体，数学提分25.9%，远超手工设计

...on & Barto，2018）。理想情况下，该算法既可以快速发现高性能智能体系统，又可以避免陷入局部最优。现有方法包括使用强化学习（Zhuge et al., 2024）或迭代生成新解决方案的 FM（Fernando et al., 2024）作为搜索算法。评估函数：根...……更多

2024-08-24 09:36:00设计,手工,数学,智能,智能,元智

李彦宏替马化腾试错？

...大模型基于腾讯在产业互联网领域沉淀下来的经验，结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施，以及混元大模型，共同构成技术底座。这一底座之上，腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多

2024-01-31 21:00:00李彦,模型,腾讯,应用,文心,开发

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自

...数据科学编程、代码编辑）中，SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外，在HumanEval+上，SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法（包括 OSS-Instruct（61.6）和Evol-Instruct（59.……更多

2024-11-29 09:26:00伯克,伯克利,进化,模型,代码,方法

进迭时空宣布开源RISC-V芯片的AI核心技术

...生不息”，也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时，也将在RISC-V生态建设方面长期、持续投入。据悉，进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多

2024-04-29 15:06:00芯片,核心,时空,技术,芯片,志坚

如果MaaS是个伪命题大模型时代的“云”应该怎么建？

...业，为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色，是亚马逊云科技的核心优势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。关于如何构建高性...……更多

2024-07-13 09:54:00命题,模型,时代,亚马,亚马逊,模型

腾讯在京发布汽车行业大模型“全域智能”方案

...化学习。在算力底座层，腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群，支持10万卡GPU超大计算规模，是国内性能最强的大模型计算集群之一，最快4天就可以训练万亿参数的...……更多

2024-04-25 19:22:00腾讯,汽车行业,模型,智能,方案,汽车

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...方面，7500万参数的CodeFusion在top-1准确率指标上，可以与最先进的350M-175B模型相媲美。论文地址：https://arxiv.org/abs/2310.17680这篇论文的工作很有意义，但引起大家格外注意的却是——作者在对比ChatGPT（gpt-3.5-turbo）时……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型

智谱AI新大模型来袭：部署价格大降50%，免费商用，做应用能

...的代理能力的同时，还不影响其通用性，这也为用户构建高性能Agent提供了一个解法。智谱AI提出的AgentBench，是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍：ChatGLM3-turbo版本，也就是企业级部署版本，在...……更多

2023-10-28 14:00:00商用,模型,能力,应用,价格,模型

谷歌再出大招，发布最新开源大模型Gemma，笔记本上即可运行

...过开源其最新的AI模型Gemma，向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的，超越了之前表现最出色的Mistral7B模型，在数学和代码能力方面表现突出。Gemma这个名字...……更多

2024-02-23 09:18:00模型,运行,笔记本,笔记,模型,人工智能

智谱AI推出第三代基座大模型可在手机上部署

...际标准图文评测数据集上取得SOTA（State of the art，意为“最先进的”）；代码增强模块Code Interpreter可以根据用户需求生成代码并执行，自动完成数据分析、文件处理等复杂任务；网络搜索增强模型WebGLM接入了搜索增强能力，可以...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

首个AI程序员上岗，码农们暂且不必过度焦虑

...能解决方案的公司业ABBY在此前接受采访时承认，即使用最先进的系统，也可能出现人工智能错乱或输出不准确的情况，因此，人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验，结果显...……更多

2024-04-07 13:55:00程序员,焦虑,程序,程序员,模型,程序

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微

...务，而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope：通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点，就是开源稀疏自编码器——Gemma Scope了。语言模型的内部，究竟发生了什么？长久以...……更多

2024-08-02 09:55:00小钢炮,显微镜,大脑,模型,编码器,特征

精准狙击Llama 3.1？Mistral AI开源Larg

...时为用户提供新功能，包括高级函数调用和检索，以构建高性能的 AI 应用。不过，值得注意的是，Mistral Large 2 虽然是开放的，但只限于研究和非商业用途。它提供了开放的权重，允许第三方根据自己的需求对模型进行微调。这...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新，推出第三代自研AI训练芯片Trainium3，还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

加速落地京东云大模型已支持数百个场景

...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中，言犀AI开发计算平台，经过近一年的持续打磨，可以提供从基础资源、模型服务，到智能体构建的一站...……更多

2024-06-07 11:04:00云大,京东,落地,模型,场景,支持

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...Github等技术社区直接下载，免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型，为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址：https://huggingface.co/tencent/Tencent-Hunyuan-……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言