• 我的订阅
  • 头条热搜
ibm开源“最先进”和高性能的granite代码模型
...,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝 ……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。 超高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...点。张政馗表示,大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势,这些技术趋势将推动大模型持续进步,不断拓展应用领域。浪潮海岳大模型定位于企业服务领域,以垂域...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...on & Barto,2018)。理想情况下,该算法既可以快速发现高性能智能体系统,又可以避免陷入局部最优。现有方法包括使用强化学习(Zhuge et al., 2024)或迭代生成新解决方案的 FM(Fernando et al., 2024)作为搜索算法。评估函数:根...……更多
李彦宏替马化腾试错?
...大模型基于腾讯在产业互联网领域沉淀下来的经验,结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施,以及混元大模型,共同构成技术底座。这一底座之上,腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
...大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。【本文结束】如需转载请务必注明出处:快科技责任编辑:朝晖文章内容举报 ……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法(包括 OSS-Instruct(61.6)和Evol-Instruct(59.……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...生不息”,也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时,也将在RISC-V生态建设方面长期、持续投入。据悉,进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...业,为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色,是亚马逊云科技的核心优 势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。 关于如何构建高性...……更多
...化学习。 在算力底座层,腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快4天就可以训练万亿参数的...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGPT(gpt-3.5-turbo)时……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。 智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的,超越了之前表现最出色的Mistral7B模型,在数学和代码能力方面表现突出。Gemma这个名字...……更多
...际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...务,而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope:通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点,就是开源稀疏自编码器——Gemma Scope了。语言模型的内部,究竟发生了什么?长久以...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...能解决方案的公司业ABBY在此前接受采访时承认,即使用最先进的系统,也可能出现人工智能错乱或输出不准确的情况,因此,人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验,结果显...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...时为用户提供新功能,包括高级函数调用和检索,以构建高性能的 AI 应用。不过,值得注意的是,Mistral Large 2 虽然是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新,推出第三代自研AI训练芯片Trainium3,还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...磅亮相,全面展示了阿里云从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务的全栈AI技术能力。 在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节...……更多
加速落地 京东云大模型已支持数百个场景
...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中,言犀AI开发计算平台,经过近一年的持续打磨,可以提供从基础资源、模型服务,到智能体构建的一站...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-……更多
同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答
...语言推理等任务上,性能比肩OpenAI o1正式版。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...行计算平台和应用程序的编程API,让开发者能通过GPU开展高性能计算,包括: 1. 多个能并行处理任务的核心,实现多线程2. 多种高效管理GPU内存的方法,如全局内存、共享内存和常量内存3. 创建并管理多条并行线程,提高数据...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...用程序开发的战略决策,这种方法使FlutterFlow能够提供更高性能和更具吸引力的用户体验。此外,FlutterFlow还推出了AI驱动的代码助手,能够根据给定的功能需求生成代码。目前,FlutterFlow拥有830000名用户,并部署了超过12000个应...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类知识的图谱,通过知识推理提升知识推理能力。打造基于置信度的模型知识问答和知识库检索的评价体系,实现多源知识...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...问题上训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度,提升...……更多
更多关于科技的资讯:
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00
摘要:数字化浪潮为以“身体体悟”为核心的太极拳传承带来了范式性变革。本研究采用质性研究方法,以“虚”与“实”这一对源自太极拳本身的核心哲学概念为理论透镜
2025-11-18 17:40:00
【宅男财经|专家面对面】据央视财经综合多家外媒报道,美国苹果公司首席执行官蒂姆·库克有可能最早于明年卸任,现任公司硬件工程高级副总裁特努斯被普遍视为最有可能的继任者
2025-11-18 17:48:00
埃尔韦·朗斯兰:杨佴旻,多彩水墨的艺术大师
杨佴旻是一位能够把千年传统与炫目现代性对比共存的画家。作为多彩水墨绘画的领军人物,他将古老技法转化为一种极具现代感的绘画语言
2025-11-18 17:51:00
河北新闻网讯(杨自立、田海颖)近日,廊坊市科技局公布2025年度市级科技企业孵化器认定和众创空间备案名单,廊坊开发区润泽人工智能产业孵化器
2025-11-18 18:43:00