• 我的订阅
  • 头条热搜
ibm开源“最先进”和高性能的granite代码模型
...,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝 ……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。 超高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...点。张政馗表示,大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势,这些技术趋势将推动大模型持续进步,不断拓展应用领域。浪潮海岳大模型定位于企业服务领域,以垂域...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...on & Barto,2018)。理想情况下,该算法既可以快速发现高性能智能体系统,又可以避免陷入局部最优。现有方法包括使用强化学习(Zhuge et al., 2024)或迭代生成新解决方案的 FM(Fernando et al., 2024)作为搜索算法。评估函数:根...……更多
李彦宏替马化腾试错?
...大模型基于腾讯在产业互联网领域沉淀下来的经验,结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施,以及混元大模型,共同构成技术底座。这一底座之上,腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
...大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。【本文结束】如需转载请务必注明出处:快科技责任编辑:朝晖文章内容举报 ……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法(包括 OSS-Instruct(61.6)和Evol-Instruct(59.……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...生不息”,也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时,也将在RISC-V生态建设方面长期、持续投入。据悉,进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...业,为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色,是亚马逊云科技的核心优 势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。 关于如何构建高性...……更多
...化学习。 在算力底座层,腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快4天就可以训练万亿参数的...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGPT(gpt-3.5-turbo)时……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。 智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的,超越了之前表现最出色的Mistral7B模型,在数学和代码能力方面表现突出。Gemma这个名字...……更多
...际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...能解决方案的公司业ABBY在此前接受采访时承认,即使用最先进的系统,也可能出现人工智能错乱或输出不准确的情况,因此,人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验,结果显...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...务,而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope:通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点,就是开源稀疏自编码器——Gemma Scope了。语言模型的内部,究竟发生了什么?长久以...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...时为用户提供新功能,包括高级函数调用和检索,以构建高性能的 AI 应用。不过,值得注意的是,Mistral Large 2 虽然是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新,推出第三代自研AI训练芯片Trainium3,还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多
加速落地 京东云大模型已支持数百个场景
...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中,言犀AI开发计算平台,经过近一年的持续打磨,可以提供从基础资源、模型服务,到智能体构建的一站...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-……更多
同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答
...语言推理等任务上,性能比肩OpenAI o1正式版。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...行计算平台和应用程序的编程API,让开发者能通过GPU开展高性能计算,包括: 1. 多个能并行处理任务的核心,实现多线程2. 多种高效管理GPU内存的方法,如全局内存、共享内存和常量内存3. 创建并管理多条并行线程,提高数据...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...用程序开发的战略决策,这种方法使FlutterFlow能够提供更高性能和更具吸引力的用户体验。此外,FlutterFlow还推出了AI驱动的代码助手,能够根据给定的功能需求生成代码。目前,FlutterFlow拥有830000名用户,并部署了超过12000个应...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类知识的图谱,通过知识推理提升知识推理能力。打造基于置信度的模型知识问答和知识库检索的评价体系,实现多源知识...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...问题上训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度,提升...……更多
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
...时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。 从泄露...……更多
更多关于科技的资讯:
鲁网10月27日讯10月24日,记者在青岛市崂山区委宣传部召开的媒体见面会上获悉,近年来,青岛市崂山区以前瞻布局推动虚拟现实产业高质量发展
2025-10-27 16:24:00
京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验
随着京东 11.11 大促的火热进行,京东直播再度升级技术布局,以 “立影 3D 技术”“JoyAI大模型”等创新技术
2025-10-27 15:39:00
电机能效提升领域再添标杆!25 项产品 / 技术入选全国节能降碳示范名单
为深入贯彻国家 “双碳” 战略,加快电机领域节能降碳技术创新与成果转化,中国电子节能技术协会此前启动 “全国节能降碳示范产品 / 技术推荐” 征集工作
2025-10-27 15:42:00
吉刻现场|硬核登场!吉林选手角逐第三届全国博士后创新创业大赛
10月26日,第三届全国博士后创新创业大赛在福建泉州(晋江)开幕。本届大赛,吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道
2025-10-27 14:09:00
厦心医院实现手术\
厦门网讯(厦门日报记者 楚燕 通讯员 许良友 付磊 刘云芳)10月23日,一项载入医学史册的创新手术在厦门大学附属心血管病医院(以下简称“厦心医院”)圆满完成
2025-10-27 08:11:00
新闻纵深·解码钢铁大模型|邯钢构建六大领域全链条智能大模型:“聪明大脑”带来极致能效
邯钢构建六大领域全链条智能大模型“聪明大脑”带来极致能效编者按当钢铁遇上人工智能,一场“智变”正悄然发生。为生动展现人工智能为钢铁产业生产
2025-10-27 08:12:00
第十一届NJSD软件开发者会议在软件谷举行江苏规模最大,1400名软件工程师在宁“聚会”南报网讯(记者于洁尘通讯员林园园)70多位业界“大咖”登台演讲
2025-10-27 08:20:00
南报网讯(通讯员郑瑞于品华杨刚记者徐宁)近日,南化公司自主研发的橡胶防老剂中间产品RT培司(4-氨基二苯胺)除盐技术取得突破
2025-10-27 08:21:00
南报网讯(通讯员杨淏涵记者张希)日前,南京林业大学与乐惠国际南京基地签署《校企全面合作协议》《产业研究院共建协议》,全面开启校企战略合作
2025-10-27 08:22:00
高效,是都市青年的通行证:InstaShake以“一杯营养”重塑健康生活方式 —— 新锐品牌以“零添加、无预制、纯手工”的坚守,为上海都市人群注入鲜活能量
在生活节奏不断加速的上海,追求健康与追求效率似乎成为一道单选题。然而,新锐健康饮品品牌InstaShake正以其独特的“零添加
2025-10-27 08:39:00
济宁银行锚定金融“五篇大文章” 多维发力赋能区域经济高质量发展
鲁网10月27日讯近年来,济宁银行围绕做好金融“五篇大文章”,深入洞察科技企业、中小微企业以及重点产业链金融需求,以产品创新破解融资难题
2025-10-27 11:07:00
汪昌莲据《经济日报》报道,“两三元就能买品牌饼干薯片”“上百种散装零食任意挑选”……从县城到乡镇,在街角与量贩零食店不期而遇已成逛街“标配”
2025-10-27 11:10:00
受冷空气影响,气温先降后升,27日早晨气温较低。26日夜间到27日白天晴间多云,北风转南风2~3级,最低气温市区4℃左右
2025-10-27 11:28:00
2025青岛虚拟现实创新大会将启,雷神科技聚焦信创生态构建
鲁网10月27日讯虚实无界,智享未来。2025青岛虚拟现实创新大会即将在崂山区拉开帷幕。2017年以来,由崂山区成功承办的虚拟现实创新大会
2025-10-27 11:48:00
长白时评评论员 唐小兰近日,北京一市民反映有陌生男子在她家中无人时,通过指纹解锁智能门锁多次进入她家。当事人焦女士告诉新京报记者
2025-10-27 13:38:00