• 我的订阅
  • 头条热搜
ibm开源“最先进”和高性能的granite代码模型
...,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝 ……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。 超高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...点。张政馗表示,大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势,这些技术趋势将推动大模型持续进步,不断拓展应用领域。浪潮海岳大模型定位于企业服务领域,以垂域...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...on & Barto,2018)。理想情况下,该算法既可以快速发现高性能智能体系统,又可以避免陷入局部最优。现有方法包括使用强化学习(Zhuge et al., 2024)或迭代生成新解决方案的 FM(Fernando et al., 2024)作为搜索算法。评估函数:根...……更多
李彦宏替马化腾试错?
...大模型基于腾讯在产业互联网领域沉淀下来的经验,结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施,以及混元大模型,共同构成技术底座。这一底座之上,腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
...大模型等项目的训练推理,在腾讯星脉与H20服务器构建的高性能环境中,这套方案展现出出色的通用性。【本文结束】如需转载请务必注明出处:快科技责任编辑:朝晖文章内容举报 ……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法(包括 OSS-Instruct(61.6)和Evol-Instruct(59.……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...生不息”,也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时,也将在RISC-V生态建设方面长期、持续投入。据悉,进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...业,为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色,是亚马逊云科技的核心优 势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。 关于如何构建高性...……更多
...化学习。 在算力底座层,腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快4天就可以训练万亿参数的...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGPT(gpt-3.5-turbo)时……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。 智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的,超越了之前表现最出色的Mistral7B模型,在数学和代码能力方面表现突出。Gemma这个名字...……更多
...际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...务,而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope:通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点,就是开源稀疏自编码器——Gemma Scope了。语言模型的内部,究竟发生了什么?长久以...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...能解决方案的公司业ABBY在此前接受采访时承认,即使用最先进的系统,也可能出现人工智能错乱或输出不准确的情况,因此,人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验,结果显...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...时为用户提供新功能,包括高级函数调用和检索,以构建高性能的 AI 应用。不过,值得注意的是,Mistral Large 2 虽然是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新,推出第三代自研AI训练芯片Trainium3,还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...磅亮相,全面展示了阿里云从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务的全栈AI技术能力。 在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。新一代磐久超节...……更多
加速落地 京东云大模型已支持数百个场景
...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中,言犀AI开发计算平台,经过近一年的持续打磨,可以提供从基础资源、模型服务,到智能体构建的一站...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-……更多
同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答
...语言推理等任务上,性能比肩OpenAI o1正式版。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...行计算平台和应用程序的编程API,让开发者能通过GPU开展高性能计算,包括: 1. 多个能并行处理任务的核心,实现多线程2. 多种高效管理GPU内存的方法,如全局内存、共享内存和常量内存3. 创建并管理多条并行线程,提高数据...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...用程序开发的战略决策,这种方法使FlutterFlow能够提供更高性能和更具吸引力的用户体验。此外,FlutterFlow还推出了AI驱动的代码助手,能够根据给定的功能需求生成代码。目前,FlutterFlow拥有830000名用户,并部署了超过12000个应...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类知识的图谱,通过知识推理提升知识推理能力。打造基于置信度的模型知识问答和知识库检索的评价体系,实现多源知识...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...问题上训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度,提升...……更多
更多关于科技的资讯:
炎黄盈动重磅发布企业级AI平台,全面加速企业AI价值落地
随着AI技术的飞速发展,企业正面临从技术试点到全面应用的关键转折点。技术加速:Gartner报告显示,当前AI智能体和AI就绪型数据发展最快
2025-12-08 11:12:00
路边放一台南迪售货机,打造全时段消费新主张
还在为寻找稳定、低风险的增收渠道而烦恼吗?将一台南迪自动售货机放置在路边,它不仅是24小时不休的“金牌销售”,更是能创造被动收入的坚实资产
2025-12-08 13:35:00
人人租亮相2025中国企业家博鳌论坛平行论坛-创新探索、生态共筑
十年博鳌潮海阔,百舸争流共进发。12月2日至5日,2025企业家博鳌论坛系列活动在海南博鳌举办。围绕“链接全球,引领未来
2025-12-08 13:39:00
鲁网12月8日讯在制造业转型升级与企业全球化布局的双重浪潮中,科技型小微企业正成为激活新质生产力的重要引擎。近日,兴业银行济南分行精准对接企业需求
2025-12-08 14:14:00
布鲁可携丰富产品矩阵首次亮相巴西圣保罗动漫展览会,圣斗士星矢系列新品全球首发
12 月 4 日至 7 日,巴西圣保罗动漫展览会(Comic Con Experience)正式举行,作为世界领先的以漫画
2025-12-08 14:56:00
廊坊开发区新增一家省级工业设计中心
河北新闻网讯(杨自立)近日,河北省工业和信息化厅公示2026年河北省工业设计拟支持项目名单,廊坊华安汽车装备有限公司工业设计中心成功入选省级工业设计中心
2025-12-08 15:00:00
TDK持续赋能第十九届iCAN大赛,助力青年创新创业梦
11月30日,第十九届iCAN大学生创新创业大赛全国总决赛在杭州圆满落幕。作为大赛战略合作伙伴,TDK连续第五年深度参与赛事
2025-12-08 15:26:00
编者按:继国家发改委发展战略和规划司与云河都市研究院共同编制的《中国城市综合发展指标2016》发布之后,云河都市研究院持续每年对全国297个地级及以上城市进行经济
2025-12-08 15:51:00
以革新破局数智未来,思特奇携手运营商开拓AI赋能新范式
2025年作为“十四五”规划收官之年,人工智能发展已迈入全域赋能新阶段。为积极落实国务院“人工智能+”行动的重大战略部署
2025-12-08 16:01:00
中国电信柯瑞文:智能领航 智惠共生
12月4日至7日,2025数智科技生态大会在广州举办。12月5日上午,在大会主论坛上,中国电信董事长柯瑞文作题为《智能领航 智惠共生》的主旨演讲
2025-12-08 16:02:00
国锐生活收购春雨医生 约78%股权,实现向医疗科技转型
为把握“健康中国2030”战略机遇,国锐生活有限公司宣布以2.69亿元对价收购春雨医生天下软件有限公司78.2898%股权
2025-12-08 16:03:00
思必驰首席科学家俞凯教授当选2026年度IEEE Fellow
日前,全球最大的专业技术组织国际电气电子工程师协会(The Institute of Electrical and Electronics Engineers
2025-12-08 16:04:00
山东移动打造AI智慧体育体系,助力山东构建青少年体质健康提升新路径
随着国家“体育强国”和“健康中国2030”战略深入推进,青少年体质健康日益受到重视。山东移动积极响应我省相关部署,结合自身信息技术能力
2025-12-08 16:04:00
这个电影季,探索人工智能如何重塑影像美学与创作生态
中国青年报客户端讯(中青报·中青网记者 沈杰群)12月7日,第七届海南岛国际电影节·联想AI电影季在海南三亚开幕。本届AI电影季以“AI技术为刃
2025-12-08 16:05:00
以AI为钥,以生态为桥:思特奇赋能运营商数智化跃迁
当前,人工智能已迈入与产业深度融合的关键阶段,正从单点技术突破转向系统性生态赋能。在数据、算法、算力等核心要素持续迭代的驱动下
2025-12-08 16:05:00