• 我的订阅
  • 头条热搜
XAI大模型Grok-1已正式开源 但并不是在马斯克说的上周
...语言模型Grok-1已正式开源,发布了基本模型的权重和网络架构,有兴趣的用户可通过github.com/xai-org/grok上的指引使用。从xAI在官网公布的消息来看,Grok-1是拥有3140亿参数的混合专家模型。在目前已开源的大语言模型中,Grok-1的参...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...方程或微积分求解。 智谱AI于2020年底开始研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B。2023年推出基于千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...术研究所、中国科学院大学的研究者提出了一种新型模型架构 ——LLaMA-Omni,它可以实现与 LLM 的低延迟、高质量交互。 论文:https://arxiv.org/pdf/2409.06666 代码:https://github.com/ictnlp/LLaMA-Omni 模型……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...RISC-V大芯片创企希姆计算就联合国鑫发布了基于开源指令架构RISC-V打造的大模型系列一体机。其中包括2U4卡、4U8卡机,支持部署6B、7B、13B参数规模的大模型,这也是专门针对私有化部署提供的系统级解决方案。 在私有的处理器...……更多
百度All in的大模型何时能赚钱?
...变化的过程中,也从过去“芯片—操作系统—应用”三层架构,重建成为了“芯片-框架-模型-应用”四层架构,在每一层之间的严格要求下,完成端到端的额优化,为深度学习与大模型的发展打下了坚实的基础,成为大模型能力...……更多
打造全新智算架构,神州鲲泰亮相深圳人工智能生态大会
...区。神州鲲泰全新智算产品亮相活动,并带来“全新智算架构”,以应对多云异构时代的智能算力挑战,神州鲲泰带来的智算产品和创新架构将为人工智能智算中心的打造提供强大助力。 尽精微,神州鲲泰“全新智算架构”...……更多
AI大模型,进入攻防阶段
...如今的AI模型训练已经不再是简单地比拼数据规模和算法架构,纠错及抗干扰能力也成为一个重要指标。随着AI大模型的应用越发广泛且用户群体日益壮大,如何保证AI在回答问题时不出错已经成为关键,考虑到如今草木皆兵,神...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...素级追踪能力,而不仅仅是语义理解。它采用了Transformer架构,编码了视频中点的跟踪信息,迭代更新点的位置。此外,CoTracker还采用了窗口机制,将时间轴划分为滑动窗口,以对更长的视频进行像素级跟踪。这一独特的方法使...……更多
AI与人争资源怎么破解
...忧。英伟达首席执行官黄仁勋6月2日宣布,新一代AI芯片架构在性能提升30倍的同时,能耗只有上一代产品的1/25。美国波士顿大学工程教授科斯昆认为,在AI巨头完成大模型的测试后,AI能耗问题可能就没有那么突出了。届时将确...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...特征。此外,Gemma Scope使用了最新的、最先进的JumpReLU SAE架构进行了训练。原始的稀疏自编码器架构,在检测特征存在与估计强度这两个目标之间,往往难以平衡。而JumpReLU架构,就能更容易地实现二者的平衡,并且显著减少误...……更多
2024中国AI大模型产业发展报告发布 展望五大产业趋势
...大模型产业发展受到算力层面的一些制约。 主流大模型架构仍存在诸多局限。首先,Transformer架构消耗的算力资源普遍较大;其次,基于Transformer架构的大模型对存储设备的要求也更高。高质量的训练数据集仍需扩展。国内的AI...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...享中指出,在机器学习领域,长期以来存在着两种主要的架构理念之争:Model-Centric(以模型为中心)与 Data-Centric(以数据为中心),这两种路径的核心目的都是为了提升模型的性能与效果。当我们把这个目标再提升一个维度,...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...的Scaling Law数据、图文音视频多模态的基础模型以及Sora的架构。▲ Sora 架构 然而,骆继祥指出,尽管AI视频技术取得了长足的进步,当前仍处于完全生成与模拟之间的阶段,“无中生有为生成,适应规则为模拟”。文字与物体...……更多
欧爱申请多枚gpt-6、gpt-7商标
...能聊天机器人模型。ChatGPT4.0基于自注意力机制的Transformer架构。这是一种基于深度学习的模型,通过大量的数据训练,它能够抓取文本中的复杂模式,并生成新的、连贯的文本。其运行原理是根据前文预测下一个词,以此迭代生...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...·软件工厂发布现场开发一款软件,需要需求分析,系统架构设计,微服务开发、系统测试和运维保障系统等大量环节。尤其对于中小型企业和初创公司来说,这些问题尤为显著。但传统的开发模式,尽管各有优点,但仍面临诸...……更多
星环科技与英特尔携手举办“AI PC激发知识的力量”研讨会,共探智能PC新未来
...,未来,由于隐私和成本两大考量,云、边端融合的计算架构成为必然,端侧 AI 部署通过将用户敏感信息留在本地,将有效减少隐私泄露、数据安全、时延等问题。 英特尔中国客户端产品营销部总经理傅彬指出,英特尔致...……更多
...初其推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
...抽象。我们之前讲到Model as a service,它既代表了基础设施架构上的升级,也代表了围绕着模型一系列的范式转移。今天开发的模式更多是以模型为中心,所有人围绕着模型重新设计自己的开发系统,甚至今天设计自己的业务系统...……更多
“未来可持续投资”产融对话:人工智能发展趋势
...火》为主题的演讲,从通用板块技术情况,科大讯飞的大模型在技术方面的进展情况,以及中美在大模型方面的竞争情况三方面进行介绍。 “我们确实在技术发展上稍晚于美国的大模型,但整体来看,大模型的竞争主要在中美...……更多
Sora为何没能诞生在中国?
...Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模...……更多
Find X7 Ultra翻开手机AI新篇章
...平台”。 据了解,安第斯大模型以“端云协同”为基础架构设计思路,推出从十亿至千亿以上多种不同参数规模的模型规格,能够基于“端云分工、端云互补、端云协作”等方式,灵活支撑多元化的应用场景。显而易见,OPPO推...……更多
瞄准企业提效增收关键环节 百度智能云升级3款大模型应用
...式,大幅提升知识加工效率。此外,甄知还能够根据组织架构,为不同业务、部门、组织、员工设置不同的知识权限,严格把控知识权限,保证企业知识安全。在知识应用环节,甄知可实现对话式问答、对话式阅读、千人千面的...……更多
...分布式算力,需要通过一体化的算力互联网对跨地区、跨架构、跨服务商的算力进行调度,既要满足训练需求,又要满足推理需求,还要以便捷、经济的方式供广大客户使用。中国电信在业内率先提出并持续践行云网融合理念,...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...维度融合起来,参考了 Sora 的算法设计,它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。OpenAI 的 Sora 横空出世,让 AI 在视频生成方面取得了显著进展,但大多数模型在生成具有连贯性和逻辑...……更多
不要小看「实而不华」的腾讯 AI
...连开了两场发布会,第一场宣布混元文生图升级采用 DiT 架构并开源,第二场,腾讯重申了以「产业实用」作为发展大模型的核心战略,并从模型侧、工具侧、应用侧三大核心层公布了一系列 AI 战略的最新进展。作为国内最大的...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...了让模型能够更清楚地感知视觉信息和理解视频,团队在架构上进行了一些升级:一是实现了对原生动态分辨率的全面支持。不同于上代模型,Qwen2-VL 能够处理任意分辨率的图像输入,不同大小图片将被转换为动态数量的 tokens...……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...AI Open Day正式举办。在现场,智谱AI发布了全新的开源大模型GLM-4系列、新API模型、MaaS 2.0大模型开放平台、智能体等等产品。5月的大模型“大促月”还没结束,智谱也再度跟进降价。比如,GLM-4-Flash轻量化版本,在企业优惠价下...……更多
...芯片,将专用于训练和部署基于“变换器(Transformers)”架构的人工智能模型,这种架构是推动ChatGPT等技术进步的核心。Etched的联合创始人兼首席执行官加文·乌伯提(Gavin Uberti)表示,随着人工智能技术的进步,大量对计算资...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...提出。 为了创建生成式智能体,研究者构建了一个系统架构,此架构扩展了大型语言模型的功能,使其能够存储智能体使用自然语言的经验记录。随着时间的推移,这些记忆会被整合为更高级别的思考,并被动态检索以规划智...……更多
更多关于科技的资讯:
新华社杭州8月3日电 大模型、人形机器人、智能计算等领域科技频频突破,以杭州“六小龙”为代表的人工智能科创企业拔地而起……今年以来
2025-08-04 07:19:00
7年前的iPhone,凭什么被炒成千元神机
跳票N年的苹果首款折叠屏iPhone,终于又有了点眉目。近日,继折叠屏iPhone“将于2025年三季度末或四季度初投产”的传言后
2025-08-03 17:09:00
生产未动、订单先行!仰华汽车科技四大产业基地即将落地贵州
8月1日,仰华汽车科技在贵阳经开区举行发布会,会上与香港投资机构完成投资交接、与海外企业签下首批国际订单,意味着总投资超三十亿的汽车项目离落地贵阳更近了一步
2025-08-03 18:02:00
闪铸科技AD5M连续12月蝉联亚马逊销冠,中国3D打印品牌闪耀全球
在竞争激烈的全球3D打印市场中,中国品牌闪铸科技(Flashforge)凭借强劲的研发实力与持续创新力,再次刷新国际成绩单
2025-08-03 18:33:00
准大学生成为十堰数码市场消费主力军
十堰广电讯(全媒体记者 魏俊 何旭)高考结束后,相关消费持续升温,准大学生拉动“后高考经济”,带动手机、电脑等入学装备销量激增
2025-08-03 19:01:00
网易云音乐独家打造BLACKPINK快闪空间 出道九周年庆典同步开启
2025年8月2日,全球顶级艺人BLACKPINK官宣入驻网易云音乐,并通过独家中文笔记向平台乐迷分享了最新动态。YG娱乐联合CASTER STAR
2025-08-03 15:23:00
物业公司打起来了,一边撤场一边“抢地盘”
现在围绕物业问题产生的冲突越来越多。物业公司一边主动从一些小区“撤场”,引发行业对规模化增长和利润的担心,一边又发力在存量小区“拓盘”
2025-08-03 08:47:00
中国品牌出海,如何在不确定中锚定“确定”?2025出海大会嘉宾超级金句来了!
2025年7月25日, 2025出海大会在浙江钱塘成功举办。本届大会以「以“匠心”至“世界”」为主题,特设主会场及分会场“投资金砖”-国别合作对接会
2025-08-03 08:49:00
录取比例超过20比1,全球学霸为何千里迢迢来西湖“追星”?
这个暑假,西湖大学的校园里掀起一股特殊的“追星潮”——数百名来自全球多个国家和地区的青年学子,跨越山海奔赴杭州,只为近距离接触生命科学
2025-08-03 08:47:00
年入558亿,中国便利店之王,竟然是它
提起便利店大家脑海中出现的第一个名字是什么?罗森、7-11还是全家,可能每个人的答案都不一样。但如果是广东的朋友,那么答案一定是#美宜佳
2025-08-03 05:41:00
运动品牌营销细分,潮流基因强化圈层认同|世研消费指数品牌榜Vol.56
本次监测周期内,安踏、耐克和斐乐以1.86、1.70、1.68的综合热度位列榜单综合热度前三。图源:世研大消费指数国货运动品牌场景痛点精准拆解
2025-08-03 05:41:00
最没存在感的河北特产,悄悄统治江浙沪?
提到河北衡水,估计不少人脑子里先冒出来的,是让全国学生闻风丧胆的衡水中学,以及一瓶名叫老白干的白酒。但在这两张耀眼名片外
2025-08-03 06:43:00
华立工业园:制造企业落脚海外的“工业唐人街”
过去一百多年来,唐人街是中国移民在海外聚居形成的经济和文化社区,往往也是新移民踏上陌生土地后落脚的第一站。对于许多刚刚“走出去”的中国制造企业
2025-08-03 06:43:00
对话蚂蚁集团张俊杰:AI 如何重塑医疗健康产业?
当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理
2025-08-03 06:45:00
让机器人拥有智能触觉,「悟通感控」获数千万元融资 | 36氪独家
36氪获悉,柔性触觉感知科技公司「悟通感控」近日完成数千万元系列融资:Pre-A轮由尚势资本领投、水木创投跟投;Pre-A+轮由广发基金瑞元资本领投
2025-08-03 06:45:00