• 我的订阅
  • 头条热搜
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...来学习分子交互规律的短板。同时,凭借显式的、统一的架构,MolTC 可以在少样本、甚至零样本的交互任务中,仍能保持精准高效的输出。另一方面,当前大多数的分子交互模型,不管是基于传统的深度学习模型,还是基于经典...……更多
国云注智 聚力向新 第七届数字中国建设峰会·电信生态成果体验馆盛大开馆
...等多种异构算力的统一接入,具备跨服务商、跨地域、跨架构的统一算力管理调度能力,实现国资央企算力一张网。服务国资央企业务体验和成本最优匹配,降低上云成本;推进国资央企范围的优质算力资源利用最大化。 在“A...……更多
采用MoE大模型,清华创业团队医者AI构建健康管理Agent
...者等组成。公司聚焦于亚健康管理领域,基于最前沿的MoE架构大模型,结合软硬件,为用户提供7*24小时的健康管理服务,让每个家庭都有自己的健康管家AI及Healthy Care Agents。医者AI产品界面据世界卫生组织统计70%以上,总计约9.5...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...披露了更具参考意义的信息,主要包括从数据准备、模型架构、训练方案及优化策略几个方面。数据准备依托快手在视频技术领域的多年积累,可灵大模型团队已经构建了完备的标签体系,包括从视频基础质量、美学、自然度等...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
2024中国AI大模型产业发展报告发布 展望五大产业趋势
...大模型产业发展受到算力层面的一些制约。 主流大模型架构仍存在诸多局限。首先,Transformer架构消耗的算力资源普遍较大;其次,基于Transformer架构的大模型对存储设备的要求也更高。高质量的训练数据集仍需扩展。国内的AI...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
自研神玑芯片,让蔚来ET9感知范围大2倍,决策快1倍?
...片能否在后年继续保持领先,是大家比较关注的点。芯片架构大更新,单芯片解决多芯带宽限制在近日的蔚来NIODay活动中,蔚来发布了代号为神玑NX9031的自研智驾芯片,这款芯片被李斌评价为“用1颗实现4颗旗舰智驾芯片性能”...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...而合,而且360更早就提出了“慢思考”的理念,并在技术架构和产品中都付诸了应用。同时,360还在其AI产品中强调多模合作,让来自不同厂商的大模型“抱团取暖”,为国内模型追赶OpenAI,找到了一条可行的道路。 从o1看大模...……更多
AI黑科技齐亮相这个展,看科创产业力量如何撑高质量发展?
...,是一套从信息化到数字化再到智能化渐次递进的数字化架构,致力于让机器像人一样思考和工作。除了这些,还有一款桥梁检修机器人颇受欢迎。“我们今年带来展会的是桥梁斜拉索检修机器人,它是为了代替人工从事桥梁高...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计的专用芯片难以适应未来算法,通用型算力才具备更强的...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...特征。此外,Gemma Scope使用了最新的、最先进的JumpReLU SAE架构进行了训练。原始的稀疏自编码器架构,在检测特征存在与估计强度这两个目标之间,往往难以平衡。而JumpReLU架构,就能更容易地实现二者的平衡,并且显著减少误...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...年来一边继续做GPU服务器的开发,另一方面纷纷采取开放架构,兼容国产自主创新芯片。比如浪潮信息就推出了开放加速计算架构,据称具有大算力、高互联和强扩展的特点。基于此,浪潮信息发布了三代AI服务器产品,和10余...……更多
AI应用遍地开花,AI应用该如何选择显卡?
...的时候,速度更快、效能更高。但是值得注意的是,硬件架构对应的软件支持在这里也有很重要的地位。比如英伟达的GPU在Stable Diffusion的应用中,专门推出了针对GPU Tensor Core加速的版本,整体效能又提升了不少。因此在算力选...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...使用了哪些数据?其中有多少合成数据?为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Sp...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...游戏行业的应用前景及实践案例。王睿是一位经验丰富的架构师,他首先强调了AI已经渗透到我们生活的方方面面,甚至在相亲时遇到一位大妈,只要你说自己是做AI的,她都会优先选择你,这足以说明AI已经走出科技和IT界,成为一种全...……更多
前瞻2024人工智能四大趋势
...保护。在互联网隐私与版权保护尚未形成统一标准与完善架构的当下,使用互联网数据进行训练,极易导致大量法律纠纷。而若考虑对这些数据进行脱敏,又面临筛查识别准确率方面的挑战。两难之下,合成数据就成为最惠而不...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...former是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,凭借强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,成为自然语言处理领域的主流模型架构。如今,一家创业公司试图动摇Tran...……更多
...战略——整车智能。比亚迪的整车智能,通过璇玑智能化架构,打破不同系统间的壁垒,做到实时捕捉内外部环境的变化,将信息汇总反馈到一个“大脑”进行思考决策,迅速调节车辆状态,大幅提升驾乘安全性和舒适性。比亚...……更多
送技术支持送资源!联发科携手产业伙伴启动天玑AI先锋计划
...需要强大的硬件支持,包括但不限于基于领先工艺和先进架构设计的移动计算平台,集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。从《白皮书...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量,其速度最多可提高26%。通过使用YaFSDP缩短大型语言模型的训练时间,可以节省高达20%的图形处理器资源。Yandex公司高级开发人员、YaFSDP开发团队成员米哈...……更多
NVIDIA GTC2024 :你必须知道的AI、机器人、自动驾驶
...人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。该平台带有 transformer engine 的下一代 GPU,采用 NVIDIA Blackwell 架构,可提供每秒 800 万亿次8位浮点运算 AI 性能,以运行 GR00T 等多模态生成式 AI 模型。凭借集成的功能...……更多
天工skyagents助力大模型走入千家万户
...12月1日,昆仑万维正式发布「天工SkyAgents」平台,助力大模型走入千家万户。「天工SkyAgents」是国内领先的AIAgent开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用...……更多
更多关于财经的资讯:
南微医学成立新公司,含AI及机器人业务
近日,南微医学科技(海南)有限公司成立,经营范围包含:人工智能行业应用系统集成服务;服务消费机器人制造;服务消费机器人销售;智能机器人的研发等。企查查股权穿透显示,该公司由南微医
2025-12-17 15:48:00
签约5.54亿元 2025安徽省智能网联新能源汽车产业链供需对接会在铜陵举行
大皖新闻讯 12月16-17日, 2025安徽省智能网联新能源汽车产业链供需对接会在铜陵市举行。会上,相关方面与汽车产业投资商签订了总投资30
2025-12-17 15:53:00
脑机接口实现用意念控制具身机器人!脑机接口相关专利量已超2000项
据央视新闻报道,12月17日,中国科学院脑科学与智能技术卓越创新中心发布该中心与国内科研机构及医疗单位合作开展的第二例侵入式脑机接口临床试验取得的新进展
2025-12-17 16:00:00
泰康朱平:以专业主义领航寿险新赛道 锻造380人精英团队书写成长传奇
在寿险行业迭代升级的浪潮中,泰康保险营业区总监朱平的名字始终闪耀着独特光芒。加盟泰康十四载,他从一名初出校园的保险新人
2025-12-17 16:06:00
合盛硅业在新疆成立煤业公司
近日,新疆卓能煤业有限公司成立,法定代表人为贺长江,注册资本为1500万元,经营范围包含:煤炭及制品销售;煤炭洗选;煤制活性炭及其他煤炭加工
2025-12-17 16:12:00
智元机器人注册Genie store商标
近日,智元机器人关联公司智元创新(上海)科技股份有限公司成功注册“Geniestore”商标,国际分类为9类科学仪器,已申请商品/服务包括:准备饮料用具有人工智能的拟人机器人;用
2025-12-17 16:12:00
山西汾酒在海南成立国际贸易公司
近日,汾酒国际贸易(海南)有限责任公司成立,法定代表人为相里宝宝,注册资本为3000万元,经营范围包含:酒类经营;酒制品生产
2025-12-17 16:12:00
金融赋能稳健发展 华夏银行成功发行200亿元无固定期限资本债券
近日,华夏银行股份有限公司2025年无固定期限资本债券(第一期)成功完成发行,发行规模达200亿元,票面利率确定为2.32%
2025-12-17 16:19:00
龙源电力在重庆成立新能源公司,注册资本5000万
近日,重庆万州万象龙源新能源有限公司成立,法定代表人为张波,注册资本为5000万元,经营范围包含:发电业务、输电业务、供(配)电业务;储能技术服务;物联网技术服务等。企查查股权穿
2025-12-17 16:24:00
中创新航等成立先进储能私募股权投资基金
近日,凯博诺德先进储能(湖北)私募股权投资基金合伙企业(有限合伙)成立,出资额4亿元,经营范围包含:私募股权投资基金管理
2025-12-17 16:24:00
招商轮船在深圳成立轮船新公司
近日,招商海宏轮船(深圳)有限公司成立,法定代表人为张洪,经营范围包含:国际船舶管理业务;船舶租赁;船舶销售;国内船舶代理;国际船舶代理;国内货物运输代理等。企查查股权穿透显示,
2025-12-17 16:24:00
泰康潘亚华:以专业铸温度 做高净值家庭的“生命伙伴”
“你们规划的不仅是保额,也是我女儿未来无论发生什么都能体面生活的底气。”一位单亲妈妈的心声,恰是泰康健康财富企业家潘亚华十年保险生涯的生动注脚
2025-12-17 16:24:00
泰康柯苗娟:以利他为魂 凭破局之勇 解码精英绩优的成长密码
2017年,柯苗娟从医疗行业跨界加入泰康,带着对养老赛道的敏锐直觉,仅用两个月就签下61单长险,首年保单量突破127件
2025-12-17 16:30:00
泰康高蓝天:以专业为刃 以真诚为鞘 解码健康财富规划师的进阶之路
从高端会所运营负责人到康养地产销售总监,再到泰康健康财富规划师(HWP),高蓝天的职业履历,自带与中高净值人群打交道的“舒适圈”基因
2025-12-17 16:36:00
泰康沈芳:以匠心育英才 用专业守初心 书写HWP发展新传奇
在泰康人寿上海分公司的健康财富规划师(HWP)阵营中,沈芳的名字始终与“卓越”同行。作为HWP资深合伙人,她不仅以个人业绩稳居2025业务年上分个险系统排名第二
2025-12-17 16:44:00