• 我的订阅
  • 头条热搜
GPT-4震惊四座,中国创业者激战“小模型” | Future
...【Future】。发布ChatGPT仅三个多月后,OpenAI亲手为这场大模型热潮再添了把柴火。北京时间3月15日凌晨,OpenAI在官网上宣告了多模态大模型GPT4的诞生。优化了模型可支持的输入模态、文本长度等性能之外,OpenAI在GPT-4的基础上升...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
近年来,扩散模型(Diffusion Models)已成为生成模型领域的研究前沿,它们在图像生成、视频生成、分子设计、音频生成等众多领域展现出强大的能力。然而,生成符合特定条件(如标签、属性或能量分布)的样本,通常需要为...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...段中,通常小规模算力就可以满足需求。此阶段主要是对模型的可行性、架构设计的合理性以及算法的有效性进行初步验证,此时模型规模相对较小,参数数量和复杂度都处于较低水平。例如,在构建一个简单的文本分类预演模...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
重复造轮子的百模大战:两极热 中间空
...粟“不敢下手,现在中国还没跑出来一家绝对有优势的大模型,上层应用没法投,担心押错宝。”投资人Jucy(化名)向光锥智能表示,AI项目看得多、投的少是这段时间的VC常态。ChatGPT点燃AI大爆炸2个月中,中国一直在等待自己...……更多
首届全国先进计算技术创新大赛火热报名中!赛题介绍之2:算法创新专题赛
...(EDA)是芯片行业的关键技术。对于EDA工具,精确的器件模型又是所有仿真的基础。常规的器件建模需要人为对测试数据进行分析并结合相应的物理模型进行拟合。需要耗费大量的人力和时间,还存在精度误差的问题。若能够使...……更多
复旦MOSS大模型开源了!Github和Hugging Face同时上线
复旦大模型MOSS,正式开源了!作为国内首个开放测试的类ChatGPT产品,MOSS开源地址一放出,又冲上知乎热搜:从官网介绍来看,MOSS是一个拥有160亿参数的开源对话语言模型。它由约7000亿中英文及代码单词预训练得到,精度要求...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
刚刚开源的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 314...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
腾讯推出 Hunyuan-Large 开源大模型
IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...读】DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...智元了解,字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向,团队规划了VAR为高优项目,投入研究小组和大量资源。 除了VAR,团队还发表了LlamaGen等相关技术论文,新的研究成果也将在近期陆续放出。事...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
最前线 | APUS发布千亿级天燕大模型AiLMe,toC应用发力,toB服务蓄力
...移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”,以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。作为一家成立近九年...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
OpenAI CEO宣布转向,“大模型时代”即将结束?
...然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 A...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才能找到更省力的负重登山方法。近日,LeCun 团队发布了他们在世界...……更多
更多关于科技的资讯:
南报网讯(通讯员毛欣悦记者张希)近日,2025年度南京市新核定的外资研发中心名单公布,江宁开发区5家外资研发中心核定入选
2025-08-25 07:38:00
从清北退学的年轻人,当月入五千的CEO
与其浪费时间,不如直接退学还有一年就要从北大医学院毕业的大三学生阿布,决定从北大退学了。阿布提交了退学申请后,学校的老师并没有立刻批准
2025-08-24 19:17:00
京东建材超品日全渠道大幅增长 卫浴、灯饰照明品类成交额增长超7倍
8月20日晚8点开启的京东建材超级品类日,掀起了今秋第一场家装消费热潮。开售仅1小时,全品类成交额同比增长超2倍;截至8月21日23:59
2025-08-24 20:52:00
烈日炎炎!防晒美白需注意哪些关键因素?近日,护肤品牌谷雨研发负责人李安章从专业角度支招,向中新经纬产业一线栏目讲述防晒美白背后的研发与创新。来源:中新经纬编辑:熊思怡广告等商务合
2025-08-24 17:25:00
能感知环境,还能响应用户需求!全球首款人形机器人头部模组在贵安新区诞生
日前,贵安新区威迈尔科技有限公司(以下简称:威迈尔)正式推出全球首款人形机器人头部模组OmniHead(奥视知脑),为具身智能领域带来关键技术突破
2025-08-24 22:22:00
流量经济赋能长春农博会成果显著,线上销售额突破5200万元
第24届中国长春国际农业食品博览(交易)会胜利闭幕,在为期十天的展会上,流量经济赋能专区成为亮点。通过多平台联动、达人矩阵直播
2025-08-24 21:36:00
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00