• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
腾讯大模型终于来了
...Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。北京商报记者 魏蔚 ……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
ChatGPT一周年,机会在大厂还是小公司?
大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型,只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会,从信息时代走向智能时代,会有新的公司起来。作者|尹凯编辑|原野ChatGPT 会成为AI大...……更多
被认可的大模型价格战
...源大会开幕。我们在离杨植麟最近的地方,见证了一次大模型的“追星”现场。当天,杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。两个场景,是中国AI市场由表及...……更多
...GitHub。机器人ML框架LeRobot,采用了Apache-2.0协议,可免费商用,据作者称达到了SOTA水准,在GitHub上已经斩获了3.4k+星标。OpenAI自研芯片进展曝光!百万年薪挖角谷歌:OpenAI计划将目前仅有数人的芯片团队扩展至数十人,且几乎所...……更多
上海:加速实施“模塑申城”
...链路。 在文本领域,2024年4月,企业推出国内首个上线商用的MoE架构、万亿参数的大语言模型“MiniMax-abab 6.5”,模型能力对标GPT-4。MoE技术路线大幅降低了单次推理成本,便于大模型在各行业加速落地。此外,MiniMax是国内首个...……更多
...其传输给用户,同时减少能耗。博乔林表示,“没有任何商用产品”可以像Meta渴望的那样高效地处理和传输每天40亿段视频。另外一款处理器则是该公司的Meta训练和推理加速器(MTIA)家族中的首款芯片,其目的是帮助Meta处理各...……更多
【科技早报】联想、英特尔、爱奇艺签署谅解备忘录;国内低轨卫星通信测试成功
...AI PC,并表示AI PC将是能够创建本地知识库,运行个人大模型,支持人工智能计算,运用自然交互的更强大、更具创造能力的智能生产力工具。(证券时报) 网易在成都成立两家新公司天眼查App显示,10月26日,成都协奏影画科...……更多
GPT-4就是冲着赚钱来的!
...练、日常运营开支都是以百万美元为单位的,短期内想要商用可能很难控制成本。不过,陈巍认为,在商业化方面GPT-4更容易落地。成本是否更高要看多方面因素,GPT-4总的固定研发成本(含预训练模型的训练成本,不是增量成...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
OpenAI官方宣布ChatGPT将推出新的语音和图像功能
...不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具Dre...……更多
李彦宏一番话:重掀大模型开闭源争论
...大会上,百度创始人李彦宏的一番言论再次引发了关于大模型开源与闭源的激烈讨论。李彦宏认为,尽管开源大模型在学术研究和教学领域具有一定价值,但在商业应用中,闭源模型更具优势,因为它们能够提供更高的业务效率...……更多
燧原科技创新研究院院长、首席科学家姚建国教授:构建基础算力底座,推动国产算力发展|WISE2023颠覆AIGC产业发展峰会
...结合。最后,产业界的内部合作将加速算力基础设施落地商用,共同推动国产算力发展。燧原科技创新研究院院长、首席科学家姚建国教授以下为姚建国演讲实录(经36氪整理编辑):我本身在燧原科技和上海交大两个单位,所...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
最强安卓SoC!联发科天玑9300正式发布
...可实现更加高速且安全的边缘AI计算,深度适配Transformer模型进行算子加速,处理速度是上一代的8倍,1秒内可生成图片。 基于亿级参数大语言模型特性,联发科开发了混合精度INT4量化技术,结合联发科特有的内存硬件压缩技术...……更多
...L的原因。就在交易披露的前几天,MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。企业可以自由采用这一开源模型构建自己的大语言模型。自今年5月份以来,MPT系列模型下载量已经超过30...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
微软打造 13 亿参数小型 LLM AI 模型
AI模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的GPT3.5”。▲图源Arxiv注意到...……更多
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...字节跳动、百度等在短期内都将拥有与 GPT-4 一样强大的模型。不要误解我们的意思,OpenAI 拥有令人惊叹的工程技术,他们构建的东西令人难以置信,但他们得出的解决方案并不神奇。这是一个优雅的解决方案,具有许多复杂的...……更多
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
ai公司mosaicml推出300亿参数模型
6月25日消息,AI创业公司MosaicML近日发布了其语言模型MPT-30B,该模型具有300亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大AI模型在更广泛领域的运用。▲图源MosaicMLMosaicML公...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
天垓100率先完成百亿级参数大模型训练,天数智芯迎来新的里程碑
...院(以下简称“智源研究院”)70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。图 天数智芯产品线总监宋煜在北京市海淀...……更多
...企业数已达近万家、百川智能发布开源大模型并且可免费商用、讯飞星火认知大模型面向全民开放……过去一周,国内人工智能热度持续攀升。大模型正从前沿技术加速变成可知可感的产品和服务。不久前,百度、百川等大模型...……更多
深度学习在AI教育中的应用及其关键技术探究
...标准化和归一化以及特征选择和降维技术。最后,介绍了模型构建和训练的关键步骤,包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估。通过这些步骤,可以提高深...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
AI发展变慢了?几位AI头部创业者并不赞同
...AI发展速度非常快。从数量角度看,现在每个月都有新的模型、新的产品、新的应用涌现出来。从质量角度看,OpenAI(美国头部AI公司)今年2月份发布的Sora(视频大模型),5月份发布的GPT-4o(多模态语言大模型),9月份发布的o...……更多
AI PC是噱头还是更快的马车?
...时候,也难免觉得是营销噱头。但是,当我在2024英特尔商用客户端AIPC产品发布会的展区走了一圈之后,我发现AI比我想象中的更有用。是的,有用,不需要技惊四座,但,很有用。端侧AI的本地化落地带来根本性的体验变化既然...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛,...……更多
更多关于科技的资讯:
海信与福耀科技大学战略合作布局具身智能机器人
8月20日,海信集团与福耀科技大学与签署战略合作框架协议。在过去3年深入合作的基础上,双方将在人才培养、科技创新、人员交流合作等领域开展深层次合作
2025-08-22 20:49:00
数据应用大变身
没有方向盘、没有后视镜,它是暗藏玄机的“洋芋巴士”,圆润的车身线条如一颗流动的“科技土豆”。无人驾驶小巴(Robobus)由PIX Moving打造
2025-08-22 21:57:00
南报网讯(记者张希)近日,睿众博芯总部项目在江宁开发区九龙湖国际企业总部园开业,成为江宁开发区“招投联动”模式的成功典范
2025-08-22 07:39:00
“数聚江宁 数领未来”论坛在宁举办多措并举,亮出“数据强基”组合拳南报网讯(记者孙秉印通讯员何俏闵子豪)第九届未来网络发展大会“数聚江宁数领未来”论坛昨天在江宁召开
2025-08-21 08:16:00
●黄伟伟鼓浪屿、园博苑等景区游人如织,演唱会、小剧场一票难求,博物馆、科技馆门庭若市,毕业游、亲子游不断升温……厦门,为火热的暑期文旅经济再添一把“火”
2025-08-21 08:31:00
厦门外贸优品秀出硬实力 创意快闪活动在高崎机场启幕
体育器材企业参与快闪活动,图为工作人员向旅客介绍产品。 (厦门日报记者 卢剑豪 摄)厦门网讯 (厦门日报记者 吴晓菁)18日
2025-08-21 08:31:00
近日,国家广播电视总局印发实施《进一步丰富电视大屏内容 促进广电视听内容供给的若干举措》。《若干举措》强调,要多措并举加强内容建设
2025-08-21 08:39:00
厦门网讯 (厦门日报记者 何无痕)前天,福建省首届“青春之歌”创业创新大赛厦门选拔赛举行,经过激烈角逐,“高精度大功率激光精密制造机器人研发及产业化”“智剪工坊——AI 直播切片
2025-08-21 09:02:00
“新区外贸何以逆势增长”系列报道①丨沂河新区企业“出海”记
当下,“出海”已成为中国制造企业的核心关键词——这不仅是扬帆远航的必然方向,更是转型升级的必由之路。在此背景下,沂河新区交出的外贸答卷尤为亮眼
2025-08-21 09:14:00
汽车地毯的“绿色密码”:坤泰股份用创新编织低碳未来
大众网记者 王瑜 摄影 胡斌 通讯员 刘丽丽 烟台报道在全球积极践行绿色发展理念、大力推进“双碳”战略的当下,各行各业都在探索绿色低碳转型之路
2025-08-21 09:51:00
民宿托管如何稳定收益?旭客用组合拳拆解空置率
很多房东都有这样的困扰:做日租,旺季像“爆单”,淡季却惨淡;做长租,收益总觉得低了一截;想做短租,频率又不稳定。其实,问题不在房子
2025-08-21 10:11:00
伴鱼成立十周年,创始人黄河发布内部信:打造极致的个性化教育
2025年8月20日,在线教育领域的知名企业伴鱼迎来了其成立十周年的里程碑时刻。在这个具有特殊意义的日子,伴鱼创始人兼CEO黄河发布了以“Evolving Speed is Everything”(进化速度决定一切)为核心的全新主题
2025-08-21 10:21:00
满足“健康”与“美”的时代新需求 稳健医疗荣膺2025“西普金奖”
2025年8月16日-21日,中国健康产业(国际)生态大会(英文缩写CPEO,以下简称西普会)在海南博鳌拉开帷幕。本届峰会以“快蜕变
2025-08-21 10:50:00
8月20日,喜临门(603008.SH)发布2025年半年度报告,上半年公司实现营业收入40.21亿元,同比增长1.59%
2025-08-21 10:52:00
从工业端到消费端 智能机器人加速融入生活
编者按:IFR(国际机器人联合会)最新数据显示,2024年中国机器人专利申请量占全球总量67%,人形机器人的运动控制与灵巧操作技术取得关键性突破
2025-08-21 11:05:00