• 我的订阅
  • 头条热搜
AIGC沸腾200多天后,投资人达成三大共识
...之前全球众多大模型基于Llama开发,但又受限于无法免费商用的情况。AI市场格局发生新变化,创投圈的关注点再次被锁定。当人们讨论人类人工智能奇点将近,AIGC时代全面到来时,随着AIGC的一路狂奔,事情慢慢起了变化。首先...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
麒麟商用大模型发布,有连云率先落地金融AIGC商业化
...与运营成本的高度浪费。有连云国内首款“麒麟金融场景商用AI大模型”,基于对金融行业敏锐的需求洞察力、以AIGC赋能革新传统解决方案,推出了云创、云连和云数的闭环产品矩阵,站在客户的角度打造全新的金融AIGC行业解...……更多
半年大模型,还在天上飞
...百度选择了推理文本数为付费标准,只是目前还无法cover商用隐性成本。如果采用B端喜闻乐见的月度付费,那也只是将成本支出方从用户转为自己,显然不是长久之计。ChatGPT面对C端用户20美元/月的定价之下,尚且存在偷工减料...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用。腾讯...……更多
...个tensor(张量)”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。贾扬清的朋友圈之所以流传,很大程度是因为其戳破了AI圈一个人人皆知的秘密:所谓的自研大模型,其实“水分”很大。一位投资人曾对「暗涌Waves」...……更多
amd推出10亿参数语言模型系列amdolmo
...10月31日发布博文,宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo,为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列(LMs),在AMDInstinct™MI250GPU集群上训练,使用了超过1.3...……更多
华为推出昇腾AI计算集群 可支持超万亿参数大模型训练 【华为推出昇腾AI计算集群 可支持超万亿参数大模型训练】《科创板日报》20日讯,华为今日推出全新架构的昇腾AI计算集群——Atlas 900 SuperCluster,可支持超万亿参数的大...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型!谷歌DeepMind最新研究引发热议,甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根...……更多
《长相思》AI角色火出圈,大模型厂商布局角色扮演情感陪伴
...宝app中。随着电视剧《长相思2》近日播出,腾讯旗下大模型应用“腾讯元宝”与腾讯视频联手推出相关AI角色,引发广泛关注。南都记者体验发现,观众可以在元宝app中与角色对话、进行剧情互动、玩角色COS等。据悉,在此次根...……更多
30多款大模型亮相,现阶段厂商比客户更需要大模型
...果不是在WAIC展会上,你很难有机会一口气见到这么多AI大模型。7月6日至8日,WAIC2023在上海举办,在这场人工智能领域规格最高的会议上,参与交流的大模型数量超30个,其中多个大模型是最新发布;在400余家参展商中,芯片企...……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。2月8日,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...务。每天有数十万客户依赖的Amazon Aurora,提供了企业级商用数据库的性能以及开源的灵活性和经济性。 如今AWS再次重新构想关系数据库,让客户无需在低延迟或SQL之间做选择。Amazon Aurora DSQL是一种新型无服务器分布式SQL数据库...……更多
大模型行业资本暗流涌动,10亿元融资成入局门槛?
2024年,大模型发展势头依旧强劲,能力边界不断突破,不仅强化了自然语言处理能力,还在文生视频、辅助编程、数学推理等复杂领域攻城略地,催生了一系列创新应用,并获得了全球范围内的资本关注。据AltIndex(数据分析...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和……更多
首个“开源chatgpt”来了:基于谷歌5400亿参数大模型
...快吧,首个开源ChatGPT项目已经出现了!基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥 PhillipWang 复刻了一个ChatGPT出来。项目GitHub星已经超过1.7k了,而且还在一路飙升ing。不过一反常态的...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多
更多关于科技的资讯:
天眼记者Vlog|2025数博会抢先体验
8月27日下午两点,中国国际大数据产业博览会(以下简称“数博会”)专业展在贵阳市国际会议展览中心隆重举行开馆仪式,正式拉开2025数博会的序幕
2025-08-28 06:03:00
清晨7:30,当手机铃声准时响起,拿起手机查看天气预报与空气质量指数——这是一天中我们与大数据的第一次相遇。一次手机支付
2025-08-28 06:03:00
LV美妆精品全球首店落户南京上半年我市共开出首店超200家,其中江苏及以上首店超43%南报网讯(记者黄琳燕)南京首店上新
2025-08-28 07:37:00
大多降价千元左右,有的品牌降了四五千元中高档自行车价格:从“居高不下”到“集体跳水”□南京日报/紫金山新闻记者王国俊近年来
2025-08-28 07:37:00
南报网讯(通讯员张炎张烨陶炎记者徐宁)记者昨天从扬子石化获悉,该公司不久前成功通过裂解炉燃料系统回收碳四,实现资源循环再利用
2025-08-28 07:37:00
河北日报讯(张辉、王继军)日前,由阿特钚锐秦皇岛科技有限公司(以下简称“阿特钚锐公司”)自主研制的国内最大振幅三质体电磁振动给料机发往上海
2025-08-28 07:51:00
首届炒菜机器人大赛精彩回顾 添可食万星厨彰显智能烹饪科技实力
近日,一场汇聚了政、产、学、研顶尖力量“首届中国炒菜机器人大赛暨首都共享中央厨房产业峰会”在北京平谷隆重举行。本次大赛由中国食品工业协会与北京市平谷区人民政府联合主办
2025-08-27 08:54:00
山推(德州)公司:靠“智造”省出大效益!成本降30%销售额反增15%
鲁网8月26日讯(记者 赵洪斌 实习记者 李安琦)8月26日,德州市举行“产业链上的山东好品牌”系列记者见面会第四场,聚焦高端装备产业链
2025-08-27 09:02:00
欧瑞电子:全国60%超算中心都用它!三年营收增速超40%
鲁网8月26日讯(记者 吴美琳 实习记者 李安琦)8月26日,德州市举行“产业链上的山东好品牌”系列记者见面会第四场,聚焦高端装备产业链
2025-08-27 09:03:00
吉镜头|高清大图!第十五届中国—东北亚博览会展馆一一看过来
第十五届中国—东北亚博览会开幕在即A2馆内的吉林市展馆 A2馆内的延边展馆A2馆内的辽源展馆 小米汽车展馆布置完毕特斯拉赛博越野旅行车已经抵达现场 印度尼西亚展馆正在进行最
2025-08-27 09:13:00
近 日 ,DeepSeek发 布DeepSeek—V3.1,基于下一代国产芯片训练。DeepSeek—V3.1采用UE8M0FP8精度训练
2025-08-27 09:14:00
从家庭式代工坊到“厦门品牌” 厦门制造“衣”鸣惊人
独立设计师王在实位于红顶艺术社区的工作室。时装工作室的师傅在制作样衣。(设计师 供图)“金顶奖”设计师曾凤飞的时装作品
2025-08-27 09:22:00
厦门软件园:人工智能企业在这里“拔节生长”
厦门软件园已形成从基础层、技术层到应用层的人工智能全产业体系。(厦门软件园 供图)厦门软件园企业美图公司应用人工智能技术
2025-08-27 09:22:00
从普惠金融看厦门消费金融服务体系
今年5月,“中情中意 消费一夏”购在厦门消费季活动吸引超20万人次打卡,金融活水与企业让利深度融合,吸引市民游客共赴这场夏日消费盛宴
2025-08-27 09:22:00
ZWO振旺联合格林尼治天文摄影大赛,共创全球天文盛事
国内独家冠名赞助,聚焦全球星空影像2025 年 8 月,中国天文摄影领军品牌 ZWO 振旺宣布,正式成为英国格林尼治皇家天文台主办的"第 17 届格林尼治天文摄影师大赛"(Ast
2025-08-27 09:55:00