• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
...的能力和效用。”风向在转变,小模型正在成为 AI 界的新宠。尽管参数规模较小,却在成本、性能和实用性方面具备优势 —— 占内存小、反应速度快、可以本地化运行。不久前,微软研究院推出了新一代小型语言模型系列 Phi-3...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
...略合作关系,华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持,公司目前正在积极与华为对接,展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
快科技6月14日消息,摩尔线程与全学科教育AI大模型“师者AI”联合宣布,双方已完成大模型训练测试。师者AI基于摩尔线程夸娥(KUAE)千卡智算集群,完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周,训练...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...独家财务顾问。本轮融资额将用于继续打磨产品和自研大模型,拓展商业化能力等。数月前,「Tiamat」已经获得由DCM独家领投的数百万美元天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
GPT-4震惊四座,中国创业者激战“小模型” | Future
...【Future】。发布ChatGPT仅三个多月后,OpenAI亲手为这场大模型热潮再添了把柴火。北京时间3月15日凌晨,OpenAI在官网上宣告了多模态大模型GPT4的诞生。优化了模型可支持的输入模态、文本长度等性能之外,OpenAI在GPT-4的基础上升...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
GPT-4就是冲着赚钱来的!
...冲着赚钱来的!北京时间3月15日凌晨,OpenAI正式官宣了大模型GPT-4 。在惊艳到出圈的ChatGPT推出后仅仅4个月,OpenAI再推新品。这似乎正在印证此前传出的“OpenAI计划2023年营收2亿美元,2024年底前营收达10亿美元”的目标。限制盈...……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...受瞩目的热门话题。在若愚科技CEO孙腾看来,机器人是大模型最理想的落地载体和应用平台,大模型的引入彻底改变了机器人仅能在单一场景下执行单一任务的困境,使机器人智能化水平显著提升,变得更聪明,能够承担更复杂...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
轻量级的模型亦有其存在的市场空间。2022年11月底,基于GPT-3.5的ChatGPT刚出来的时候,小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌给ChatGPT抛出一个问题:证明一下勾股定理。最终,ChatGPT给出了一个基于数学归...……更多
更多关于科技的资讯:
京东官微催一加Ace 3 Pro补货 超跑瓷典藏版预定爆满
【CNMO科技消息】6月28日,京东手机通讯官微发视频催一加Ace3Pro补货。京东手机官微称:@李杰Louis杰哥助我
2024-06-30 22:08:00
准大一新生的必备神器!荣耀200系列护眼、续航、影像全能王!
【CNMO科技消息】随着高考分数的揭晓,学生们迎来了翘首以盼的暑假。这个假期,除了休息和放松,学生们也在为自己选购一部全能手机开启人生新篇章
2024-06-30 22:09:00
预售价269元!一加100W超级闪充移动电源首批售罄
【CNMO科技消息】在昨晚的发布会上,一加除了给我们带来了新机一加Ace3Pro,还发布了一加SUPERVOOC100W超级闪充移动电源
2024-06-30 22:10:00
红魔9S Pro+安兔兔跑分公布 237万冠绝安卓
【CNMO科技消息】不久前,红魔官方曾宣布,将于7月3日举办新品发布会,带来新品红魔9SPro系列,包括红魔9SPro和红魔9SPro+两款旗舰新品
2024-06-30 22:10:00
三星S25 Ultra机身厚度曝光
【CNMO科技消息】由于越来越重视手机的影像系统,如今的国产旗舰机在厚度方面都有些放飞自我,而与国产手机厂商不同的是,三星的S系列却有些格格不入
2024-06-30 22:11:00
vivo Pad3发布!第三代骁龙8s+2.8K护眼屏
【CNMO科技消息】6月28日10点,vivoPad3正式发布并开启预售。该平板搭载第三代骁龙8s移动平台,跑分超过170万分
2024-06-30 22:11:00
王腾向友商“开炮”:升级不大却涨很多 不喜欢可以等等
【CNMO科技消息】6月28日,小米中国区市场部副总经理、Redmi品牌总经理王腾发文向友商“开炮”。王腾称:今年供应链成本确实涨价非常多
2024-06-30 22:11:00
文心大模型4.0 Turbo正式发布 速度更快效果更好
【CNMO科技消息】6月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAVESUMMIT深度学习开发者大会2024上正式发布了文心大模型4
2024-06-30 22:12:00
vivo Y200 Plus中端5G手机即将发布
【CNMO科技消息】近日,CNMO注意到,据海外媒体报道,一款名为vivoY200Plus5g的全新设备即将面世,意在进一步激化中低端市场的竞争格局
2024-06-30 22:13:00
荣耀Magic6系列第二代青海湖电池让你畅游阿勒泰
【CNMO科技消息】随着手机影像功能的不断强大,用手机去拍各种所见所闻已经成为了每个人的新选择。与此同时,我们出门旅行最扫兴的事也已经不再是钱包里没钱
2024-06-30 22:13:00
小米14T Pro有望三季度全球发布 配5000万像素主摄
【CNMO科技消息】小米正在为小米14T系列手机的发布做准备。近日,外媒在泰国NBTC认证中发现了小米14TPro的全球版本
2024-06-30 22:14:00
三星Watch Ultra最终渲染图曝光,网友:果里果气的
随着三星方面官宣将于北京时间7月10日召开全球新品发布会,备受关注的三星GalaxyWatchUltra真机渲染图再次被曝光
2024-06-30 22:16:00
618智能投影线上市场量额双降 三色激光同比大涨26.2%
6月30号消息,洛图科技公布了2024年618年中大促期间中国智能投影线上市场情况。根据数据显示,2024年618年中大促期间(5月20日-6月23日)
2024-06-30 22:17:00
英特尔Battlemage显卡或升级PCIe 5.0
关于英特尔的下一代显卡架构,实际上英特尔在台北电脑展上推出的LunarLake处理器核显就采用全新Xe2架构,其核显的设计也为我们带来了后续代号为Battlemage的独显GPU的前瞻
2024-06-30 22:17:00
单笔交易超40亿美元,泼天富贵轮到了小核酸|行业Mapping
文|胡香赟编辑|海若镜2024年,中国医药行业真的还有风口存在吗?核酸药物是近年来快速兴起的赛道之一。但随着新冠疫情之后
2024-07-01 00:47:00