• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
...的能力和效用。”风向在转变,小模型正在成为 AI 界的新宠。尽管参数规模较小,却在成本、性能和实用性方面具备优势 —— 占内存小、反应速度快、可以本地化运行。不久前,微软研究院推出了新一代小型语言模型系列 Phi-3...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
垂直大模型竞争,能突破数据“卡点”吗?
AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多
不写代码、靠“玩” ChatGPT 年入百万,提示工程师正变成硅谷新宠
一个阳光明媚的早晨,住在旧金山的软件工程师 Anna 像往常一样,坐在电脑前,打开 ChatGPT,输入 \" 帮我规划我的一天 \"。ChatGPT 回答 \" 当然可以!\",随机给出从早上到晚上的日程计划,并提示 \" 你可以根据自己的情况进行...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
谷歌没开源的 PaLM,网友给开源了
...了。昨天,一位开发者在GitHub上开源了三种微缩版的PaLM模型:参数分别为1.5亿(PalM-150m),4.1亿(PalM-410m)和10亿(PalM-1b)。项目地址:https://github.com/ conceptofmind/PaLM这三种模型在谷歌C4数据集进行了训练,上……更多
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...上万张GPU训练算力,并成立对标OpenAI的X.AI公司以开发大模型。ChatGPT引爆的AI大模型,正在成为全球科技巨头竞相追逐的新战场。国外有微软、谷歌、亚马逊,国内更是遍地开花。“大模型发布月”名不虚传,刚刚过去的一周基...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...内部分享中,奇绩创坛创始人陆奇直言:他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下,千亿级大模型的军备竞赛愈演愈烈,不少企业赶趟儿式的交出了自家的大模型答卷。尽管大模型的质量参差不...……更多
OpenAI CEO宣布转向,“大模型时代”即将结束?
...然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 A...……更多
开源狂潮让巨头惨败,谷歌内部文件曝光
...的LLMs:在Pixel6上,以每秒5个token的速度,就能运行基础模型。可扩展的个人AI:只要一个晚上,就能在笔记本电脑上微调出一个个性化AI。负责任的发布:这一点倒是没有「解决」,说「避免」会更贴切。现在网上到处都是充满...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
...略合作关系,华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持,公司目前正在积极与华为对接,展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
openai开始招聘安卓、苹果ios工程师
...2022年11月30日上线,在短短两个月内获得1亿用户,而它AI模型和算法的背后,则是英伟达的人工智能硬件。据介绍,ChatGPT的背后模型是GPT(GenerativePre-Training,生成式预训练模型),GPT这个名字展现了这款模型偏向“生成文本和代码...……更多
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
快科技6月14日消息,摩尔线程与全学科教育AI大模型“师者AI”联合宣布,双方已完成大模型训练测试。师者AI基于摩尔线程夸娥(KUAE)千卡智算集群,完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周,训练...……更多
...人 、新加坡国立大学校长青年教授尤洋发表了题为《大模型训练的关键技术》的主题演讲。尤洋指出,庞大的AI模型规模对模型训练提出了挑战,现有的硬件设备已无法满足训练所需的大量计算资源和储存空间需求。为解决上述...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...独家财务顾问。本轮融资额将用于继续打磨产品和自研大模型,拓展商业化能力等。数月前,「Tiamat」已经获得由DCM独家领投的数百万美元天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
GPT-4震惊四座,中国创业者激战“小模型” | Future
...【Future】。发布ChatGPT仅三个多月后,OpenAI亲手为这场大模型热潮再添了把柴火。北京时间3月15日凌晨,OpenAI在官网上宣告了多模态大模型GPT4的诞生。优化了模型可支持的输入模态、文本长度等性能之外,OpenAI在GPT-4的基础上升...……更多
更多关于科技的资讯:
二代酷睿Ultra 200K系列锁定10月发布!非K得等明年初
快科技7月14日消息,AMD Zen5架构的锐龙9000系列月底就要上市开卖了,Intel对应的Arrow Lake-S也就是第二代酷睿Ultra 200系列
2024-07-14 19:44:00
精简产品阵营!奥迪经典车型A5/S5/RS5双门轿跑即将停产
快科技7月14日消息,据外媒报道,奥迪品牌将对其产品线进行调整,A5、S5、RS5系列的双门轿跑车型及敞篷版将不会更新至2025年款
2024-07-14 13:44:00
湖南卫视《歌手》排名引热议!13.8和13.11哪个大 网友吵翻天
快科技7月14日消息,本周五,湖南卫视音乐综艺《歌手2024》迎来第十期比赛,然而在比赛排名中,孙楠与外国歌手的微小分数差异
2024-07-14 13:44:00
Intel Arrow Lake更多细节曝光!P核、E核共享L3缓存
快科技7月14日消息,英特尔即将推出的Arrow Lake处理器平台细节进一步被披露,将采用全新的架构布局。据报道,Arrow Lake的"Core Ultra 200"系列CPU将基于四个主要Tile模块构建
2024-07-14 13:44:00
男子喝藿香正气水15分钟后昏厥 医生:7天内都不能吃此类药物
快科技7月14日消息,夏天天气高温,作为解暑神器,不少人习惯性大热天喝支藿香正气水避暑,但如果不注意药物热性的话,容易引发出其它意外
2024-07-14 13:44:00
美女小姐姐实测体验萝卜快跑:限制太多 网约车司机看完放心了
快科技7月12日消息,近日,萝卜快跑抢出租车、网约车司机饭碗的话题引发网友热议。那现实情况真的是这样吗?近日,@消费者报道 记者亲身体验了广州的无人驾驶网约车
2024-07-14 13:44:00
69元 机械革命“耀M510”三模游戏鼠标上市:6档DPI调节
快科技7月14日消息,机械革命推出了一款型号为“耀M510”的三模无线鼠标,首发价为69元。“耀M510”以其卓越的通用舒适体验为核心卖点
2024-07-14 14:14:00
今年暑期档电影票房已突破40亿:沈腾马丽《抓娃娃》点映及预售总票房超2.45亿
快科技7月14日消息,据灯塔专业版实时数据,截至7月14日13时 31分,2024年暑期档(6月-8月)档期总票房(含预售)突破40亿
2024-07-14 14:14:00
斯凯奇休闲运动鞋大促:门店售价499元 券后199元到手
Skechers(斯凯奇)BOB'SSPORT系列男士绑带休闲运动鞋,门店吊牌售价499元,今日官方清仓券后仅需199元
2024-07-14 14:44:00
曝宝能即将参与众泰运营:多位高管已入职
快科技7月14日消息,据媒体报道,宝能集团及其关联企业深圳津烁贸易有限公司的多名高管已在众泰汽车担任关键职位。包括营销副总裁
2024-07-14 14:44:00
高口碑续作时隔四年回归 !《我的三体:第四季》动画今日开播
快科技7月14日消息,时隔四年,动画《我的三体:第四季》今日在B站开播,从7月14日-9月8日,每周日10:00更新。该剧改编自《三体3
2024-07-14 14:44:00
百元风冷也有LCD屏!瓦尔基里 AL125预售:4 根6mm镀镍热管
快科技7月14日消息,瓦尔基里AL125风冷散热器已在京东开启预售,预售价格139元起,提供了黑白两种配色供消费者选择
2024-07-14 14:44:00
别拿电子垃圾糊弄中国人
Suno爆火后,中国AI音乐圈也再次走到聚光灯下。四年前在前头部大厂AI音乐产品负责人轩轩,观察到一些资本和大厂重新涌入这个赛道
2024-07-14 15:14:00
为招揽中国车企建厂 曝意大利拟考虑将Stellantis停产品牌转让给中企
快科技7月14日消息,欧盟于本月初对来自中国的进口电动车加征额外关税,有业内人士指出,欧盟此举也是希望中国车企能够加快在欧盟本土的投资
2024-07-14 15:14:00
47岁姜阿姨coser现身BW:开启疯狂集邮模式
快科技7月14日消息,今天,是BW(BilibiliWorld)开展的第三天,也是本届BW的最后一天。这三天的上海,到处都是洋溢着笑容的二次元
2024-07-14 15:14:00