• 我的订阅
  • 头条热搜
小模型正在成为AI界的新宠
...的能力和效用。”风向在转变,小模型正在成为 AI 界的新宠。尽管参数规模较小,却在成本、性能和实用性方面具备优势 —— 占内存小、反应速度快、可以本地化运行。不久前,微软研究院推出了新一代小型语言模型系列 Phi-3...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
垂直大模型竞争,能突破数据“卡点”吗?
AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
不写代码、靠“玩” ChatGPT 年入百万,提示工程师正变成硅谷新宠
一个阳光明媚的早晨,住在旧金山的软件工程师 Anna 像往常一样,坐在电脑前,打开 ChatGPT,输入 \" 帮我规划我的一天 \"。ChatGPT 回答 \" 当然可以!\",随机给出从早上到晚上的日程计划,并提示 \" 你可以根据自己的情况进行...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
贾扬清:大模型尺寸正重走CNN的老路;马斯克:在特斯拉也是这样
Transformer大模型尺寸变化,正在重走CNN的老路!看到大家都被LLaMA 3.1吸引了注意力,贾扬清发出如此感慨。拿大模型尺寸的发展,和CNN的发展作对比,就能发现一个明显的趋势和现象:在ImageNet时代,研究人员和技术从业者见证...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享的精神,对以上问题...……更多
谷歌没开源的 PaLM,网友给开源了
...了。昨天,一位开发者在GitHub上开源了三种微缩版的PaLM模型:参数分别为1.5亿(PalM-150m),4.1亿(PalM-410m)和10亿(PalM-1b)。项目地址:https://github.com/ conceptofmind/PaLM这三种模型在谷歌C4数据集进行了训练,上……更多
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...上万张GPU训练算力,并成立对标OpenAI的X.AI公司以开发大模型。ChatGPT引爆的AI大模型,正在成为全球科技巨头竞相追逐的新战场。国外有微软、谷歌、亚马逊,国内更是遍地开花。“大模型发布月”名不虚传,刚刚过去的一周基...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...内部分享中,奇绩创坛创始人陆奇直言:他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下,千亿级大模型的军备竞赛愈演愈烈,不少企业赶趟儿式的交出了自家的大模型答卷。尽管大模型的质量参差不...……更多
OpenAI CEO宣布转向,“大模型时代”即将结束?
...然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 A...……更多
开源狂潮让巨头惨败,谷歌内部文件曝光
...的LLMs:在Pixel6上,以每秒5个token的速度,就能运行基础模型。可扩展的个人AI:只要一个晚上,就能在笔记本电脑上微调出一个个性化AI。负责任的发布:这一点倒是没有「解决」,说「避免」会更贴切。现在网上到处都是充满...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
...略合作关系,华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持,公司目前正在积极与华为对接,展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...上一代WSE-2的两倍,可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
openai开始招聘安卓、苹果ios工程师
...2022年11月30日上线,在短短两个月内获得1亿用户,而它AI模型和算法的背后,则是英伟达的人工智能硬件。据介绍,ChatGPT的背后模型是GPT(GenerativePre-Training,生成式预训练模型),GPT这个名字展现了这款模型偏向“生成文本和代码...……更多
更多关于科技的资讯:
大众彻底不装了!大7座MPV威然直降超10万:限时19.99万起
快科技11月15日消息,在今日开幕的2024广州车展上,上汽大众带来了新款威然。这款大7座MPV曾经的售价高达30万元
2024-11-15 10:50:00
都冬天了!为什么最近还这么多蚊子
最近,不知道北方其他地区的朋友们有没有同样的困扰——图片来源:某社交平台谁能想到,都 11 月了,都入冬了,蚊子还天天“魔音贯耳”
2024-11-15 10:50:00
SDG集团明纬携手伙伴进驻第七届进博会 五年之约 筑梦未来
黄浦江畔,宾朋云集。在国家会展中心(上海),一场年度盛会如约而至。2024年11月5日至10日,以“新时代,共享未来”为主题的第七届中国国际进口博览会(下称“进博会”)在此举行
2024-11-15 11:00:00
□ 本报记者 卢 岳“在四川青城山旅游的过程中,结交了很多与自己志同道合的银龄朋友,整个旅途中还有专业的老师提供八段锦教学
2024-11-15 11:06:00
2024年11月15日调研机构GlobalInfoResearch出版了《全球非接触电容传感器行业总体规模、主要厂商及IPO上市调研报告
2024-11-15 11:08:00
品牌出海:科大讯飞&SHOPLINE强强联合展现“中国智造”
近日,国内出海AI赛道内最具代表性的科技品牌——科大讯飞在阿联酋迪拜通讯及消费电子展览会(GITEXGLOBAL2024)上精彩亮相
2024-11-15 11:16:00
飞贼徒手爬楼连偷22部手机:曾做过大楼外墙清洁
快科技11月15日消息,据报道,武汉一家传媒公司的员工上班时发现,放在桌上的22部工作手机全部不翼而飞。经过警方的深入调查
2024-11-15 11:20:00
全球第一款!《半条命2》20周年主题RTX 4080 SUPER显卡亮相
快科技11月15日消息,全球第一款以纪念《半条命2》20周年主题的RTX 4080 SUPER显卡正式亮相,也可能是全球唯一一款
2024-11-15 11:20:00
4K百帧旗舰!瀚铠RX 7900 XTX显卡图赏
快科技11月15日消息,瀚铠新推出RX 7900 XTX 24G D6超合金旗舰版OC显卡,目前京东售价为7159元。现在这款新品已经来到我们评测室
2024-11-15 11:20:00
意向金2万元 比亚迪百万豪华轿车仰望U7开卖:纯电+混动
快科技11月15日消息,刚刚,比亚迪仰望旗下百万级豪华轿车仰望U7正式开启预售,意向金2万元,不过遗憾的是目前官方并未公布正式售价
2024-11-15 11:20:00
真互联网顶流!雷军参观乐道展台:场面堪比追星现场
快科技11月15日消息,在小米SU7 Ultra发布会圆满结束后,雷军亲自前往蔚来乐道展台进行参观。根据网友分享的视频
2024-11-15 11:20:00
余承东确认:华为Mate 70将在11月26日发布
快科技11月15日消息,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东今日在2024广州车展上表示,尊界将于11月底前的发布会上
2024-11-15 11:20:00
狂买15万,都是谁还在“双十一”疯狂花钱?
“史上最长双十一”,在寡淡的氛围中,悄悄拉下了帷幕。2024年的双十一,“猫晚”取消了,各大平台也不再公布GMV具体金额
2024-11-15 11:26:00
澳柯玛再获软件和信息技术服务竞争力百强企业
鲁网11月15日讯在前不久中国电子信息行业联合会组织的“2024年度软件和信息技术服务业成果发布会”上,澳柯玛再获“2024年度软件和信息技术服务竞争力百强企业”
2024-11-15 11:33:00
国网永州供电公司:机器人带电消缺 助推智能电网建设
本文转自:人民网-湖南频道机器人作业现场。供稿单位供图近日,国网永州供电公司配网带电作业迎来新突破——首次应用机器人带电作业
2024-11-15 11:37:00