• 我的订阅
  • 头条热搜
据报道,谷歌上周发布的最新大语言模型使用的训练数据,几乎是2022年的上一代模型的5倍。得益于此,该模型在编程、数学和创意写作方面的表现更为优秀。谷歌是在其I/O开发者大会上发布最新通用大语言模型PaLM2的。内部文...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
国内首个类ChatGPT模型发布,服务器被挤崩
...学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台,邀观众参与内测。看过《流浪地球2》的伙伴应该对MOSS这个名字很熟悉,据悉团队在训练完成第一代模型的时候,正值该片热...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
为满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
OpenAI悲喜两重天:ChatGPT大火 亏损却翻倍了
2023年最热风口是哪个?ChatGPT、大模型认第二,相信没人敢自称第一了。借着ChatGPT和大模型这个风口,微软、谷歌云服务增速赶超亚马逊,百度推出文心一言后股价也一度创下今年新高,可谓风光一时。然而,作为ChatGPT的幕后...……更多
...TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言...……更多
不止反击,谷歌在AI群隔空@所有人
...歌2023年的I/O开发者大会上,其发布了全新一代的大语言模型PaLM 2以及生成式AI能力的“试验版”谷歌搜索和智能云等产品。这堪称一次相当惊艳的“组合炸弹”式轰炸,被很多媒体和网友吹爆了。很快,资本市场也快速响应,截...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...天贶(来源:该团队)研究团队通过建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...2月19日,观察者网了解到,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办,这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。与此同时,摩尔线程联合国内众多合作...……更多
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...发点、生成式AI、人工智能算法框架技术演进、预训练大模型PLM、人工智能内容生成AIGC进行讨论,希望给读者以有益的启发。01 出发点:ChatGPT的第一性原理思维什么是第一性原理思维?简单来说就是回归本质,再进行重构。从...……更多
从云栖大会,看阿里的科技本色
...火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多
...表示,公司正在研发的是适度规模参数、适度算力的专业模型,预计 2024年初会推出首款内测版。从汉王科技获悉,其大模型规避了通用大模型所需的千亿参数和暴力算力,建设目标为“单位可部署、数据私有化、能力专业化、...……更多
算力卡不住大模型的脖子
...有别的方法。虽然从2018年谷歌推出的上一代预训练语言模型BERT开始,戴文渊和他的第四范式已经在研究AI大模型了,但直到GPT-3出现时,整个产业界才作出判断:大模型将会到达一个举足轻重的位置。作为国内最早一波AI产业逐...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...,一大波测评刷屏全网。更惊喜的是,苹果AI背后的基础模型47页技术报告,也一并上线了。一大早,人们期待已久的「苹果AI」首个预览版,正式向开发者们推送了!iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1三大系统中,全都植入了苹...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
微软:从“软件老大”到“AI帝国”
从2009开始开发AI模型,到2019年投资OpenAI,微软正在一步一步成为AI时代的庞然大物。对于微软及其生态系统而言,今年的Ignite技术大会堪称异彩纷呈。微软一口气公布了100多项以 AI 为中心,在云计算基础设施、 模型即服务 MaaS ...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
摩尔线程kuae千卡集群正式落地
12月19日消息,摩尔线程今日宣布,首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地,大模型智算加速卡MTTS4000也同步发布。...……更多
这周,5家公司发了AI新品 | 最前线
...PUS、出门问问5家公司发布了AI相关的新品。但与月余前大模型扎堆发布的态势不同,5家企业的AI新品涵盖了算力层、模型层和应用层——业务的分化或许释放出了乐观的信号:中国的AI企业,正在放下大模型崇拜,更多基于自身...……更多
蜘蛛侠妖娆起舞,下代ControlNet来了!贾佳亚团队推出,即插即用
...样的可控生成!而且SDXL、SD1.5等Stable Diffusion家族的常见模型都能适配,还是即插即用。同时还能搭配SVD控制视频生成,动作细节控制得精准到手指。在这些图像和视频的背后,就是港中文贾佳亚团队推出的开源图像/视频生成引...……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...源@视觉中国文 | 趣解商业,作者 | 张凯旌岁末年终,大模型厂商们又秀了一波“肌肉”。2月1日,此前在大模型领域一直保持“静默”状态的字节跳动终于有了新动作,其上线了“Coze扣子”AI Bot开发平台;与过往聊天机器人的...……更多
oppofindx7系列带来行业首个端侧应用70亿参数大模型
...“AI”领域的布局,带来了行业首个端侧应用70亿参数大模型,以及领先的端侧视觉大模型性能。全新的FindX7系列带来了行业首个端侧应用70亿参数大模型,其可以通过“端云协同\"架构实现在本地与云端协同运作的效果,让FindX7...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
广东:研发千亿级参数的人工智能通用大模型 形成自主可控的大模型完整技术体系 【广东:研发千亿级参数的人工智能通用大模型 形成自主可控的大模型完整技术体系】财联社11月13日电,广东省人民政府发布关于加快建设通...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMin...……更多
更多关于科技的资讯:
本文转自:人民网-科普中国机械总动员钢铁生产的智造先锋钢铁厂里,一场“机械总动员”正在上演,让我们跟随这些智能机械臂,一探究竟!
2024-08-30 17:34:00
近些年来,寿险个险渠道的人才转型话题始终受到行业关注。不同于过往大进大出的粗放式经营方式,发展高效、专业的人才队伍已经逐渐成为行业共识
2024-08-30 17:37:00
本文将介绍手游代理的几种模式
随着手游市场的不断扩大,手游代理已经成为了一个备受关注的行业。手游代理是指通过代理游戏厂商的游戏产品,通过自己的渠道进行推广和销售
2024-08-30 17:39:00
中国经济网8月30日讯(记者 徐自立) 咖啡市场的竞争近年来日趋激烈。今年入夏之后,库迪咖啡(COTTI COFFEE)的便捷店战略应运而生
2024-08-30 17:40:00
海信贾少谦:坚定全球化,对跨国公司合作共赢坚信不移
8月28日下午,第五届跨国公司领导人青岛峰会——青岛高质量发展国际合伙人对话会在香格里拉大酒店举行。海信集团董事长贾少谦受邀作为青岛跨国公司企业代表发言
2024-08-30 17:42:00
行空板MultinomialNB模型实现古诗词作者快速识别
在浩瀚的古诗词海洋中,琳琅满目的佳句常常让人陶醉,但很多人却难以记住每一句的作者。当人们欣赏这些优美的诗句时,常常会想起那位才华横溢的作者
2024-08-30 17:45:00
中国电建贵州工程公司携多项“数智”成果亮相2024数博会
本文转自:人民网-贵州频道8月28日-30日,以“数智共生:开创数字经济高质量发展新未来”为主题的2024中国国际大数据产业博览会在贵阳举行
2024-08-30 17:46:00
侯思军:数字赋能 助推智慧社区建设
本文转自:人民网-贵州频道娄山观 | 看·见数博侯思军:数字赋能 助推智慧社区建设涂敏 高华 阳茜共赴十年之约、共襄数博盛会
2024-08-30 17:50:00
曾永东:筑牢算力网络 加速“东数西算”
本文转自:人民网-贵州频道涂敏 高华 阳茜 黄小桃共赴十年之约、共襄数博盛会、共享数字机遇。2024中国国际大数据产业博览会(以下简称“2024数博会”)于8月28日在贵阳拉开帷幕
2024-08-30 17:54:00
方盒子越野扎堆上市!长城谷玉坤:有些并不具备真正的越野需求
快科技8月30日消息,长城坦克品牌执行副总经理谷玉坤近日就当前市场上方盒子越野车型的涌现现象发表了专业见解。他指出,自坦克300成功推出并受到市场热烈反响后
2024-08-30 18:04:00
沃尔沃总裁吐槽语音控制:物理按键1秒解决 智能语音要4秒 意义何在
快科技8月30日消息,今日,沃尔沃汽车集团高级副总裁、沃尔沃汽车亚太区总裁兼CEO袁小林在2024成都车展沃尔沃汽车新闻发布会上
2024-08-30 18:04:00
超百吨死鱼溢满希腊港口!恶臭已席卷整座城
财联社8月30日讯(编辑 马兰)原计划在沃洛斯海港边,喝着乌佐酒,吃着烤章鱼的游客们不得不面临美梦破灭的痛苦,由于气候变化
2024-08-30 18:04:00
青藏高原冰川中隐藏超1700种病毒:约四分之三是未知病毒
快科技8月30日消息,据媒体报道,美国俄亥俄州立大学的科学家从中国青藏高原冰川取回的冰芯样本发现了有超1700种古老病毒被锁在其中
2024-08-30 18:04:00
推出多项百万奖补,芜湖打造智造名城
大皖新闻讯 制造业是芜湖市的立市之本、强市之要。近年来,芜湖市大力推动制造业高质量发展,取得了显著成效,数字化转型明显加速
2024-08-30 18:14:00
Etsy销量前五品类有哪些
Etsy平台成立于2005年,2015年在美国达纳斯上市。Etsy售卖的产品类目有饰品、服饰、家居、玩具、艺术、工艺品
2024-08-30 18:16:00