• 我的订阅
  • 头条热搜
“最强开源AI模型”,4050亿参数版Meta Llama 3被曝7月23日发布
...援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
GPT-4就是冲着赚钱来的!
...冲着赚钱来的!北京时间3月15日凌晨,OpenAI正式官宣了大模型GPT-4 。在惊艳到出圈的ChatGPT推出后仅仅4个月,OpenAI再推新品。这似乎正在印证此前传出的“OpenAI计划2023年营收2亿美元,2024年底前营收达10亿美元”的目标。限制盈...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...VentureBeat报道,德国AI创企Aleph Alpha今日发布了两个大语言模型(LLM)。这两个模型各拥有70亿个参数,可以在多种欧洲语言中提供简洁、长度可控的响应,并已开源。该公司宣称,其模型的性能可以与其他在70亿到80亿参数量级的...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...受瞩目的热门话题。在若愚科技CEO孙腾看来,机器人是大模型最理想的落地载体和应用平台,大模型的引入彻底改变了机器人仅能在单一场景下执行单一任务的困境,使机器人智能化水平显著提升,变得更聪明,能够承担更复杂...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
轻量级的模型亦有其存在的市场空间。2022年11月底,基于GPT-3.5的ChatGPT刚出来的时候,小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌给ChatGPT抛出一个问题:证明一下勾股定理。最终,ChatGPT给出了一个基于数学归...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
以“价值创造”为导向,医渡科技自研大模型即将发布
...生成式AI场景论坛”发表主题演讲,系统分享了医疗垂域大模型的建设与应用。闫峻强调,技术应该从价值出发,否则即使技术再先进,缺乏实际价值也难以持续发展,“以价值创造为导向”也是医渡科技建设垂域大模型的基本理念,公...……更多
本文转自:劳动报2024世界人工智能大会探营:最新大模型产品抢先看■劳动报记者 陈宁7月4日至6日,2024世界人工智能大会将在上海拉开帷幕。今年“百模大战”热度依旧不减,大模型依然是这次大会的十大重点议题之一。据...……更多
国内最大智算中心正式投用:每秒690亿亿次浮点运算 可训练万亿参数大模型
...所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。这个集群智算中心通过先进的智算网络技术把上万块GPU芯片像“积木”一样拼接在一起,大幅提升GPU节点间的通信效率,将数据训练完成时间缩短20%,从而...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...场,正面临着这个关键的过渡。 截至8月底,首批8家AI大模型企业通过备案。与上半年“甚嚣尘上”的行业境况不同,具备实力且具备满腔“产业抱负”的实力型玩家,总是姗姗来迟,但却总是能够一鸣惊人,为产业的大规模应...……更多
轻量化模型架构catvton的优势在哪里
...在话下。 来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、...……更多
16384块NVIDIA H100训练Meta Llama3 4050亿参数大模型:3小时报错一次
快科技7月29日消息,如今的AI大模型规模越来越庞大,动辄成百上千亿参数,训练过程不仅需要数万甚至十几万块GPU加速卡,出错的几率也越来越高。Meta(Facebook)就披露了一份惊人的报告。Meta在报告中披露,为了训练自己的Llama ...……更多
...:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
更多关于科技的资讯:
真我13上架开售:搭载天玑6300芯片 12+512GB定价2199元
快科技9月11日消息,真我13手机现已在realme官网上架,目前仅提供12+512GB版本,售价为2199元。真我13搭载了联发科天玑6300芯片
2024-09-11 17:15:00
华为三折叠19999元起售!短期只有华为能商用落地
快科技9月11日消息,日前华为正式推出了备受期待的三折叠手机Mate XT非凡大师,标志着华为在折叠屏技术领域的又一次重大突破
2024-09-11 17:15:00
预计定价70万!路特斯全新纯电跑车官宣:9月17日首发
快科技9月11日消息,路特斯汽车即将推出一款备受期待的全新电动跑车——THEORY 1,预计在2027年正式上市,市场定位可能在75000英镑左右
2024-09-11 17:15:00
视爵光旭15周年庆新品-MC全球发布会圆满举行
9月10日 视爵光旭15周年庆典暨新品发布会 在视爵惠州新展厅盛大召开 全球海内外合作伙伴200多位合作伙伴以及仲恺高新区管委会等领导莅临视爵集团光电产业园
2024-09-11 17:45:00
磁吸充电宝哪个牌子性价比高?深度测评西圣、绿联、安克充电宝
在智能手机普及的今天,充电宝几乎成为了我们日常出行的必备品。尤其是随着磁吸技术的兴起,磁吸充电宝以其便捷性和高效性赢得了越来越多用户的青睐
2024-09-11 17:45:00
博主曝车企对供应链的压价已到疯狂地步:领导不满意价格 立马重新招标
快科技9月11日消息,据报道,日前有博主透露,车企或代工厂商们对供应链的压价已经到了疯狂的地步。比如,一个刚刚谈好的价格
2024-09-11 17:45:00
美食外卖行业作为现代都市生活的重要组成部分,随着互联网技术的飞速发展,正经历着前所未有的变革与增长。这一行业不仅为消费者提供了便捷
2024-09-11 17:46:00
近日,中国太保再度成为2024年中国国际服务贸易交易会(以下简称“2024年服贸会”)全球合作伙伴和指定保险服务商。中国太保将继续秉承“客户至上”原则
2024-09-11 17:46:00
金秋开学季,掌阅科技x中国移动邀高晓攀与青年学子共话传统艺术
在青春的画卷上,优秀的中华传统文化如同一抹古典的墨香,让青年能够触摸到历史的脉络,感受到艺术的力量。近日,数字阅读平台掌阅科技联合中国移动动感地带开启“动感无限青春奔现”高校开学季阅读活动
2024-09-11 17:56:00
湖北市民京东买空调享8折优惠,美的酷省电到手价2160元
虽已过白露节气,但湖北多地仍旧持续发布高温橙色预警,市民购买空调的需求只增不减。9月9日,京东上线湖北以旧换新活动会场
2024-09-11 17:57:00
哪吒V撞击事故后起火自燃:吓得一旁白车飞快驶离
快科技9月11日消息,今日下午,一条监控视频流出,引起了网友的关注,不少人非常关心司机的安全。从纪录的时间看,这件事发生在今天上午9:10分
2024-09-11 18:15:00
山姆杨枝甘露被指开盖后炸了 客服:可能是运输过程挤压碰撞
快科技9月11日消息,据媒体报道,一位网友在山姆超市购买了8月28日生产的杨枝甘露,一直冷藏没有开封,保质期内开盖后,杨枝甘露发生喷射爆炸
2024-09-11 18:15:00
戴尔宣布今年将继续裁员!PC业务复苏不及预期
快科技9月11日消息,戴尔在监管文件中表示,公司计划在当前财年内继续裁员,以进一步控制成本。戴尔表示,通过限制外部招聘
2024-09-11 18:15:00
《黑神话:悟空》定制!技嘉RTX 4070 SUPER WUKONG OC显卡图赏
快科技9月11日消息,自8月20日上市以来,《黑神话:悟空》不仅在游戏界引起了轰动,更成为了现代科技与传统文化完美结合的标杆
2024-09-11 18:15:00
罗永浩犀利点评iPhone 16:又是零创新
快科技9月11日消息,在苹果发布会结束后,罗永浩发微博点评iPhone 16系列:又是零创新。此前罗永浩还暗讽过iPhone 13系列
2024-09-11 18:15:00