• 我的订阅
  • 头条热搜
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。AMD-135小模型隶属于Llama家族,...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
stabilityai推出小语言ai模型
...年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等7种语言,拥有“体积小、性能高效”特点,并号称在“安全透明的环境下训...……更多
amd公布自家首款“小语言模型”
9月29日消息,AMD在Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有6700亿个token,采用Apache2.0开源许可。据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一...……更多
zyphra推出zamba2-mini1.2b模型
...宣布推出Zamba2-mini1.2B模型,共有12亿参数,声称是端侧SOTA小语言模型,在4bit量化下内存占用低于700MB。IT之家注:SOTA全称为state-of-the-art,并不是特指某个具体的模型,而是指在该项研究任务中,目前最好/最先进的模型。Zamba2-min...……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...,各个大厂都有推出小模型系列产品——比如微软的SLM(小语言模型)Phi-3系列、苹果的“小模型”家族、谷歌的Gemma等等。 MaaS平台,加量但降价另外,智谱的MaaS大模型开放平台也发布了2.0版本。相比之下,今年1月智谱Dev Day...……更多
AMD举办AI PC创新峰会:150多家厂商支持
...场空间,例如AMD可以跟小型开发者一起,让RyzenAI在开源小语言模型中更加得心应手,而针对中型语言模型,AMD的Radeon同样可以一展身手。特别是如今AI发展还处于早期阶段,市场还是百花齐放,此时AMD培养和发展自己AI生态圈的...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...量,成为首个不使用位置嵌入的DiT。 - 基于仅解码器「小语言模型」的文本编码器这里,研究人员使用了Gemma(仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展,但大多...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级,加速迈向年轻人工作、学习...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...并不是只有大模型,高效的端侧小模型同样重要。微软的小语言模型Phi-3系列,发布全新多模态模型Phi-3-vision,其具备42亿参数,可提供语言和图像处理能力,能够实现基于照片的推理,并优化对图表内容的理解能力。Phi-3小语言...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...出世,到后来的百模大战如火如荼,再到如今AI落地换挡提速,围绕算力的“全民焦虑”始终贯穿其间。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...集群的稳定性和性能问题,大模型加速层专为大模型训推提速而设计,工具层则通过一套管理界面提供了更便捷的操作体验。百度集团执行副总裁、百度智能云事业群总裁沈抖依托四层架构,百舸 4.0 对集群算力调用的各个环节...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...,提出了Mixture-of-Depths(MoD)方法,使得训练后采样过程中提速50%,成为Transformer架构提速升级的又一重要事件。同样在今年,一家来自国内的人工智能企业彩云科技,在国际机器学习领域的顶级会议ICML(国际机器学习大会)上,发布...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
...、存储,形成毫无短板的“铁三角”,让大模型训练大幅提速。奇富科技对北京商报记者表示,与普通大模型相比,奇富金融大模型在训练过程中的特殊之处在于“软硬结合”的金融科技探索与实践方向。“软”在于对金融业务...……更多
NVIDIA RTX显卡AI推理提速5倍!
...理性能可以跑到每秒319tokens,相比其他后端的每秒61tokens提速足足4.2倍。RTX4090则可以从每秒tokens加速到每秒829tokens,提升幅度达2.8倍。基于强大的硬件性能、丰富的开发生态、广阔的应用场景,NVIDIARTX正成为本地端侧AI不可或缺...……更多
人工智能的第三支柱:数据存储
...– U.2 >< 西部数据Ultrastar DC SN861企业级SSD – E1.S >AI提速内容增长,数据存储未来可期在数据中心,预计未来五年内,HDD 和企业级SSD 都有显著的 EB 级增长机会。为满足市场对大容量SSD的需求,西部数据全新的企业级SSD将容...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...展“人工智能+”行动等战略指引下,我国AI落地进程正在提速,推动更多行业迈向数字化、智能化转型升级,并带动以GPU为核心的智算中心的建设与发展。张建中坦言,GPU在整个计算服务器中的占比依然很低,不到10%,但未来这...……更多
麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
科学家们已经建立了一个框架,通过将它们浓缩到更小的模型中,在不影响质量的情况下,给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明,由于一项技术可以将整个100个阶段的过程...……更多
上千项改进!.net 9正式发布:微软用5个“最”概括
...对常用模型系列的增强标记化、新增对分词算法的支持、小语言模型和大语言模型(SLM和LLM)、嵌入、矢量存储、中间件等。此外还推出了Microsoft.Extensions.AI和Microsoft.Extensions.VectorData,为与AI服务交互提供了统一的C#抽象层。微...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...,就能生成个性化的3D导航车标,比传统3D车标重建方案提速91%。后续,混元3D模型团队将持续探索多视图生成、3D扩散模型、自回归生成等3D生成路线,最终目标落地3D管线。三、腾讯混元这一年:升级高性能MoE模型,发布原生大...……更多
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
有CPU就能跑大模型,性能甚至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在CPU上高效部署低...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...最广泛的前沿和开源模型选择,包括大语言模型(LLM)和小语言模型(SLM)。纳德拉在开发者大会现场提及,GPT-4o已经结合到AzureAI,称OpenAI上周的GPT-4o演示“非常神奇”,OpenAI是微软“最具战略意义、以及最重要的合作伙伴”...……更多
...模型已深入制造业“研产供销服”全流程 ——智能制造提速,行业变革迅猛来袭智能制造有多热?5月16日—17日,本报记者应邀赴深圳参加了2024华为AI+制造行业峰会,与来自汽车、机械电子、医药等制造行业的企业代表、产业...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...全采用高效的数据流架构,这从根本上限制了 GPU 推理的提速。当前的几家主流 AI 芯片 Startup,都选择了数据流架构。其中来自 SambaNova 的 RDU 展现出了独特优势,也被视为 GPU 的最有力竞争者 。与英伟达相比,Sambanova 最新 Llama 3...……更多
2024下半年开始 到底有谁能和英伟达继续卷下去?
...dio2Gesture,用于根据音轨生成肢体手势Nemotron-34.5B,45亿的小语言模型,为低延迟、本地端RTXAIPC推理设计。现场展示了两个NvidiaACE的DEMO,可以看以下两个视频:01:31这是由Inworld制作的一个酒店大堂的场景,其中拥有诸多的NPU与场...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
近日,新型社交平台Soul正式上线自研语言大模型SoulX。作为生成式人工智能最基础、最核心的工具,SoulX将作为Soul “AIGC+社交”布局的重要基建,垂直应用于平台上多元社交互动场景,例如智能对话机器人“AI苟蛋”、AI辅助聊...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提...……更多
更多关于科技的资讯:
三年2000万台!京东与小米签大单:将联合开发免流量摄像机
快科技3月13日消息,京东与小米昨日正式签署战略合作协议,明确了智能摄像机未来三年成交量2000万台的目标。在产品创新方面
2025-03-13 19:21:00
阿维塔迭代赔偿争议发酵 车主维权群近500人声讨:将考虑集体诉讼
快科技3月13日消息,近期,新能源品牌阿维塔新款车型进行了迭代,但因只单方面补偿Pro车主的行为,受到了大量Max老车主的声讨
2025-03-13 19:21:00
冲刺150亿票房!《哪吒之魔童闹海》烂番茄开分:100%新鲜度
快科技3月13日消息,今日,《哪吒之魔童闹海》烂番茄(Rotten Tomatoes)开分,100%新鲜度(10评10鲜)
2025-03-13 19:21:00
“3·15晚会”倒计时!这些行业可能“被点名” 黑幕太多了
央视一年一度的“3·15晚会”即将拉开帷幕。作为消费者权益保护的重要舞台,它不仅是曝光不良商家的“照妖镜”,更是提升公众消费安全意识的“指南针”
2025-03-13 19:21:00
雷神首款18英寸游戏本!ZERO 18 Pro上架:RTX 5090+Ultra 9 275HX狂飙270W
快科技3月13日消息,雷神首款18英寸游戏本ZERO 18 Pro已正式上架开启预约,将于3月31日开售。作为雷神今年的旗舰新品
2025-03-13 19:21:00
告别燃油时代!大众确认下一代高尔夫采用纯电平台:2029年发布
快科技3月13日消息,据外媒报道,大众汽车下一代高尔夫(MK9)预计将于2029年亮相,并将基于大众与Rivian合作开发的全新电动架构打造
2025-03-13 19:21:00
货拉拉主动公开算法机制:提倡司机自主抢单 “就近优先”分配订单占九成
快科技3月13日消息,今日晚间,货拉拉通过官方微博发布了《货拉拉关于推动算法公开透明、向上向善机制的公告》。据公告内容
2025-03-13 19:21:00
迅雷会员最新用户数公布 会员收入再创新高
快科技3月13日消息,迅雷今日公布了截至2024年12月31日的第四季度及2024全年未经审计的财报。财报显示,迅雷2024年第四季度总营收8430万美元(6
2025-03-13 19:21:00
河北新闻网讯(蔡俊杰、李蕊睿)“利用全自动联调试验仪可以对多个现场终端进行同步调试,而且又快又准!”张家口经开区供电中心配电自动化专责梁新福说
2025-03-13 19:26:00
以诚信铸品牌,用品质赢未来
【通讯员:霍冬宇】在当今数字化浪潮中,网络通信技术已成为推动社会发展的关键力量。深圳市后天网络通信技术有限公司(简称后天网络)
2025-03-13 19:38:00
博主快嘴二姐因胰腺癌离世:年仅54岁
3月13日消息,据媒体报道,博主快嘴二姐于3月12日去世,年仅54岁。据悉,快嘴二姐是一位小有名气的网红,会不定时直播和网友们聊天
2025-03-13 19:51:00
0糖0脂肪0能量 大窑查元香乌龙茶1.9元/瓶狂促(配料简单)
天猫大窑旗舰店,大窑查元香乌龙茶 500mL*8 瓶日常售价为 39.9 元,下单领取 24 元优惠券,到手价为15.9元
2025-03-13 19:51:00
三防科技面料:JEEP SPIRIT户外冲锋衣夹克39.9元(160元券)
淘宝自营店淘宝内购会,JEEP SPIRIT户外冲锋衣夹克日常标价199.9元,今日领取160元券,到手价39.9元。三防科技面料
2025-03-13 19:51:00
全品牌覆盖!比亚迪“AI 智能语音”正式接入DeepSeek满血版
快科技3月13日消息,比亚迪汽车宣布旗下全品牌“AI智能语音”正式接入DeepSeek满血版。此前,比亚迪智驾负责人杨冬生在2月10日透露
2025-03-13 19:51:00
13日,中新经纬研究院与国家广告研究院联合出品的报告《中国品牌出海十大案例》发布。国家广告研究院副院长、中国传媒大学教授
2025-03-13 19:53:00