• 我的订阅
  • 头条热搜
amd公布自家首款“小语言模型”
9月29日消息,AMD在Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有6700亿个token,采用Apache2.0开源许可。据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一...……更多
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。AMD-135小模型隶属于Llama家族,...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。针对此,港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好...……更多
stabilityai推出小语言ai模型
...年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等7种语言,拥有“体积小、性能高效”特点,并号称在“安全透明的环境下训...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...:乔杨 好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋...……更多
ibm开源“最先进”和高性能的granite代码模型
...BM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种变体,适用于复杂应用现代化...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...o1-preview在规划任务上,表现显著优于o1-mini。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
...作,大幅提升开发效率。在对话流程方面,百融云创通过小语言模型Prompt改写,可以让对话流程变得更顺畅。在业务流程方面,百融云创大模型能使之变得更加顺畅。比如很多企业的数据运营场景,涉及到大量的数据查询、需求...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
运用AIGC人工智能生产内容
...的AI绘图,也时常出现在设计师的讨论话题当中。AI绘图模型令人叹为观止的画作1. 模型的种类与画风由于市面上存在大量的AI绘画工具,每个工具擅长的画风也各有所长;例如基于discord架构下的MidJourney,画面注重细节的构建和...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...并不是只有大模型,高效的端侧小模型同样重要。微软的小语言模型Phi-3系列,发布全新多模态模型Phi-3-vision,其具备42亿参数,可提供语言和图像处理能力,能够实现基于照片的推理,并优化对图表内容的理解能力。Phi-3小语言...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 ...……更多
开源狂潮让巨头惨败,谷歌内部文件曝光
...的LLMs:在Pixel6上,以每秒5个token的速度,就能运行基础模型。可扩展的个人AI:只要一个晚上,就能在笔记本电脑上微调出一个个性化AI。负责任的发布:这一点倒是没有「解决」,说「避免」会更贴切。现在网上到处都是充满...……更多
openai推出gpt-4turbo:比上代便宜三倍
...天的OpenAI首届开发者大会上,OpenAI推出了GPT-4Turbo,这款模型正处于预览状态,号称对于开发者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【新智元导读】适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文,结果。真实数据稀缺可能不再是问题...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...—更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发布ChatGPT的API功能以来,该公司现在已拥有超过2...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...上一代WSE-2的两倍,可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制...……更多
百度、谷歌之后:微软也要在Bing搜索结果中加入AI摘要
...这些响应不仅包括简洁的答案概述,还通过大语言模型和小语言模型提供答案的主要来源链接及相关信息,极大地丰富了搜索结果的内容。例如,当用户搜索关于“大象能活多久”的问题时,Bing不仅会给出简要描述,还会提供...……更多
2024下半年开始 到底有谁能和英伟达继续卷下去?
...dio2Gesture,用于根据音轨生成肢体手势Nemotron-34.5B,45亿的小语言模型,为低延迟、本地端RTXAIPC推理设计。现场展示了两个NvidiaACE的DEMO,可以看以下两个视频:01:31这是由Inworld制作的一个酒店大堂的场景,其中拥有诸多的NPU与场...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
小爱大模型来了!9款无屏小爱音箱推送新系统:免费用
快科技8月23日消息,上个月,小米宣布小爱大模型将迎来全量升级,全部免费。据悉,小爱升级大模型之后会更聪明,比如支持智能问答功能,并能够根据用户要求创作等等,甚至闲聊的体验都能大幅升级。根据官方公布的时...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...前在寻找 2025 fall 博士入学机会。最近,lvmin 带来了最新模型 Paints-UNDO。这款 AI 生成工具可以根据图片还原整个绘画过程,整个 AIGC 社区都为之震撼。Paints-UNDO 的演示 demo。早在 1 个月前,NUS,SJTU,Tiamat 等机构联合已经发布……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
更多关于科技的资讯:
国庆假期进入返程高峰 官方提醒:这两类交通事故在假期占一半
快科技10月6日消息,今日为国庆假期第六天,城市周边道路和通往景区道路的交通流量仍保持高位,长途自驾车辆将陆续返程。据央视新闻报道
2024-10-06 08:08:00
换标林肯领航员 全新福特征服者官图:比F-150猛禽还带劲
快科技10月6日消息,近日,福特发布了全新Expedition(征服者)官图,该车与林肯领航员共享平台,造型方面也有很多相似之处
2024-10-06 08:38:00
刚投保就出车祸 保险公司以当天未生效拒赔!法院判了
快科技10月6日消息,不少人在买新车时都会直接给新车上保险,但有时会收到销售或保险工作人员的提醒,保险当天未生效。那么
2024-10-06 08:38:00
Meta发布AI视频生成器Movie Gen:一键生成高清视频
快科技10月6日消息,据媒体报道,Meta公司发布了其最新的AI视频生成器Movie Gen,这是一款能够自动生成包含声音的高清视频的创新工具
2024-10-06 08:38:00
错过高速出口急刹又倒车致后方三车追尾:罪魁祸首竟迅速开溜
快科技10月6日消息,一到假日高速免费通行的时候,各种奇葩司机就纷纷出现,他们开车主打一个随心所欲,没有章法,甚至敢在高速路上停车
2024-10-06 09:08:00
堵车的源头竟是司机路边停车野餐 网友:建议恶意堵车一次扣12分
快科技10月6日消息,大部分司机在驾车时都最不希望遇上堵车,但若是知道堵车源头竟然是有人在路边停车野餐,想必会更加生气
2024-10-06 09:08:00
质感拉满!vivo X200 Pro mini设计曝光:哑机中框为磨砂材质
快科技10月6日消息,近日,博主体验more透露,vivo X200 Pro mini这个哑机看着还行,中框是磨砂的,白色为亮面玻璃
2024-10-06 09:08:00
哀牢山景区发布安全警示:切勿贸然探险 晚上会释放大量二氧化碳
快科技10月6日消息,近期,因为一位视频博主“山取画材”独自进山收集材料的视频在网络走红,让哀牢山在国庆假期爆火,不少人慕名而来
2024-10-06 09:08:00
游客太多兵马俑被迫上夜班 工作人员:特殊情况临时放票
快科技10月6日消息,据媒体报道,有网友称秦始皇帝陵博物院开放夜场供游客参观。对此,工作人员称,10月3日是特殊情况,因为现场有超1万人没票
2024-10-06 09:08:00
沙坪坝:假日市场供给丰富 传统商圈热闹红火
国庆假期,一带一路“渝货臻品”消费节在三峡广场商圈举行。10月5日,在俄罗斯国家商品馆,传统俄罗斯红肠、风味独特的俄罗斯巧克力
2024-10-06 09:11:00
本文转自:人民网人民网记者 车柯蒙对1级能效或水效标准的16类家电产品补贴20%、出台更有力度的汽车置换更新补贴政策、发放家居家装消费券3亿元……当国庆假期遇上第三届中国(四川)国际熊猫消费节
2024-10-06 09:49:00
国庆返程高峰将至:今日铁路预计发送1873万人次 高速流量6100万辆次
快科技10月6日消息,国庆假期即将结束,大数据显示今日全国将开始进入返程高峰。据央视新闻报道,今日国内航线计划执行航班量超1
2024-10-06 10:08:00
本文转自:人民网-河北频道10月2日晚,一场精彩绚丽的无人机表演亮相沧州园博园的沧趣园上空,500架无人机绘制出一幕幕令人惊叹的视觉奇观
2024-10-06 10:29:00
中国移动发布6G基带概念原型系统:实时吞吐率高达16.5Gbps
快科技10月6日消息,中国移动近日携手中关村泛联院、中信科移动及vivo等机构,展示了面向Sub7GHz频段的6G基带概念原型系统
2024-10-06 10:38:00
电子驾驶证变成红码怎么回事 切记不能再开车了
快科技10月6日消息,交管12123APP支持驾驶员申领电子驾驶证,正常的驾驶证二维码颜色为绿码,但如果驾驶证状态异常
2024-10-06 10:38:00