• 我的订阅
  • 头条热搜
...其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5,拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力,同时能够实现单卡低...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
腾讯推出 Hunyuan-Large 开源大模型
...2B-Instruct和Hunyuan-A52B-Instruct-FP8。并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。其中模型技术优势如下:高质量合成数据:通过合成数据增强训练,Hunyuan-Large能够学习到更丰富的表示,处理...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...做个假设,如果把GPT-4(大约有1万亿参数)以50tokens/s的推理速度部署在生活中,你需要什么样的硬件?答案是1亿个H100 GPU。别说是移动设备了,家里都放不下。那如果降低标准,用LLaMA-v2 7B这样的模型,再加上8-bit量化呢?简单...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...flops的FP4计算能力,这是由其2080亿个晶体管提供的。高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。训练能力:使用Blackwell GPU...……更多
...数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B,推理2K长度文本内容仅需3G显存,可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...人脸动作轨道的信息,对被遮挡的人脸动作进行去噪。在推理阶段,给定任意音频 - 视频对作为说话人风格提示,模型都能生成模仿该说话风格的人脸动作。图 3. 能在上下文中学习目标人说话风格的人脸动作生成模型模型的应...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年...……更多
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,尤其是在科学、编码和数学等领域,展现出...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...验结果发现,Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律,以及各种概念的合理运动。在微调阶段,研究人员精选了一部分视频,对模型在美学、运动质量方面完成...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...外,HuggingFace上还发布了7B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不……更多
零一万物发布千亿参数模型Yi-Large 李开复呼吁拒绝烧钱打法
...roduct-Market-Fit(TC-PMF),技术成本X产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统PMF难上一百倍。”李开复表示,希望大模型赛道的竞争聚焦于达成TC-PMF。李开复提出,国内大模型赛道的竞跑从狂奔到长跑,终...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成国产、自主、可控的360智脑大模型,具备大模型管理、推理部署等功能。摩尔线程全功能GPU将为该一体机提供强大的底层算力,以高性价比硬件方案确保大模型推理效率与成本的平衡。不仅如此,360大模型产品还与摩尔线程完...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
英伟达推出新一代ai芯片,预计今年晚些时候发货
...名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理,允许公司继续使用已拥有的数亿个英伟达GPU。这将减少新人工智能模型的初始训练推理所需的算力。英伟达的策略是让购买英伟达服务器的客户注册英伟达企业版,...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
被认可的大模型价格战
...要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是AGI。 李大海则尝试从经济学的角度定义AGI。在他看来...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
...,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
更多关于科技的资讯:
【观点摘登】殷杰:新形态人机交互影响人性
生成式人工智能本身并不具有人性,但其在与人类的语言交互中,通过识别人类意图、回应认知和情感需求来满足人类欲望,无疑会深刻影响人们的理性
2025-01-17 22:41:00
王轶乐 对外经济贸易大学国际商学院摘要:内部控制是现代企业管理的重要组成部分,本文从内部控制的基本概念入手,探讨其在集团公司财务管理中的应用与实践
2025-01-17 23:14:00
李红香 东平县彭集街道社区卫生服务中心口腔科牙齿是人咀嚼食物的工具,也是美丽笑容的关键组成部分,对人的整体健康有着重要影响
2025-01-17 23:14:00
京东工业携手浙江维派 共建包装机械设备行业数智供应链标杆
近日,京东工业与国内头部包装机械设备品牌浙江维派达成战略合作,浙江维派总经理周柯胜与京东工业相关负责人出席签约仪式并进行座谈交流
2025-01-17 20:28:00
• 秉持"以人为本"理念,江森自控凭借在人力资源战略和实践方面的出色表现,再次赢得杰出雇主调研机构的肯定1月16日,杰出雇主调研机构 (Top Employers Institute) 正式发布"中国杰出雇主2025"榜单
2025-01-17 20:36:00
全球知名专家学者齐聚深圳,国际给药趋势研讨会释放哪些讯息?
1月17日,由全球雾化科技龙头企业思摩尔旗下MOYAL岚至主办的“跨界视野下未来给药技术趋势研讨会”在深圳召开。本次会议深入探讨了未来给药的行业趋势与技术路径
2025-01-17 20:56:00
新突破!中国首套年产50万吨新一代瓶片装置投产
快科技1月17日消息,据报道,我国首套采用聚酯中黏工艺技术建设的50万吨/年瓶级切片装置在中国石化仪征化纤公司成功投产
2025-01-17 21:27:00
趵突泉锦鲤胖的跟猪一样 园区:再喂就噶了!
快科技1月17日消息,据媒体综合报道,近日,济南趵突泉的锦鲤要减肥冲上了热搜。据报道,在趵突泉景区海豹池,一个印有“锦鲤减肥中心”的指示牌被放置在了池内
2025-01-17 21:27:00
纯黑外观+铝合金背板!傲世ODYSSEY征途锐炫B570显卡图赏
快科技1月17日消息,Intel近期推出了其第二代锐炫独立显卡系列,首波亮相的型号为B580与B570。其中,B580已率先上市
2025-01-17 21:27:00
自主研制!东方风电120米海上风电叶片顺利完成测试
快科技1月17日消息,据“东方电气”官微发文,东方电气集团所属东方风电公司自主研发的120米海上风电叶片,凭借完全自主知识产权
2025-01-17 21:27:00
男子23.5万买捷豹新车却无法提车 4S店:合格证被押银行了
快科技1月17日消息,据报道,曹先生上个月在杭州运通和乔4s店买了一辆捷豹,车价23万5千元。曹先生介绍,4S店称预计1月10日交车
2025-01-17 21:27:00
颜值感受下!美国空姐发机舱内跳舞视频被开除引热议 才刚结束试用期
1月17日消息,近日,一段关于美国一名空姐因在机舱内跳舞而被开除的事件在网络上持续发酵。1月16日,这名空姐发布了一段众筹视频
2025-01-17 21:27:00
马斯克:加州莫斯兰丁发电站起火事故与特斯拉无关 Megapack运行良好
快科技1月17日消息,据报道,特斯拉CEO马斯克在社交平台发文称,美国加利福尼亚州莫斯兰丁发电站起火事故与特斯拉无关,其Megapack储能电池模块运行良好
2025-01-17 21:27:00
华为加大产能!Mate 70系列基本不加价卖了
快科技1月17日消息,上市已经有段时间的Mate 70系列,随着产能的增加,溢价率也在慢慢消失。现在,有数码博主曝光了华为Mate 70系列部分机型的渠道价格
2025-01-17 21:27:00
保护人体健康的防线!人体最大免疫器官竟是肠道
快科技1月17日消息,据了解,肠道是人体最大的免疫器官,它不仅仅是机体消化吸收的地方,而且时刻抵挡着大量的病菌的侵入。肠道黏膜面积超过400平方米
2025-01-17 21:27:00