• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...AMBADA,考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一,平均分为第三。在LongBench(多任务、中英双语、针对大语言模型长文本理解能力的评测基准)测...……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
新鲜早科技丨谷歌发布AI基础世界模型Genie;苹果可能取消电动车项目;国内5G-A生态加速联合
...的大幅提升。同时,正不断提升一体化算力产品、训练及推理供给能力。联通和华为还签署了《无线网络OPEN API联合创新合作备忘录》。5、 中国移动携手华为等产业伙伴发布裸眼3D产业推进倡议。MWC期间,中国移动携手中东的阿...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制程,芯片面积为46225平方毫米,拥有的晶体管数量达到了4万亿个,拥有90...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
字节版Sora火爆24小时,同名论文再次被热议
...令描述了视频片段的主要场景 尾帧图像指令(在训练和推理过程中可选使用)描绘了视频片段的结尾,并提供了额外的控制 这里要插一句,与文本指令相比,图像指令更加直接且易于获取——使用真实视频帧作为训练中的图像...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
NVIDIA首秀Blackwell GB200超级芯片系统:AI推理性能飙升1.5倍
...性能方面只给出了一个数据:Llama 3.1 700亿参数大模型的AI推理性能对比H200提高了足足1.5倍。散热怎么办?NVIDIA透露正在开发热水散热系统,可以将耗电量减少28%。不过,NVIDIA仍然没有给出Blackwell GPU服务器的出货时间,估计在...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...应用设计;PanguP系列,百亿级参数,为低时延、低成本的推理场景提供支持;PanguU系列,千亿级参数,适用于处理复杂任务,成为企业通用大模型的坚实基础;PanguS系列,万亿级参数,作为超级大模型,能够处理跨领域多任务,...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
...左右API“价格战”?在降价之外,有媒体指出,加快模型推理速度(即每秒生成Token的数量)也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗?硅谷在“拼”什么?5月中旬,字节跳动豆包以0.0008...……更多
华为HarmonyOS NEXT搭配Mate 70系列
...一方面指为人工智能关键技术发展,尤其是大模型训练和推理提供可持续的算力,构建共赢的生态;另一方面是用AI增强华为产品和解决方案的竞争力。华为轮值董事长表示,HarmonyOSNEXT将提供纯粹而智能的本地体验。与此同时,...……更多
...模态模型RRMM及双臂协作系统RTACS,该模型能使机器人理解推理抽象的语义指令,并调度双臂协作系统执行任务。此前,仅OpenAI等国外人工智能头部企业发布了类似成果。此次发布,标志着成都在我国多模态模型应用于人形机器人...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...两个任务主要依赖形式语言能力或信息检索,而非复杂的推理能力。由此可以得出,在没有上下文学习的条件下,GPT 模型的涌现能力受到了极大的限制。然而,涌现能力的来源仅仅如此吗?研究团队又将目光转向了指令微调模...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
宏景科技(301396):把握算力行业机遇,签署4亿大单
...中心建设及运营项目”。该项目旨在提供AI大模型训练、推理算力、图形渲染等多样化的算力需求,服务于通用大模型、行业大模型等多个领域。预计项目建设完成后,可实现营业收入约6497万元/年,净利润约1320万元/年,项目静...……更多
搞医学影像,为什么都青睐于CPU?
...ACS/RIS产品中,就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下,融合影像分析等技术,让医务人员通过旋转、缩放、分割、图像增强等操作,从多角度清晰了解到医学影像中各结构之间的空间位...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大
...解、生成、逻辑、记忆等能力的差距,但却忽视了成本、推理速度等维度。有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。“模型天花板很高,你今天做到的跟你实际想要做到的、跟理想状态还差得非...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
...较确定的长期主线。 投资机会上,张雪薇认为主要利好推理侧算力以及AI+相关硬件。GPT-4o最让人惊叹的除了强大的理解能力,就是几乎实时的反应速度。这次GPT-4o的超低延迟将会对推理算力提出更高的要求。国产算力方面,海...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能会受限。中国人民大学的研究表明,尽管RAG可以提升LLM的推理能力,但这种提升作用并不是...……更多
更多关于科技的资讯:
国内首台!全增材制造航空发动机完成压气机性能考核试验
快科技1月5日消息,据“中国航发”官微发文,中国航发自主研制的160公斤推力级增材制造涡喷发动机在株洲完成压气机性能考核试验
2025-01-05 20:16:00
最强天玑直屏旗舰!vivo X200S外观曝光
快科技1月5日消息,博主定焦数码绘制了vivo X200S渲染图,该机将在今年上半年登场。如图所示,vivo X200S延续了X200的环形相机设计
2025-01-05 20:16:00
南国智库·财经观察丨麦德龙落地、大润发Super开业……海口超市格局又有新变化
从2024年踏入2025年,海口超市格局又有了新变化。在2024年的最后一天,知名国际仓储会员制超市巨头麦德龙与海口日月广场签约
2025-01-05 20:42:00
体检查出这6种病不用过度治疗:很多“病”就是机体衰老的体现
1月5日消息,据媒体报道,随着年龄增长,身体会发生很多变化,比如皮肤失去光泽,皱纹越来越多,头发逐渐变白。除了外貌上的改变
2025-01-05 21:16:00
90岁网红奶奶吴老大去世 生前鼓励大家:不要难过 你们会越来越好
1月5日消息,据媒体报道,90岁网红奶奶“吴老大”去世,生前录视频鼓励家人 :不要难过,你们会越来越好。视频中她说道,当你们看到这个视频的时候
2025-01-05 21:16:00
00后格力人带来活力革新:奇葩商标背后的战略布局与创新驱动
近年来,格力给我们的印象往往是高品质空调的代名词——“好空调,格力造”这一广告语已经深入人心。然而,随着市场环境的变化和年轻一代员工的加入
2025-01-05 16:45:00
CES热点前瞻:芯片大厂新品齐出 千余家中国公司亮相拉斯维加斯
作为年初惯例,全球最大科技盛会CES将在下周举行。数千家科技企业集体亮相拉斯维加斯,展示手头有哪些值得市场兴奋的前沿新品
2025-01-05 17:16:00
薛记炒货创始人亲述:靠3颗“心”,4个“法宝”,开出了1000门店
捧着坚果的“薛大叔”——薛记炒货创始人薛兴柱为庐友们分享了他从济南街头摆摊卖炒货,到如今完成A轮融资、全国门店开到近千家的创业历程
2025-01-05 17:22:00
“开合间 见非凡” 华为Mate系列尊享品鉴会圆满落幕
2024年12月31日,“开合间 见非凡”为主题的华为Mate系列尊享品鉴会,于山东省美术馆盛大启幕,此次活动汇聚了来自商业
2025-01-05 17:23:00
开新局 谱新篇丨十堰电子企业全力冲刺今年一季度“开门红”
十堰广电讯 新年开局,十堰各地电子企业铆足干劲,紧盯新品研发、市场销售,积极扩能提产,全力冲刺今年一季度“开门红”。兆丰电子
2025-01-05 17:31:00
年均发电6.78 亿度!三峡青口盐场渔光互补“光伏复合”项目并网
快科技1月5日消息,据“中国能建”发文,中国能建江苏院EPC总承包的三峡青口盐场450兆瓦渔光互补“光伏复合”项目成功完成首批并网工作
2025-01-05 18:46:00
女子吃5斤车厘子过敏肿成悲伤蛙 医生提醒:过量食用所致
快科技1月5日消息,据报道,广东一名女子因对车厘子的极度热爱,竟一口气让男友购买了整整5斤,结果却因此遭遇了严重的过敏反应
2025-01-05 19:16:00
全球首个人工智能机器植入系统落地博鳌乐城
南海网1月5日消息(记者 苏桂除)近日,国内顶尖的耳鼻喉科专家齐聚博鳌乐城国际医疗旅游先行区内的博鳌超级医院,通过该院引进的全球首个人工智能机器植入系统
2025-01-05 17:39:00
中建海龙打造可持续发展的城市新地标,福城南产业片区项目取得突
近日,深圳市龙华区福城南产业片区12-16宗地和12-19宗地项目成功突破“正负零”正式进入地上主体结构施工阶段。自底板浇筑到地下室结构封顶仅用了33天的时间
2025-01-05 13:39:00
你期待谁!蛇年央视春晚第一次联排:岳云鹏、孙越、张艺兴现身
快科技1月5日消息,据国内媒体报道,今日,2025年央视蛇年春晚首次联排,岳云鹏、孙越、张艺兴、刘宇宁、蒋欣、白鹿、金晨等多位明星现身央视大楼参与彩排
2025-01-05 13:46:00