• 我的订阅
  • 头条热搜
苹果AI新篇章:Siri迎来革新,与OpenAI构建合作
...何完成端侧的实时翻译能力;其次是高隐私,端侧的意图推理具备一定隐私属性,那么,(挑战在于)在端云协同之间如何完善安全保障措施;第三,如何平衡功耗和成本。“模型在端侧运行不需要那么大,那么遇到多种感知和...……更多
NPU IP累计出货超1亿颗!芯原股份一站式AI解决方案揭秘
...的IP更重要,一定要有比较好的PPA。因为端侧主要是要做推理,也要有一些浮点运算的能力,更关注的是低比特的量化及压缩能力。而在云端一定是高性能、非常高的TOPS,它要能够去做训练和推理。而且不光是单卡的训练推理,...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...强化、格式渲染的观测空间下运作,大语言模型的理解和推理能力能充分发挥作用吗?尤其是大语言模型的主要训练任务是文本补全、问答和对齐人类偏好,这一点值得思考。来自伊利诺伊大学香槟分校和亚马逊的研究人员选择...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...比,苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升,并预计在Trainium 2上预训练模型时,效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic,宣布与AWS共同构建面向机器学习训练...……更多
文心大模型赋能千行百业,自主进化
...型3.5相比3月份的版本,效果提升50%,训练速度提升2倍,推理速度提升30倍,文心大模型3.5还新增了插件机制,扩增了大模型的能力边界。10月17日,百度世界2023大会上,李彦宏宣布文心大模型4.0正式发布。文心大模型4.0是迄今为...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展,提升社会效率。...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...,MoE在训练过程通过门控模型实现“因材施教”,进而在推理过程实现专家模型之间的“博采众长”。 图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化,在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...据集而在零样本场景中表现不佳。 C3. 将大型语言模型的推理能力扩展到时空预测领域:时空数据的独特性质与大型语言模型中编码的知识之间存在显著差异。如何缩小这种差异,进而构建一个在广泛的城市任务中具有卓越泛化...……更多
国行版iPhone 16终于要升级AI了:曝苹果将与百度合作
...表示:“文心大模型4.0实现了全面升级,在理解、生成、推理、记忆等方面的性能都有了大幅提升。这四大核心能力构成了AI原生应用的基础,如今已释放出无限的创新机会。”在主题演讲中,李彦宏展示了由文心大模型4.0驱动...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...解决模型并行、数据并行等训练难题,提升AI大模型训练推理效率。应用:探索大模型知识融合新架构。构建异构知识库,支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架,支持文档类知识的高性能精...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI
...科技11月5日消息,近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示,正努力围绕自主研发的统一系统架构GPU、MUSA软件...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新,以提高性能并降低成本。随着生产用例的出现,AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后,研究人员现在正在优先...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...佳论文奖。大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时,LLM 通常依赖记住特...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
...阶段:训练和日常使用,后者用信息技术语言来说就是“推理”。萨莎·卢乔尼说道:“推理可能比训练带来的影响更大。一次使用可能并不需要很多计算,但时常更新就不一样了,例如人们熟知的谷歌翻译每天要更新数十亿次...……更多
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
谷歌推出aihypercomputer超级电脑架构
...型,承载学术实验及较短的训练任务,或进行蒸馏、离线推理及批量性的任务,计费标准主要基于AI任务所使用的GPU与TPU量。而Calendar模式则可替AI任务预留开始时间,适用于需要精确开始时间及模型训练持续时间的任务,计费标...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
... sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效果和生成速度上达到了现有最...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...mazon Nova Premier:亚马逊最强多模态大模型,可处理复杂的推理任务,也可用于蒸馏客户定制化的模型。在现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出,其在检索增强……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
苹果黑科技将彻底改变iPhone 已有重大进展
...已经攻克了其中的重要技术挑战,可以最大限度减少AI在推理过程中,对于闪存和内存的占用,从而将推理延迟降低了4-5倍。而且,如果将其运行在GPU上,那么加速效果将提升20-25倍。一旦实现,就可以让智能手机真正部署大语...……更多
更多关于科技的资讯:
整治代购哄抢!胖东来宣布部分热门自营商品改线上销售
快科技12月22日消息,日前,胖东来超市又公告新措施,将部分商品调整为线上销售。根据公告,因近期胖东来卖场客流量较大,部分商品出现持续哄抢现象
2024-12-22 09:32:00
比高利贷还离谱!男子网贷1000元3天内需还2000元
快科技12月22日消息,据报道,近日,佛山的黄先生因急用钱,下载了一款网贷App,没想到注册登录后查看了一下贷款额度,就被强制下款
2024-12-22 10:02:00
谷歌宣布将打击“标题党”、“封面党”视频
12月21日消息,谷歌在其YouTube印度博客网站中发文,宣布将打击平台长期以来存在的各种“标题党”、“封面党”视频
2024-12-22 10:39:00
技嘉b850aoruselite主板外观图公布,共有三款型号
12月20日消息,爆料者@momomo_us放出了技嘉正准备推出的B850主板外观图。目前已知的技嘉B850AORUSELITE主板共有三款型号
2024-12-22 10:49:00
《原神》5.3版本“炽烈的还魂诗”2025年1月1日上线
12月20日消息,米哈游今晚宣布,《原神》5.3版本“炽烈的还魂诗”将于2025年1月1日上线。新版本主要是带来了新角色玛薇卡
2024-12-22 10:57:00
小米13等6款机型今日起推送澎湃OS 2正式版:流畅度、稳定性大增
快科技12月22日消息,今日,小米澎湃OS官微发布最新升级计划,即日起,小米13等6款机型开始灰度,陆续推送澎湃OS 2正式版
2024-12-22 11:02:00
NVIDIA RTX 5090移动版用上16GB显存:性能最高提升60%!
快科技12月22日消息,据知名硬件泄露频道Moore's Law is Dead透露,RTX 5090和RTX 5080两款移动版显卡均将采用16GB GDDR7显存
2024-12-22 11:02:00
旅客扒高铁车门手被夹住遭拖行 官方通报!网友:当是印度啊
日前,一则旅客扒高铁车门手被夹住遭拖行的视频在社交平台上刷屏,引发关注。视频中,一辆高铁刚启动,一人被高铁的门夹到,导致被拖行
2024-12-22 11:02:00
回力秋冬男女棉鞋清仓处理手慢无 19.9元起
回力秋冬男女棉鞋,标价300.9元,今日清仓大处理,下单可领241元优惠券,叠加满减优惠,到手19.9元起。产品规格:多款式可挑
2024-12-22 11:02:00
加绒加厚!棉锦印象黑金护膝防风裤 到手29.9元
棉锦印象加绒加厚黑金护膝防风裤报价119.9元,今日限时可用90元优惠券,到手29.9元,包邮。产品规格:舒适弹力,加厚奥粒绒
2024-12-22 11:02:00
AI竟怂恿美国少年杀死自己父母 周鸿祎:人工智能安全问题不亚于核武器
快科技12月22日消息,今日,360集团创始人、董事长周鸿祎发布视频分享了一个极端案例,AI竟然怂恿一个美国少年杀死自己的爹妈
2024-12-22 11:32:00
积核Geekom将推三款“全球首款”迷你主机!高通、Intel、AMD都有
快科技12月22日消息,据媒体报道,迷你主机厂商积核Geekom将在CES 2025上展出三款“全球首款”迷你PC,分别搭载高通
2024-12-22 11:32:00
联力推出unifantl无线系列风扇,不需要集线器
12月21日消息,联力(LianLi)扩大无线信号控制产品阵容,最新推出了UNIFANTL无线系列风扇,不需要集线器,利用2
2024-12-22 11:37:00
“5G-A”黄山之巅引领“云端”漫步
本文转自:人民网-安徽频道人民网记者 韩震震 陈若天 陈曦工作人员在测试黄山上的5G-A基站信号。人民网记者 陈若天摄12月18日
2024-12-22 11:44:00
oppo宣布findx8手机实况照片也能编辑
12月20日消息,OPPO今日宣布FindX8系列手机哈苏水印上新,水印图像、文本、底色,都能自定义,Live实况照片水印也支持定制
2024-12-22 11:54:00