• 我的订阅
  • 头条热搜
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、...……更多
大模型“翻车”小学题?
...相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
70倍极致压缩!大模型的检查点再多也不怕
...压缩目前已有的模型压缩相关的工作一般只关注于模型的推理性能,或者是模型最终存储检查点的大小,而不关注模型在整个训练过程中对储存空间的开销。因而已有工作只对权重进行压缩,而忽略了 Adam 等常见优化器中实际上...……更多
高通骁龙:端侧AI 启幕移动智能“芯”时代
...与能效飞跃,搭载了史上最快的高通Hexagon NPU,比上一代推理速度快98%,每瓦特性能提升40%,支持大模型参数规格从年初的10亿量级暴增10倍至100亿,可以以20个Token/s的速度进行AI大模型的生成。高通传感器中枢也引入了下一代微...……更多
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
...教育大模型的快速迭代,摩尔线程、师者AI还将在大模型推理上开展适配工作。摩尔线程夸娥方案是业内首个跑通、跑完国产大模型的千卡集群,基于全功能MTT S4000 GPU,提供软硬一体化的全栈解决方案,具备模型覆盖、推理加速...……更多
智谱AI总裁王绍兰:大模型技术进步的陡峭曲线没有放缓迹象
...在�N腾、神威超算、海光DCU架构上进行大规模预训练和推理,当前已支持�N腾、神威超算、海光DCU等十余种国产硬件生态。NBD:国内不少生成式AI企业都在布局出海,智谱AI在国际化方面有何布局?王绍兰:我认为国际化方面的...……更多
麻省理工学院联合metaai开发streamingllm框架
...学院联合MetaAI的研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的研究重点,是想解决实现...……更多
机器学习和人工智能在各行各业掀起了新的变革浪潮
...:共同追踪(co-tracking)、共同记忆(co-memorizing)和共同推理(co-reasoning),每个模块都在增强“智能体”的协作和学习能力方面发挥着至关重要的作用。共同追踪:“智能体”进行合作演练,对各种训练任务的“程序轨迹”进...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。有业内人士对记者表示:“在大模型端侧化部署之前,手机厂商就已经在产品上加入了AI语音助手,但消...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...型的“专业教材〞,供大模型训练学习,也能让大模型在推理中随时“翻阅”。这些“专业教材〞,是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例,蚂蚁即将发布的“百灵医疗领域大模型”,背...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,未来大模型...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
四月AI芯片三连发,英伟达:无惧竞争!
...接竞争。在AI模型算力中,Gaudi3AI芯片的模型训练速度、推理速度都更出色,分别提升了40%和50%,平均性能提升达到了50%,能效更是提高了40%。更重要的是,Gaudi3AI芯片的成本比H100更低,妥妥的性能更强,价格更低。▲IntelGaudi3VSN...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...然而,遥感单幅影像幅宽大、基础模型参数规模大,导致推理速度与应用场景较为受限。近日,中国科学院空天信息创新研究院(空天院)科研团队基于自主研制的遥感智能解译基础模型,联合国内相关研发机构,共同研发出“...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...据分布与质量、更强训练算法,文心大模型在理解、逻辑推理层面再次跃升。可以说,更强大文心大模型为文心快码的又一次「变身」提供了理论上的可能和坚实基础。 在此之外,文心快码在高质量训练数据集、专家参与的知...……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小模型,比如改进训练方法或使用适配器。该领域的一项主要技术被称为量化(quantization)。ML工程师Maarten Grootendorst撰...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
当AI大模型卷向服务机器人,会有哪些新故事?|硬氪分析
...莫拉维克悖论提出,和传统假设不同,计算机要实现例如推理等人类所具备的高阶智慧、仅需少量的计算能力,而若要直觉、感知等能力,却需要巨大的运算能力。 简单来说,电脑可以在和人类围棋对弈中轻松取胜,但如果让...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...00亿、1750亿模型也将在更复杂的场景中以更丰富的知识和推理能力为用户带来更专业的智能体验。周围认为,优秀的自研大模型需要具备“大而全、算法强、真安全、自进化、广开源”5大特质,具体表现为数据规模和模型参数...……更多
苹果将推出全新ai培训课程
...Apple设备上构建、训练、部署机器学习模型学习AI技术和框架基础介绍CoreML及其如何在Apple设备上实现高性能表现如何从零开始构建和培训AI模型等学生将从引导式课程和基于项目的作业中学习,并得到数百名导师和全球12000余名...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
全面透视豆包:功能、版本、价格、优势、应用
...果。它支持较大的上下文窗口(包括 4k、32k、128k)进行推理和精调,能更好地理解和处理长文本。 豆包通用模型lite:拥有极致的响应速度和较好的性价比,为不同场景提供了更灵活的选择。它也支持不同长度的上下文窗口(...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...、视觉数据的准确标注、分布式训练集群的工程化,以及推理成本的管控。▲来自 inf2.xl 实例上部署的 Stable Diffusion 模型这些经验为参与者提供了关于有效管理视频数据、提高模型训练效果和性能、构建高效训练集群以及管理推...……更多
更多关于科技的资讯:
8月25日消息,墨将官方于今年2月预告旗下迅龙2全机械专业级手柄,该款手柄现已通过星闪认证,拥有2000Hz无线回报率
2024-08-26 00:28:00
最宏大的生物工程!白蚁用3800年 打造了2亿个3米高土丘
你可能还不知道,下图这种土丘是昆虫界最宏大的生物工程,因为一种白蚁用了数千年的时间,在一个片区足足建造了2亿个这种土丘
2024-08-26 00:28:00
NASA放弃了:波音飞船无法带回2名宇航员!再呆6个月吧
经过几个星期的争论,NASA最终痛苦地决定,多次氦气泄露、推进器失效让波音的星际线飞船已经没救了,不可能再将滞留国际空间站的两名宇航员威尔莫尔
2024-08-26 00:28:00
十七年前的拍照机皇——索尼爱立信k850i
说起现在的拍照机皇,那可以说是“群雄争霸”,包括小米14Ultra、vivoX100Pro+、OPPOFindX7Pro
2024-08-26 00:29:00
苹果开始对零售店员工进行ai培训
8月25日消息,今日,业内人士MarkGurman爆料,苹果已经开始对苹果零售店员工进行AppleIntelligence(以下简称“AI”)培训
2024-08-26 00:45:00
HKC猎鹰二代24.5英寸G25H3显示器正式发布
8月25日消息,HKC猎鹰二代24.5英寸G25H3显示器正式发布,定价1299元,首发1099元。据悉,新款显示器尺寸为24
2024-08-26 00:50:00
紫光同芯发布全球首颗安全芯片e450r
8月25日消息,紫光同芯发布了最新技术创新成果——全球首颗同时具有开放式硬件+软件架构的安全芯片E450R。据悉,开放式硬件架构具备开放式指令集
2024-08-26 00:52:00
寻找夏日饮品的爆款密码
近两年,中国快消品市场迎来反弹,饮品行业也越发热闹起来,从线上到线下,卷价格、卷营销、卷渠道,无论是入行多年的老炮儿,还是跨界的新势力
2024-08-26 00:58:00
mechenk1播放器开售,内置蓝牙5.3
8月25日消息,MECHENK1播放器目前已在京东开售,这款Hi-Fi播放器主打“定制海贝App、支持DSD解码”,IT之家整理价格信息如下
2024-08-26 01:02:00
腾龙全画幅变焦镜头z卡口版实拍谍照曝光
8月25日消息,腾龙在2022年8月推出了一款50-400mmF4.5-6.3DiIIIVCVXD全画幅变焦镜头,不过当时仅推出了索尼E卡口版
2024-08-26 01:16:00
创客和开发者suguitan制作了一个流浪猫监控器
8月25日消息,近年来出现了许多使用树莓派来帮助动物的项目,例如科学家们用树莓派监测熊群的数量,甚至还有人发布了使用树莓派制作宠物检测器的指南
2024-08-26 01:20:00
威迈尔发布全球首款“纯”视觉类人形机器人
8月25日消息,8月21日~25日,2024世界机器人大会在北京举行。威迈尔VMR在大会上发布首款类人形机器人VersaBot(威宝)
2024-08-26 01:20:00
市盈率预测34.39倍!每卖一台问界 华为车BU收费3.67万元
快科技8月26日消息,据国内媒体报道称,每卖一台问界,华为车BU“收费”3.67万元。根据银河证券发布的《关于赛力斯集团股份有限公司重大资产购买之独立财务顾问报告》
2024-08-26 01:28:00
vivox100s销量表现不俗,参数碾压全场
在智能手机这方面,发烧友跟普通用户,要求其实是不相同的,但有一点却很默契,就是喜欢直面屏,所以厂商们很懂事,如今发布的新产品
2024-08-26 01:34:00
手机通知栏的hd标志代表什么?有什么用处?
手机通知栏的HD标志代表什么意思?有什么用处?大家好,我们在使用手机的时候呢,大家一定会发现我们的手机左上角有一个HD的图标
2024-08-26 01:35:00