• 我的订阅
  • 头条热搜
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...市场瞬息万变,需要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。加之大模型训练和推理过程需要大量的...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...闭源的商业模型会配套相应的工具链,包括训练工具链、推理工具链,这些工具链的性能要比开源的好,对于客户来说,训练就能省大概10~20%的硬件成本,推理的时候省得更多,业务规模越大,省得越多。第二层,看模型带来的...……更多
大模型卷向下半场:价格战之后如何成为真正“刚需”
...化手段,可以降低大模型成本,在工程上可以通过分布式推理的形式将底层算力使用得更好;另外,在混合调度方面,可以把不同负载作为混合调度,这样的成本也大幅下降。阿里云相关人士也对澎湃新闻记者表示,能够推出低...……更多
华为、百度、阿里云等发起“大模型基础设施高质量发展行动计划”
...备极致性能、高扩展性、数据韧性、可持续发展、新数据范式以及数据编织能力的新一代 AI 存储是通往 AI 数智时代的必由之路。黄涛还称,随着大模型的规模法则(Scaling Law)不断演进,无论是在进行 CKPT 的并行保存与加载、...……更多
苹果发布mm1.5-ui模型
...从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知,...……更多
华为全面启动鲲鹏昇腾原生开发
...现性能同步优化。昇腾原生开发方面,华为准备以CANN和推理引擎MindIE为基础,基于一套开发体系,面向算子、模型和应用三个开发场景,激发开发者的原生创新,IT之家总结如下。面向算子开发,我们进一步开放CANN,全面升级...……更多
硬件在人工智能基础教育中的角色: 机遇和挑战
...阶段也需要考虑硬件依赖,如何将模型部署在硬件上进行推理。整个流程充满了不确定性,使用难度较大。 因此,在实际应用中,经典流程可以简化为两部分,一部分是与模型相关的(蓝色)、另一部分是可以利用到模型的...……更多
荣耀MagicOS 8.0发布,定义新一代人机交互
...平台级AI使能的意图识别人机交互,定义智能终端交互新范式;平台级AI全面使能之下,魔法OS 8.0在智慧互联、流畅性能、隐私安全、科技美学四大领域实现体验进化。此外,荣耀正式在Magic6系列上发布自研70亿参数(以下简称7B...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
度小满CEO朱光:必须密切关注大模型在金融领域的发展
...供更多资料,例如银行流水记录。最近,我们尝试使用了推理大模型来处理这些上传的银行交易记录。该模型能够迅速发现并评估客户的风险状况。例如,模型可以识别出客户在过去几个月内疑似向高风险账户转账,表明其消费...……更多
...桌上的一堆玩具中抓出一个已经灭绝的动物,它能够经过推理和识别过程,从所认识的老虎、狮子、鸟等若干种动物中,成功地抓出已经灭绝的动物恐龙。这是过去的机器人不能做到的。过去你告诉机器人抓什么东西它能抓得到...……更多
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...到现实的迁移,这些研究内容涵盖了最先进的方法、基本范式和全面的数据集。此外,该综述还探讨了数字空间和物理世界中具身智能体面临的挑战,强调其在动态数字和物理环境中主动交互的重要性。最后,该综述总结了具身...……更多
“秦岭・翱翔”流体力学大模型正式发布
...典理论和人工智能方法,构造数学物理关联特征、开展多范式一体化建模、搭建不变性可实现性多模态统一框架。同时,在模型算法设计、混合精度加速,以及数值求解耦合并行优化等方面进行了创新与验证,实现了高置信度流...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
...对外服务,豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens,较行业降幅分别达99.3%、95.8%,推动大模型从“以分计价”进入到了“以厘计价”阶段,并声称已经击穿了大模型行业的...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
...大模型来做判断,基础设施是至关重要的前置条件。二是推理平台帮助企业把大模型技术快速应用到场景中。对于一个企业来说,构建大模型的基础能力不仅是算力GPU,同时也会面临高质量数据如何寻找,如何高速进行数据标注...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
...习能力o1。算法领域不断有人创造新算法实现突破,方法范式的转移尤其值得思考。过去几个月,国内一些公司和初创企业在o1这条道路上取得良好进展。其算法突破思路在于,此前大家关注的GPT系列主要是预训练,预测“下一...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试...……更多
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是在编码和数学测试中。...……更多
...约每18个月时间会增长40倍。现在生成式大模型的计算和推理都在云端进行,大模型参数和使用量的成倍增长带来巨大计算推理压力, 当数十亿用户都日常使用生成式AI时,云端模式显然难以支持生成式AI的规模化扩展。过大参数...……更多
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
...上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。但细心网友不难发现,即便是Grok-2,在其他方面与前沿模型GPT-4o或Claude ...……更多
AI手机看荣耀:荣耀MagicOS 9.0发布 开启手机自动驾驶新时代
...开放服务构建的AI新生态,树立了智能体时代下AI OS的新范式。荣耀终端有限公司 CEO 赵明表示,MagicOS诞生之初,就确立了打造属于未来的操作系统,构建AI OS的定位。从 2016 年12月荣耀首发 Magic Live 智慧引擎,到 2022年1月MagicOS 7....……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
更多关于科技的资讯:
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00