• 我的订阅
  • 头条热搜
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...然而,遥感单幅影像幅宽大、基础模型参数规模大,导致推理速度与应用场景较为受限。近日,中国科学院空天信息创新研究院(空天院)科研团队基于自主研制的遥感智能解译基础模型,联合国内相关研发机构,共同研发出“...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型,一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五,在为期12个...……更多
...的行业安全可信大模型,具备生成创作、多轮对话、逻辑推理等多项核心能力,通过海量通用数据与行业特有数据融合,更好的适应行业客户的业务需求,推动大模型在政企行业场景的精准落地。面向行业的安全可信行业专属大...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...实践困境,如何通过大模型Planning能力,理解Agent的能力边界,重塑生产力?代码能力是大模型的核心能力,通义灵码如何提升编程效率,并快速推动整个软件工程智能化的发展?在AIAgent探索与应用专题,来自58同城、快手、阅...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...比,苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升,并预计在Trainium 2上预训练模型时,效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic,宣布与AWS共同构建面向机器学习训练...……更多
...相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,...……更多
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
...示,零一万物正持续探索寻找大模型在各个场景下的能力边界。一方面需要考虑模型能力,以模型的强泛化性避免 AI 1.0 时代非标化、定制重、交付重的商业模式;另一方面则是要考虑推理成本,能够帮助企业客户核算 ROI,在不...……更多
张云泉:集中力量,促进国产AI大模型发展
...法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力,且算力成本占据整体开销的大头。可以说,算力成为支撑大模型发展的关键因素,也是科技竞争的战略高地。在大规模的前端产品落地后,算...……更多
...(词元)预测的多模态技术范式,释放其在大规模训练和推理上的潜力。据了解Emu3只基于下一个token预测,无需扩散模型或组合式方法,把图像、文本和视频编码为一个离散空间,在多模态混合序列上从头开始联合训练一个Transf...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...的企业数据后,需要考虑安全性和设定AI应用程序的功能边界。 对此亚马逊云科技推出了Amazon Bedrock Guardrails护栏功能,用于轻松定义应用程序的安全性,并实施负责任的AI检查。使用这个功能,你可以限制AI应用只在特定领域回...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...识探索图像数据与相关任务之间的联系,进而预测潜在的边界框和目标物体但其中只有正确的信息才值得保留。为此,该研究引入了视觉对比推理(Visual Contrastive Reasoning)模块。该模块首先使用图像编辑技术创建对比图像,这...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...得出正确答案?为了解决这一问题并推动多模态AI评估的边界,MMMU团队对MMMU基准在健壮性和问题难度上进行提升,新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接:https:...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...级智能的关键一步。它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数据,有自主学习和自我改进的能力等等。在草莓项目正式被曝光的前几天,OpenAI科学家Noam B...……更多
微软研究院推出orca2llm
...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...含四个主要任务:信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试,”企鹅卷轴”有以下几个优势:数据多样性:”企鹅卷轴”包含了各种真实场景下的长文本,如财务报告、法律文档、学术论文等,...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...环境,可支持超千卡规模、千亿参数级别的大模型训练和推理任务,旨在突破算力瓶颈,加速AI算力的国产化进程。国产千卡智算集群采用软硬件一体化的架构设计,提供低延迟、高吞吐、高可用的IB组网环境,支持GDR技术,使...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
面壁智能发布开源大模型eurux-8x22b
...大模型Eurux-8x22B,包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO,主打推理能力。官方测试中,Eurux-8x22B 在 LeetCode(180道LeetCode编程真题)与 TheoremQA(IT之家注:美国大学水准的STEM题目)测试上超越了 Llama3-70B……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小模型,比如改进训练方法或使用适配器。该领域的一项主要技术被称为量化(quantization)。ML工程师Maarten Grootendorst撰...……更多
更多关于财经的资讯:
浦发银行烟台招远支行开展“守住钱袋子 护好幸福家”宣传活动
胶东在线9月26日讯(通讯员 吕明柳)为普及城乡居民金融基础知识水平,提升金融消费者金融素养和风险防范能力,增强人民群众金融服务获得感
2025-09-28 05:00:00
中信银行烟台牟平支行 银警联动进校园 共筑青春“反诈墙”
胶东在线9月22日讯(通讯员 程子璇)近期,中信银行烟台牟平支行积极参与了当地人行与烟台职业学院联合开展的“全民反诈在行动”宣传活动
2025-09-28 05:00:00
视企业事为分内事,邮储银行临沂分行的普惠金融“答卷”
齐鲁晚报·齐鲁壹点 李其峰9月26日,山东亚泰新材料科技有限公司的生产车间内,机器轰鸣,一批重达200吨、即将销往东南亚的辊涂铝单板正在加紧生产
2025-09-27 09:43:00
边风炜:期待降波后能迎来慢牛行情
本周是国庆中秋假期前的交易周,缩量是常态,同时考虑融资成本等原因,一般假期前总有一些资金要兑现,调整或在所难免,但我们发现
2025-09-27 10:55:00
《大众证券报》读者俱乐部第九季炒股比赛冠军收益率达51.09%
在《大众证券报》读者俱乐部第九季炒股比赛中,冠军选手荐股涨幅达51.09%,亚军选手荐股涨幅达49.14%,季军选手荐股涨幅达48
2025-09-27 10:55:00
注入“金融活水”,守护“沂蒙夕阳红”! 临沂:做好养老金融大文章,打造银发经济新高地
齐鲁晚报·齐鲁壹点 张如意在老龄化浪潮席卷的当下,养老问题已成为全社会关注的焦点。在山东临沂,这个全省老年人口最多的城市
2025-09-27 11:25:00
哪吒汽车关联公司破产重整案有新进展
大皖新闻讯9月27日上午,合众新能源汽车股份有限公司管理人发布《合众新能源汽车股份有限公司关于重整投资人公开招募结果的公告》
2025-09-27 11:59:00
信息安全服务能力行业领先!贵州大数据集团通过两项CCRC信息安全服务二级认证
贵州大数据集团近日顺利通过中国网络安全审查认证和市场监管大数据中心(CCRC)评审,取得“信息安全服务-安全运维(二级)”“信息安全服务-安全风险识别(二级)”两项资质认证
2025-09-27 17:04:00
聚焦数贸会 | 贵阳一轶科技:“游戏+电商”新模式推动“黔货出山”
在第四届全球数字贸易博览会上,贵阳一轶科技集团有限公司携其创新项目《轶境家园》亮相,展示了一条以游戏为流量入口、以大数据运营为支撑的“黔货出海”新路径
2025-09-28 03:29:00
签约投资金额超450亿元项目!2025•青岛创投风投大会举办
齐鲁晚报·齐鲁壹点记者 尚青龙9月26日,2025·青岛创投风投大会在国际会议中心成功举办。本次大会首次从“创投风投盛会”升级为“金融行业盛会”
2025-09-27 17:46:00
可识别用户情绪的智能客服!数据宝SmartCare获上海AI竞赛权威认可
2025年第七届“智链未来 才聚浦东”浦东新区人工智能创新应用竞赛总决赛近日圆满落幕。数据宝凭借“SmartCare——基于大语言模型与多模态交互的下一代智能客服系统”项目脱颖而出
2025-09-27 17:05:00
拓普集团投资成立机器人部件公司
近日,宁波灵御机器人部件有限公司成立,法定代表人为邬好年,注册资本为5000万元,经营范围包含:人工智能硬件销售;电力电子元器件销售;电子元器件批发;电子元器件零售等。企查查股权
2025-09-26 14:36:00
三峡能源、盘古智能等在青岛成立海洋发展公司
近日,三峡(青岛)海洋发展有限公司成立,法定代表人为艾青,注册资本约1.49亿人民币,经营范围包括海洋服务、以自有资金从事投资活动
2025-09-26 14:36:00
宇树科技公布机器人多楼层复合导航专利
近日,杭州宇树科技股份有限公司“一种机器人多楼层复合导航方法和设备”专利公布。企查查专利摘要显示,本公开属于机器人导航技术领域
2025-09-26 14:36:00
民生银行烟台分行积极推广《传·信》微视频 助力港城信用文化建设
为深入普及征信知识,弘扬信用文化,民生银行烟台分行积极响应号召,大力推广中国人民银行山东省分行精心制作的《传·信》微视频
2025-09-26 14:45:00