• 我的订阅
  • 头条热搜
大模型“翻车”小学题?
...相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能会受限。中国人民大学的研究表明,尽管RAG可以提升LLM的推理能力,但这种提升作用并不是...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
...能计算等;在AI服务器领域,联想从训练到训推一体再到推理的AI全场景都有完善的AI服务器产品矩阵。在设备之上,联想研发了在构筑智算中心时的关键模块——异构智算平台。同时,联想与国内外领先的AI算力生态企业广泛合...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...像描述性能。实验结果表明,PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色;用户偏好研究表明,PGv3模型在常见的设计应用中,如表情包(stickers)、海报和logo设计,具有超越人类的图形设计能力,还能够精确...……更多
...,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高...……更多
华尔街不买账英伟达GTC发布,黄仁勋讲不出新故事?|氪金·大事件
...英伟达提上日程,是市场预期之内的事情。首先在训练向推理过渡的背景下,客户开始考虑降本增效,英伟达不得不做得更精细,其中就包括通过芯片上下游环节的革新,提升整体性能及效率。黄仁勋在大会现场表示,这一系统...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
与ChatGPT“赛跑”!国产大模型170多天“赛”出“加速度”
...万元奖励”如今“联合特战队”半年内实现大模型训练和推理效率翻番这次科大讯飞全球1024开发者节,科大讯飞发布了与华为共同打造的“飞星一号”国产算力底座平台,平台也被市场视为足以对标英伟达A100的算力平台。“人...……更多
OpenAI升级o3-mini模型思维链:提升AI推理过程透明度
...更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。OpenAI在去年12月发布了推理模型o3,该系列包含两个模型,即o3和o3-mini,前者是高性能推理模型,后者是更小的精简版模型,在保持智能...……更多
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
...围绕人物表演、开源视频生成模型中性能最强的。在自研推理优化框架「SkyReels-Infer」的加持下,大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行,支持Context Parallel,CFG Parallel,和 VAE Parallel...……更多
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
...学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构,提升了推理吞吐量。近日,为了进一步加速该技术框架的应用与推广,月之暗面 Kimi 和清华大...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI计划在未来两周内发布“草莓”。当然,最终的日期也可能生变。需要指出的是,虽然“草莓”是C...……更多
科大讯飞申请口语评测专利,口语评测结果更准确
...对应的答题文本,结合答题文本和答题数据,通过配置的推理评分模型得到考生的推理评分;获取配置的定标模型,定标模型为基于定标考生的答题文本、定标考生的推理评分及专家评分预训练得到,定标考生为从参与本次口语...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...的任务对应套件,包含总结、感知(回忆、跟踪)、视觉推理(空间、时间、预测、因果、反事实)和导航(房间到房间、对象检索)任务,共18个子任务。其中,总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...enAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altman)在今天早上的直播活动,表示是为...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现,并有助于提升高性能计算应用的计算能力。英伟达预计,H200将在明年二季度开始发货,谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多
显卡可能没那么重要了 中国公司给硅谷好好上了一课
...的更新主要是 3 个方面的优化,分别是通信和显存优化、推理专家的负载均衡以及FP8 混合精度训练。各个部分怎么实现的咱也就不多说了,总体来说,大的整体结构没啥变化,更多的像是咱们搞基建的那一套传统艺能,把工程...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...和属性,如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现?机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法:图中心性(PageRank和度)、图退化(k-core分解)...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...MGSM(跨语言数学能力)提升 2.3%,而DROP(文本段落分析推理)则下降了 3%。但与此同时,杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据,早在去年6月,ChatGPT流量即已见顶,当月其网站与移动客户端的全球流量(PV)...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
清华团队开源大模型推理引擎“赤兔Chitu”:硬件成本削减50%
...授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多
深圳:“深目”AI模盒发布  “深目2.0”生态联盟成立
...自主可控的国产工艺,内含国产RISC-V核,支持大模型训练推理部署。依托自研芯片DeepEdge10 Max创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载10亿级SAM、百亿级Llama2等大模型运算,可广泛应用于AIoT边缘视频、移动机器人等...……更多
阿里AI三连发,连夺三项第一
7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM...……更多
利唐i人事:AI智能体员工驱动,实现HR管理效率新范式
...力资源的限制,实现更高效、更灵活地运作。基于DeepSeek推理模型的HR智能体员工,通过“全自主任务规划+企业级知识推理”,可精准地将复杂HR任务拆分为原子化操作,并借助API调用与数据自动执行,实现“输入需求-输出结...……更多
openai正式推出完整版o1推理模型
...“shipmas”活动的首日(12月6日),OpenAI正式推出了完整版o1推理模型。该模型是今年9月发布的有限预览版(代号“Strawberry”)的升级版。目前,完整版o1模型已向ChatGPTPlus和Teams用户开放,预计下周将扩展至Enterprise和Edu用户。OpenAI同.……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
手机市场深陷泥沼,厂商如何破冰?
...难以推动AI进一步发展,软硬件的高度协同是拓宽大模型边界的关键所在,想要实现场景体验的新突破,打通上下游无疑是AI发展的未来趋势。去年8月份开始,华为、小米、vivo等Top级手机厂商都带着各自的落地方案进军大模型领...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
更多关于社会的资讯:
乌山时评丨一条街的守护 一座城的暖意
十二月的福州,爱心涌动,温暖流转!福建师范大学旗山校区旁边的小吃街一位名叫张建武的煎饼摊主突患癌症的消息牵动着大家的心
2025-12-16 19:26:00
“福建家事速配”被指虚假宣传 全国多地加盟商维权
东南网12月15日讯(本网记者揭晓经)“招商时宣称年入数十万到百万不等,实际是辛苦经营半年仅收入30元。”近日,来自湖北武汉的网民张女士向《直通屏山 福建省委领导留言板》栏目反映
2025-12-16 17:49:00
姚明 带女儿出席晚宴,15岁姚沁蕾身高近2米,沉稳大方,一口流利英语为爸爸担任现场翻译。
2025-12-16 16:40:00
今年河北建设集团涉及189起被执行案 法定代表人接连10次被限高
证券之星消息,根据天眼查APP显示,近日公布了一则河北建设集团股份有限公司作为被告/被上诉人的开庭公告,详细内容如下:案号
2025-12-16 16:42:00
暖心一幕!孕晚期孕妇被困电梯,消防员“以背为梯”紧急救援。为消防员点赞!
2025-12-16 16:43:00
大皖新闻讯 “学习成绩上不去,是不是孩子智商不够?”“想挖掘娃的天赋,做个智商测试靠谱吗?”近年来,越来越多家长带着类似疑问走进医院的智力评估门诊
2025-12-16 16:44:00
百年创新・影像无界 纪念电视诞生一百周年系列活动 暨首届创新影像大会在京举办
12月16日,纪念电视诞生一百周年系列活动暨首届创新影像大会在北京天泰宾馆正式拉开帷幕。本次活动由中国电影电视技术学会
2025-12-16 16:34:00
石家庄市第五十五中学举行第六届科技节
河北新闻网讯 近日,石家庄市第五十五中学举行了第六届校园科技节,全体师生打造了一场兼具知识性与趣味性的科创盛宴。开幕式上
2025-12-16 16:11:00
枣庄供电一员工捐献造血干细胞 传递生命火种
鲁网12月15日讯一封感谢信,跨越上千里,寄给国网枣庄供电公司山亭供电中心员工王超超,感谢他捐献造血干细胞的义举。写信人是成功配对的受惠患者
2025-12-16 16:00:00
湖州求是教育集团总校长张海明:用二十年,把“求是系统”做成可复制的教育体系
在浙江民办教育圈,湖州求是教育集团是个特别的存在。它规模不小,口碑很好,但更让人好奇的是,它有一套自己的“操作系统”——“求是系统”
2025-12-16 14:03:00
中国消费者报西安讯(任军战 记者徐文智)12月12日,陕西省西安市灞桥区市场监管局组织各市场监管所、消保站和辖区消费维权服务站参加《消费维权法律法规精解与投诉处置实务》专题培训
2025-12-16 11:07:00
中国消费者报北京讯(记者桑雪骐)第二十七届哈尔滨冰雪大世界将于12月17日10时开园。同程旅行平台数据显示,截至12月15日上午9点
2025-12-16 11:07:00
北京通州:53家“市监暖驿”投入运行
近日,北京市通州区市场监管局专为网络配送员打造的53家“市监暖驿(通小暖)”全部投入运行。据悉,通小暖今年已为756名网约配送员提供了形式多样的服务,成为副中心新就业群体的暖心港
2025-12-16 11:07:00
中国消费者报北京讯(记者桑雪骐)12月12日,北京迎来初雪。由于恰逢周末,北京市民赏冰玩雪的氛围瞬间引燃至高点。同程旅行平台上
2025-12-16 11:07:00
中国消费者报重庆讯(宋卫涛 记者刘文新)重庆市大渡口区尚美型象理发店在未告知消费者的情况下关门停业,且拒绝退还未消费的美发服务费
2025-12-16 11:07:00