• 我的订阅
  • 头条热搜
不仅开源还便宜好用,硅谷员工直呼“火烧屁股”的DeepS...
...20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员,推出了一项针对性...……更多
中国科技创新“乘”数直上
...15家厂商的模型产品已经通过备案。凭借语言理解、逻辑推理、知识问答、文本生成等通用能力,这些大语言模型产品一经推出,便受到用户的欢迎。“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”这是写进...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
...友对 Gemini 1.5 Pro (0801) 的内容提取能力、代码生成能力、推理能力等进行了测试,我们来看下他的测试结果。 来源:https://x.com/omarsar0/status/1819162249593840110首先,Gemini 1.5 Pro (0801) 的图像信息……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...的任务对应套件,包含总结、感知(回忆、跟踪)、视觉推理(空间、时间、预测、因果、反事实)和导航(房间到房间、对象检索)任务,共18个子任务。其中,总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...比的G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...而且,我们现在所说的 Scaling Law 更多是指训练阶段,而推理阶段的 Scaling Law 还未被充分挖掘,借助测试时间计算等方法,大模型的能力还能更上一层楼。还有人指出,其实,在文本以外的领域,Scaling Law 的踪迹正在逐渐显现,...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
GPT-4就是冲着赚钱来的!
...GPT-4的预期可能更高。“GPT-4目前可以说是具备了基本的推理能力和逻辑能力。但是应该还不能处理复杂问题,或者我们不知道怎么给prompt(提示词)。所以现在还只是一个知识特别丰富,但是只有基本推理逻辑能力的AI。”Liu Li...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展律(Post-Training Scaling Laws) 已经出现,并可能引发社区对于算力分配、后训练能力的重新思...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...验结果发现,Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律,以及各种概念的合理运动。在微调阶段,研究人员精选了一部分视频,对模型在美学、运动质量方面完成...……更多
掰开安卓手机 满屏都是三个字:大模型
...的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。另外,在手机上跑大模型,也给电池带来了更大的压力。因此芯片能耗...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届
...是独一无二的,每个问题也是独一无二的。如何让LLM通过推理解决复杂的看不见的问题? Self-Discover最新论文证明了,模型可以从一般问题解决技术的集合中,组成特定用于任务的推理策略。最新算法在GPT-4和PaLm 2-L上的性能比Co...……更多
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
...开始,作者提到前人研究已经表明,大语言模型(LLM)的推理可以在1.58-bit精度下进行,且不会有任何性能损失。比如下面这篇论文,有人引入了1-bit的LLM变体(即BitNet b1.58),其中LLM的每个参数或权重都是三元的{-1, 0, 1}。它在...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...常有限…… 无法理解物理世界,没有持续性记忆,不能推理(只要推理的定义是合理的)、不能规划。」Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...共享训练数据、收集数据的方式、训练软件、模型权重、推理代码等等。其中,最重要的是训练数据可能存在隐私和版权问题。OSI 自去年以来一直致力于为「开源 AI」给出一个确切的定义,很有可能会在未来几周内发布早期草...……更多
苹果发布mm1.5-ui模型
...从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。参考论文可知,...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...er模型取得了比扩散模型更好的结果,只有900M参数,但在推理时间上比StableDiffusion1.4版本快3倍,比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比:文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...微调,(4) LLM 的上下文扩展,以及 (5) 长监督微调。对于推理,MM-SP 解决了 KV 缓存内存使用率的挑战, 这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数,实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台409...……更多
更多关于财经的资讯:
安徽节后居民生活必需品价格稳中趋降
中安在线、中安新闻客户端讯记者2月13日从安徽省发展改革委价格监测局了解到,据省发展改革委价格监测显示,节后我省居民生活必需品价格稳中趋降
2025-02-14 02:15:00
伟创电气获得实用新型专利授权:“一种温度监测稳定供电电源电路”
证券之星消息,根据天眼查APP数据显示伟创电气(688698)新获得一项实用新型专利授权,专利名为“一种温度监测稳定供电电源电路”
2025-02-14 02:15:00
开工大吉!贵州中航电梯向年生产4000台电梯目标发起冲刺
2月13日上午,贵州中航电梯有限责任公司(以下简称“中航电梯”)举行2025年开工仪式。开工仪式现场2024年,中航电梯全年完成电梯出货3021台
2025-02-14 03:30:00
贵州阳光产权交易所助推地方金融企业资产处置成效显著
记者2月12日从贵州阳光产权交易所获悉,作为贵州省财政厅选定的地方金融企业国有资产交易平台,自2020年以来,交易所累计挂牌金融企业资产1600余宗
2025-02-14 03:30:00
西诺稀贵:65,706,770股股票将于2025年2月17日解除限售
2025年2月14日,西安诺博尔稀贵金属材料股份有限公司(简称“西诺稀贵”)发布股票解除限售公告。本次股票解除限售数量总额为 65
2025-02-14 04:00:00
德泰燃气:控股子公司中标燃气特许经营项目
2025年2月14日,大连德泰港华燃气股份有限公司(德泰燃气)控股子公司大连德港融燃气有限公司,于 2025 年 2 月 10 日取得大连金普新区东北特钢燃气特许经营项目的中标通知书
2025-02-14 04:01:00
浏阳河:拟注销分公司、子公司
2025年2月14日,浏阳河集团股份有限公司发布公告称,于 2025 年 2 月 10 日召开第四届董事会第九次会议,审议通过了《关于注销分公司
2025-02-14 04:02:00
诚进科技:收到全国股转公司出具的《关于同意广东诚进科技股份有限公司股票定向发行的函》
2025年2月14日,广东诚进科技股份有限公司于 2024 年 12 月 31 日向全国中小企业股份转让系统有限责任公司报送股票定向发行申请文件
2025-02-14 04:02:00
厚利春:预计2025年关联交易金额为4,400,000元
2025年2月14日,苏州厚利春塑胶工业股份有限公司发布关于预计 2025 年日常性关联交易的公告。公司预计 2025 年关联交易金额为 4
2025-02-14 04:03:00
沃迪智能:2025年第一次临时股东大会审议通过了多个议案
2025年2月14日,2025 年 2 月 12 日,上海沃迪智能装备股份有限公司在上海市亭卫公路 5899 号 10 号会议室召开 2025 年第一次临时股东大会
2025-02-14 04:03:00
时代股份:2025年第一次临时股东大会审议通过了《提供担保暨关联交易》议案
2025年2月14日,张家口时代橡胶制品股份有限公司的 2025 年第一次临时股东大会于 2025 年 2 月 12 日在公司会议室召开
2025-02-14 04:34:00
网高科技:信息披露义务人周红持股变动
2025年2月14日,2025 年 2 月 12 日,北京网高科技股份有限公司发布关于股东持股情况变动的提示性公告。信息披露义务人周红通过竞价交易方式
2025-02-14 04:37:00
北京天衡药物研究院有限公司申请II类会议
金融界2月14日消息,据CDE官网沟通交流公示,于2月14日收到北京天衡药物研究院有限公司申请的“II类会议”,当前状态“处理中”
2025-02-14 05:10:00
特朗普加征钢铁25%关税,中国7年前的布局,此时此刻显了效
特朗普加征钢、铝进口关税,美国政府尽情表演。境内外资本受益,三亿美国人民哭着埋单。作为重点打击对象,中国却云淡风轻——早在七年前
2025-02-14 05:27:00
安泰得:通过向银行申请借款的议案
2025年2月14日,昆明安泰得软件股份有限公司第四届董事会第十九次会议于 2025 年 2 月 8 日在昆明昌源北路 1389 号孵化器办公楼 A 座 14 楼公司汇报厅以现场方式召开
2025-02-14 06:22:00