• 我的订阅
  • 头条热搜
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...actor-judge的互动中再引入meta-judge,且由同一个模型「分饰三角」,不需要额外人类数据的参与。其中,actor负责对给定提示生成响应;judge负责为自己的响应进行评价和打分;而meta-judge会对自己的打分质量进行对比。最终的优化...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进化」的流...……更多
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
让 LLM 在自我进化时也能保持对齐。我们这个世界是不断变化的开放世界。人工智能要在这个世界长久立足,就需要突破许多限制,包括可用数据和规模和质量以及有用新信息的增长率。对基于 LLM 的 AI 来说,高质量的人类数据...……更多
扩散模型=进化算法!生物学大佬用数学揭示本质
【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。扩散模型居然就是生物的进化算法!这个结论来自「新常春藤」塔夫茨大学(Tufts University)于...……更多
...模型在思考、反思、探索等方面的能力。AI模型未来如何进化在2025年美国消费电子展上,美国英伟达公司高管为AI的进化勾画了一条路线图:以智能水平为纵轴、以计算量为横轴,衡量AI模型的“规模定律”呈现从“预训练扩展...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...步研发了智能体(Agent)机制,包括理解、规划、反思和进化,使其能够可靠执行、自我进化,并一定程度上将思考过程白盒化,让大模型像人一样思考和行动,调用工具自主完成复杂任务,在环境中持续学习实现自主进化。 ...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...计算机学院攻读博士二年级,研究方向为强化学习、扩散模型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与...……更多
百图生科高亮:AI大模型或改写生命科学领域的研发技术能力
...改写生命科学领域的研发技术能力。“大模型可以从所有进化知识中学习可能性和收敛规律,跳出局部最优,快速迭代演化,从而拥有高效的全新蛋白设计能力。”此外,高亮认为,若要做好生物计算大模型引擎,须有三大模块...……更多
...。但正如电池行业的铁律:成本、性能与安全是不可能之三角,电池厂商往往需要做出取舍,才有机会在风云诡谲的产业中立足。高阶智能驾驶也面临同样困境:高质量、低成本与大规模,几乎不可兼得。目前,市面上城区智驾...……更多
宁波银行南京分行:智慧进化 提升转型发展“科技亮色”
...效竞赛一等奖”“南京市财贸系统工人先锋号”“2022长三角数字化创新案例”等荣誉。驭“数”前行,是激发内生动能、推动机制迭代的绝佳路径。宁波银行南京分行逐步完善以大数据经营为重点的经营机制,To B端针对产业链...……更多
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
...无4-圈问题上获得了比传统方法更佳的解。「许多边没有三角形」问题问题引入现在让我们来设想这样一个问题:在一个n个顶点的图中,如果没有任何三个边形成三角形,那么它最多可以有多少条边?第一步,我们可以提出一些...……更多
文心大模型赋能千行百业,自主进化
...这四大能力也为通用人工智能的实现带来了曙光。 自主进化时代周报:百度文心大模型的技术迭代过程及最新进化程度如何?吴昊:2019年,百度推出了文心大模型1.0,然后持续演进到2.0、3.0版本,今年5月份升级到3.5版本。文...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
千行百业加速拥抱大模型(AI前沿观察)
...北超级智算中心等陆续投入运营。今年以来,中国联通长三角(芜湖)智算中心、河北石家庄智算中心等相继启动建设。 当前,各地加速推动算力基础设施建设,提升算力供给能力。《北京市促进通用人工智能创新发展的若干...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...不再局限于简单的指令执行,更可实现场景共建,构建起可进化的智能生态——数据驱动模型迭代,同时结合故障诊断与环境感知实现更智慧的交互和服务。未来,思必驰将持续深化“感知-思考-决策-执行”的技术闭环,让天琴语音助...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...让AI真正可用好用,才是终章。参考文献:《透过ChatGPT的进化足迹,OpenAI传达了哪些信号?》,脑极体《百度类ChatGPT产品将在3月完成内测 业内人士:谨慎乐观》,财联社《ChatGPT爆火,揭秘AI大模型背后的高性能计算网络》,Inf...……更多
“百模大战”下半场:野蛮生长后,如何避免重复“造轮子”?
...多领域表现出了让人惊艳的创作能力,并且每天都在快速进化。业内专家认为,这一技术带来的产业红利才刚刚初露峥嵘,AIGC与数字经济、实体经济的深度融合,还将创造出更多颠覆性的社会价值、经济价值,有望开启一场关...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...杂性是我们的意识和智慧的来源。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着...……更多
...位生产效率。规模化商用指日可待证券时报记者:大模型进化到目前的水平,哪些方面让您觉得惊艳?哪些方面表现平平?潘青华:应该说大模型进化到现在,虽然表现得不够完美,但已经足够让人惊奇。我们注意到,大模型在...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...。具体来看,言犀大模型在语言模型的基础上,实现了自进化技术,通过构建偏好数据集和奖励模型打分机制,促进模型的快速迭代更新;在推理技术方面,京东采用了端到端低比特高精度量化技术,有效降低了模型体积,同时...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba(进化到了1.5版本,最大398B,MoE),以及NVIDIA的Hybrid Mamba2模型(8B)。不过世界上有那么多成功的Transformer大模型,而知识就包含在这些模型参数里。如果能够锁住知识,同...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...大量的AI原生应用。智能体机制包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和自我进化。“在一些复杂系统中,我们还可以让不同的智能体互动,相...……更多
百度文心大模型4.0技术进展
...百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。文心一言助力...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...僵化和脆弱,无法适应环境。他们从自然界的集体智慧、进化和涌现等原则中获取灵感,构建更灵活、反应灵敏的人工智能模型。Sakana来源于日语さかな,意为“鱼”。其背后的理念是“让一群鱼聚集在一起,从简单的规则中形...……更多
半年冒出近百家新公司,「具身智能」也有春天 | 36氪新风向
...分布上,以北京为代表的北方公司,理想派偏多;而以珠三角为代表的南方,现实派偏多。这与行业人员的出身背景、投资方的偏好有关。北方的项目大多孵化于高校(清华、北大、中科大、北航、北理工等等),从高校实验室...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...变得儒雅随和:开启Apple Intelligence后,苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈,不像其他家的AI那样动不动就是拒绝服务。与此同时,苹果自家大模型的报告也已出炉,披露了大量技术细节。报...……更多
...心集群建设,实现对大规模算力的集中部署。9月1日,长三角(芜湖)智算中心发布会召开,芜湖市政府与中国电信安徽公司就长三角(芜湖)智算中心建设运营工作签订合作协议;9月26日,芜湖集群(润六尺)智算中心1000P算...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
更多关于科技的资讯:
近日,极兔速递发布了2024年全年业绩报告,公司在全球市场实现规模与盈利双突破。财报显示,2024年,极兔在全球范围内累计处理包裹数量达到246
2025-03-12 19:09:00
年轻人不买账,短剧干脆免费了
图片为《好一个乖乖女》剧照出品 | 搜狐科技作者 | 张莹编辑 | 杨锦商业类畅销书作者克里斯・安德森,曾提出一种免费的经济理论
2025-03-12 19:17:00
“嗅觉经济”逆势爆发,国际大牌扎堆撒钱,国货欲靠东方美学破圈
期待一场“东方香调”的复兴。 全球美妆行业正经历寒冬,香水市场却逆势崛起,成了“嗅觉经济”核心赛道。艾媒咨询数据显示,2023年中国香水市场规模达207亿元
2025-03-12 20:09:00
近日,荣昌区税务局开展“2024年度个人所得税综合所得汇算清缴要点”直播活动,通过线上“零距离”互动,为纳税人解答政策疑问
2025-03-12 20:11:00
深度数科:以专业筑基,引领票据服务生态革新
在数字化转型浪潮席卷金融领域的当下,深度数科集团凭借其对票据业务的深刻理解与技术创新的双重驱动,持续巩固行业领军地位,为票据服务生态的升级注入专业力量
2025-03-12 20:14:00
吉利被“硅谷教父”皮埃罗赞誉为一家人工智能领域的公司
近日,一则来自外网的资讯显示,硅谷AI界的领航人物、硅谷人工智能研究院院长、斯坦福大学顶级AI学者、“硅谷教父”皮埃罗·斯加鲁菲(PieroScaruffi)在“AI在全球出行领域的变革研讨”活动中
2025-03-12 20:31:00
2025年2月28日-3月1日,由中国会展经济研究会指导,首都会展(集团)有限公司和31会议联合主办的第八届2025中国会展业数字化与创新大会(CEIDIC2025)将于北京北辰五洲皇冠国际酒店盛大开幕
2025-03-12 20:32:00
新年换机首选华硕a豆14 Air高颜值AI PC 国家补贴至高立减20%
新年临近,假期就在眼前啦!京东年货节也在火热进行中,想趁此机会入手一台新笔记本电脑的小伙伴们看过来,推荐种草这款华硕a豆14Air
2025-03-12 20:33:00
\
近日,硅谷AI领域的顶尖学者、硅谷人工智能研究院院长皮埃罗·斯加鲁菲(PieroScaruffi)在“AI重塑全球出行未来”研讨会上
2025-03-12 20:34:00
北京十大律师事务所精品推荐:实力与服务兼备的诉讼专家
在法律服务的众多领域中,诉讼业务以其复杂性和高难度著称。选择一家优秀的律师事务所,尤其是在涉及诉讼案件时,能够直接影响案件的最终结果
2025-03-12 20:37:00
首款原生鸿蒙正式版手机将发布,鸿蒙生态「朋友圈」如何走向正循环?
“原生鸿蒙正式版,就要来了!” 3月12日,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东语带激动地说
2025-03-12 23:05:00
谷子火了?从小红书烧起来的二次元“烫门”
你了解谷子吗?谷子,即轻度周边,例如徽章、立牌和卡牌等。不同于挂画和手办等高价格和高精度的重度周边,轻度周边更便于携带
2025-03-12 20:50:00
吉斯波尔酒业“昆全十一年”威士忌新品上市发布会圆满举行
3月11日上午,“时酿其华 岁成真味”半岛核心产区吉斯波尔酒业十四周年庆典暨“昆全十一年”威士忌新品发布会在烟台隆重举行
2025-03-12 21:02:00
海报新闻记者 孙杰 济南报道3月10日,京东电器城市旗舰店北园大街店举办项目启动仪式,该店位于济南市天桥区北园大街451号
2025-03-12 21:18:00
河北新闻网讯(刘晓丹、张耕朴)3月11日,雄安医疗大健康技术应用大赛场景打造对接会在深圳举办。会上,深圳安泰创新科技股份有限公司市场总监尹波表示,安泰利用异构汇集技术实现数据高效
2025-03-12 21:36:00