• 我的订阅
  • 头条热搜
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
理想的智能驾驶,到底「City 不 City」?
...人过去的经验和习惯所形成的直觉;系统 2 则代表了思维推理能力,人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为,从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...和伟谁更高”,看似简单的两个问题,事实上对于产品的推理能力要求极高,首先文心一言需要搜集到问题相关的事实信息,同时要理解“共同点”“谁更高”的对比含义,并根据事实信息作出判断。相比目前一些生成式AI产品...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...型,MoE模型在相同成本下效果更优,在相同规模下训练/推理成本更低,而且容量大,可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。 一些应对方案包括:1)Scaling Law探索,设计基于中小模型簇的MoE Scaling ...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...地过程中也暴露出一系列问题,如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用,成为当前AI产业发展的重要课...……更多
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
...模型的精度,同时保持了线性注意力优越的并行计算与高推理速度。论文链接:https://arxiv.org/abs/2405.16605 代码链接:https://github.com/LeapLabTHU/MLLA 视频讲解:https://www.bilibili……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...含四个主要任务:信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试,”企鹅卷轴”有以下几个优势:数据多样性:”企鹅卷轴”包含了各种真实场景下的长文本,如财务报告、法律文档、学术论文等,...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...间了。相比之下更加「基础」的能力,如多模态大模型的推理,也可以在手机端侧进行:无论是拍数学题让 AI 解题,还是看一张外文菜单让 AI 帮忙点菜,都是几秒钟就能办到的事。这一系列技术的驱动力,都来自联发科上个星...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
第九届信也科技杯决赛举行,探索语音大模型鉴伪应用
...新大模型的识别技术,并且考虑了模型的实用性,尝试提高推理效率、减少模型推理耗时。信也科技副总裁、大数据及AI负责人陈磊表示:“选手们探索了多种语音鉴伪方案,为对抗假语音欺诈的应用提供了不少思路。例如,有些选手...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
“Sora”王炸,20篇研报带你走进人工智能(下载)
...智能原理本白皮书主要内容包括了:人工智能总论、逻辑推理人工智能和计算智能、神经网络人工智能和生物人工智能、数学人工智能和物理人工智能、信息主义人工智能。提出了智能作为一个科学概念的模型、原理与方法;智...……更多
华东师范大学的老师,上课已经用上了大模型
...的算力,还要有灵活组合、弹性扩展的能力,既能兼顾AI推理等新型负载,又要进一步强化传统的通用计算平台及应用。第二,软硬兼修的优化适配。随着大模型在教育领域的应用兴起,高校对AI平台提出了更高的要求。一方面...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
质量超越o1,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
...ble)(外循环):构建并结合多个模块来完成任务。 多步推理 (Multi-step Reasoning)(内循环):要求 LLM 逐步推理。 少样本学习 (Few-shot Learning)(内循环):从输入样本中添加一些高质量的示例演示。 模型选择 (Model SelectioN……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
“3D视频版Sora”来了!
...,用户可任意指定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成8个视图的各5帧视频,整个4D优化需要20-25分钟。该模型已在Hugging Face上开源,适用于游戏开发、视频编辑、虚拟现实(VR)等场景的应用,可免费用于...……更多
华人团队爆火instructblip抢跑看图聊天
...成员:InstructBLIP据介绍,InstructBLIP模型更擅长「看」、「推理」和「说」,即能够对复杂图像进行理解、推理、描述,还支持多轮对话等。比如,下图这一场景可能发生了什么?InstructBLIP推理出,可能飓风,或者恶劣的天气因素...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...的帮助性,无害性,可靠性,生成 / 检索文档的相关性,推理过程中每一步的可行性,以及生成文本的综合质量。Methodology:如何评判 表 1:LLM-as-a-judge 训练方法(1)微调:最近许多工作开始探索如何使用微调技术来训练一个...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%,多模态性能超越GPT-4V。同样在4月17日,昆仑万维还宣布,中国首个音乐SOTA(领域最佳水准)模型“天工SkyMusic”音乐大模型也正式开启...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
...思维链的模式,通过专家介入诱导它一步一步地进行思维推理。邬贺铨以度小满为例,称其选择金融大模型切入是一个很好的基础,是大模型跟行业大模型相结合的好机会。“当然,这里边有很大的创新要求,在金融上对可信度...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
更多关于科技的资讯:
齐鲁晚报·齐鲁壹点 闫丽君 邵舒琨1月26日,烟台市人民政府新闻办公室召开“一路山海·烟台购 2025烟台市惠民消费券”活动新闻发布会
2025-01-26 17:02:00
男子眼球内捉出4条蠕动线虫:左眼曾飞进去过一只苍蝇
1月26日消息,据媒体报道,浙江的杨先生到医院就诊,他感觉左眼里有虫子在钻。医生翻开病人上睑发现数条正在蠕动的白色寄生虫
2025-01-26 17:05:00
精心部署确保网络畅通,东营联通助力春晚圆满举行
近日,随着欢声笑语的弥漫,垦利区春节联欢晚会如期拉开帷幕。在这场文化盛宴的背后,东营联通垦利区分公司提前筹划、精心保障
2025-01-26 17:11:00
没用D加密:《忍者龙剑传2:黑之章》PC版发售日就被攻破
之前在Xbox直面会上,忍者龙剑传2复刻版《忍者龙剑传2 黑之章》正式公布。随后该作上架Steam并发售,售价298元
2025-01-26 17:36:00
大众网记者 张姝涵 兰帅 泰安报道岁末年初,让我们一起了解常见的非法金融活动手段,守住“钱袋子”,过好幸福年!(一)承诺高额回报
2025-01-26 18:03:00
2025国补增加手机数码 山东苏宁易购迎来年前换机高峰
鲁网1月26日讯1月23日,济南等地市家电手机数码国家补贴正式上线,国补指定卖场苏宁易购全面承接,12类家电单台国补至高2000元
2025-01-26 18:07:00
平安人寿聊城中支举办社区金融内推会宣讲会
为快速搭建平安人寿聊城中支社区金融管理层队伍,确保社区金融队伍高质量发展,平安人寿聊城中支于1月8日在聊城中支职场召开平安社区金融内推会
2025-01-26 18:14:00
潮声丨义乌“走播”,走出了啥?
“走播”主播 义乌市委宣传部供图“世界的义乌”,正在不知不觉间发生变化。眼下,随着新一轮国际贸易改革启动,义乌正在深化市场采购贸易改革
2025-01-26 18:45:00
运营商“二次号码”一键解绑已上线 覆盖150款互联网应用
中国消费者报北京讯(记者武晓莉)工业和信息化部近日通告2024年第四季度电信服务质量情况。数据显示,2024年线上办理业务量超九成
2025-01-26 19:12:00
周鸿祎宣布抽送100辆国产新能源车 车型网友决定!
周鸿祎送车一事今天迎来最新进展。1月26日中午,周鸿祎在个人微博宣布,将抽送100辆国产新能源汽车。周鸿祎在微博中表示
2025-01-26 19:36:00
美联航一波音787客机空中严重颠簸:6人受重伤
1月26日消息,海外媒体近日报道,本月24日,美联航一架从拉各斯飞往华盛顿的波音787客机在飞行途中发生严重颠簸事件,导致多名旅客及机组成员轻伤
2025-01-26 19:36:00
曝雷军亲自面谈高级别汽车研发人员 有时早上8点面试
小米能有今天的成就,在科技和汽车等领域全面开花,可以说离不开雷军对人才的成功招揽。据了解,在小米汽车业务上,雷军对于招聘工作更是亲力亲为
2025-01-26 19:06:00
京东快递深圳口岸自提点开业:香港用户下单后 口岸自提
快科技1月26日消息,据京东物流介绍,为方便香港市民购物,京东近期在港澳下调了运费门槛,香港消费者满188元即可享受免运费送货上门
2025-01-26 19:06:00
猜猜是谁:美国科技界亿万富豪1.39亿英镑买下伦敦白宫
快科技1月26日消息,近日,位于伦敦摄政公园内的“伦敦白宫”(The Holme)以1.39亿英镑(约合人民币12.6亿元)的价格售出
2025-01-26 19:06:00