• 我的订阅
  • 头条热搜
知乎 AI 革命:智能搜索与实时问答的融合
...生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个 \" 新鲜出炉 \" 的专业问题提供一个立等可取的答案,提问的用户就可以能为快,然后再等其它的专业答主陆续赶到,下场答题。 在灰度测试这个功能...……更多
全球几十种大模型评测,如何甄别可信度?
...为了设置统一的起跑线,开源模型采用模型发布方推荐的推理代码和运行环境。智源研究院智能评测组负责人杨熙告诉蓝鲸新闻,评测中,所有闭源大模型题目都是智源通过调用公开的API,以普通用户的角度来使用大模型,针对...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...I正在壮大。 能力一览11B和90B这两款模型,不仅支持图像推理场景,包括图表和图形在内的文档级理解、图像描述以及视觉定位任务,而且还能基于现有图表进行推理并快速给出回答。比如,你可以问「去年哪个月销售业绩最好...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起:吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华:大模型绝不仅仅是模型系统和算力,数据是非常重要...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...ps://github.com/facebookresearch/LayerSkip研究人员开源了层跳过的推理代码和微调检查点,包括Llama 3、Llama 2和Code Llama,这些模型已经通过层跳过训练方法进行了优化,显著提高了早期层退出的准确性,层跳过的推理实现可以提升1.7倍模.……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,...……更多
...认为,增强多模态能力,核心要借助大语言模型的认知、推理、决策能力。于是,此次360智慧生活决定将视觉感知能力与360智脑大语言模型相结合,并针对安防场景进行行业数据微调,推出视觉及多模态大模型——360智脑·视觉...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...绍下Hyung Won Chung,从公布的o1背后人员名单来看,他属于推理研究的基础贡献者。资料显示,他是MIT博士(方向为可再生能源和能源系统),去年2月加入OpenAI担任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
什么是AGI?人工智能的未来
...Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,GPT-4在多个方...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...型,MoE模型在相同成本下效果更优,在相同规模下训练/推理成本更低,而且容量大,可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。 一些应对方案包括:1)Scaling Law探索,设计基于中小模型簇的MoE Scaling ...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...规模较小,仅包含相当于分类任务的简单问题,缺乏语义推理和临床知识。如图1所示,现有的ImageCLF VQA-MED数据集仅包含「这张图像里主要异常是什么?」和「这张图片里看到了什么?」这两种完全相当于分类任务的问题。较小...……更多
更多关于科技的资讯:
2024获奖最多游戏排行榜出炉!《黑神话:悟空》仅排第五
快科技1月12日消息,2024年,哪款游戏才是真正的年度最佳游戏?每个人心中或许有不同的答案,各个平台机构的评选结果也都不同
2025-01-12 22:22:00
9800X3D溢价仍抢手至极!德国MindFactory每两分钟半就卖一颗
快科技1月12日消息,根据德国零售商MindFactory公布的数据,AMD锐龙7 9800X3D处理器的销量已从1月1日的8700颗增长到了1月11日早的14160颗
2025-01-12 22:52:00
GT 1030变RTX 5090!LSFG 3正式发布:解锁20倍帧生成
快科技1月12日消息,第三方付费工具Lossless Scaling Frame Generation(LSFG)发布了其3
2025-01-12 23:22:00
机械革命无界14N笔记本首销5999元:酷睿Ultra 5-228V
快科技1月12日消息,机械革命无界14N笔记本目前已经上架,首发5999元。据悉,机械革命无界14N采用英特尔酷睿Ultra 5-228V处理器
2025-01-13 00:22:00
海拔3500米起飞!我国首次在昆仑山完成无人机增雪作业实验
快科技1月13日消息,据报道,一架配备云降水探测与人工影响天气作业装备的中型无人机近日从昆仑山麓起飞,并成功实施人工增雪作业
2025-01-13 00:52:00
预审导航联动助力海上火箭发射技术专利布局
胶东在线1月8日讯(通讯员 刘伟)随着商业航天作为新质生产力代表写入政府工作报告,商业航天进入发展快车道。由鲁东大学牵头建设的山东省海上航天装备技术创新中心紧紧围绕我国经济与社会发展对海上火箭发射技术的战略需求
2025-01-13 03:03:00
本文转自:人民日报海外版中国科创闪耀美国“CES创新奖”——访美国消费者技术协会首席执行官夏皮罗《人民日报海外版》(2025年01月13日第 09 版)2025年美国拉斯维加斯消费电子展(CES)近日开幕
2025-01-13 04:41:00
本文转自:人民日报全国数据工作会议提出深入实施数字化转型工程《人民日报》(2025年01月13日第 02 版)本报北京1月12日电 (记者王云杉)记者从近日召开的全国数据工作会议获悉
2025-01-13 06:02:00
本文转自:人民日报《人民日报》(2025年01月13日第 14 版)本报北京1月12日电 (喻思南、高鸽)国产化“中农科·龙腾”饲料配方工业软件近日在北京发布
2025-01-13 06:05:00
本文转自:人民日报《人民日报》(2025年01月13日第 06 版)本报北京1月12日电 (记者李建广)近日,记者从京津冀产业协同暨先进制造业集群发展新闻发布会上获悉
2025-01-13 06:07:00
本文转自:人民日报北  湖展望未来,以科技创新引领新质生产力发展,建设现代化产业体系,我们有底气、有信心回望刚刚过去的2024年
2025-01-13 06:18:00
抖音粉丝破千万!周鸿祎准备送车:考虑仰望U8、享界S9、问界M9
快科技1月13日消息,日前,360集团创始人周鸿祎发布视频称,给粉丝送汽车的活动马上就要开始了。周鸿祎表示:“黄子韬前几天送车的活动已经做完了
2025-01-13 06:52:00
河南王守义十三香40周年厂庆:价值600多万华为手机送员工 每人一部
快科技1月13日消息,据媒体报道,近日河南驻马店王守义十三香迎来40周年厂庆,董事长花600多万给1000多名员工每人发一部华为Mate 60手机
2025-01-13 07:22:00
除夕车票明天开售!铁路12306提醒春运购票最最最重要的三件事
快科技1月13日消息,按照2025年春运购票日历,今天将开售除夕前一天(1月27日工作日)火车票,1月14日将开售除夕当天的火车票
2025-01-13 07:22:00
一年一度的科技盛会,CES2025堪称科技潮流“风向标”,全球顶尖科技企业汇聚于此,展示前沿、创新性的产品与技术,引领未来科技发展的走向
2025-01-13 07:46:00