• 我的订阅
  • 头条热搜
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
《流浪地球2》,这些科技离我们不远
...,缺乏真正的语言理解能力,仅能处理较为单一的问题,局限性非常大。郭涛预测,随着脑科学研究的深入以及人工智能、量子计算等相关技术的发展和成熟,真正能推理和解决问题的强人工智能和超人工智能可能出现,或将产...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...解决模型并行、数据并行等训练难题,提升AI大模型训练推理效率。应用:探索大模型知识融合新架构。构建异构知识库,支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架,支持文档类知识的高性能精...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...题任务,要求模型在代码执行后对结果进行理解、归纳和推理,提供有价值的观点。尽管 Tapilot-Crossing 已经是规模较大、且较为全面的测试集,其构建成本也低于 100 美元,显示了利用虚拟多智能体容器生成复杂、高质量数据集...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...拥有一个AI Agent。“如果说2024年是大模型落地应用之年,推理就会越来越重要。此前在训练芯片市场上,英伟达一骑绝尘,占有绝对的市场占有率,那么今天,推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选手”。如果和OpenAI做对比,OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多
李开复&张亚勤:未来的首富,将来自AI公司 | WISE2023商业之王大会
...所说的,模型越大能力越强,但是模型越大越贵,用起来推理成本也会太高。从我们建零一万物第一天就看得很清楚,怎么把手中的算力做好,把推理成本降下是最重要的。我们相信这是平台级的应用,相信像过去一样移动互联...……更多
当Sora能做真实的3D视频,离它能设计战舰也就不远了
...Gemini Advanced在第三方双盲测试中击败了GPT-4,拥有极强的推理能力和长期记忆。2月10日,OpenAI的CEO奥特曼欲将OpenAI、各路投资者、合同芯片制造商和电源供应商联系起来,筹集7万亿美元的资金,打造庞大的芯片制造厂网络,为Ope...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
...视频和图像的检测工作中。然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT相比其他检测方法需要更大的...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...果比较有限。因此该研究想要探明,在使用比较少的额外推理计算时,就能能让模型性能提升多少?他们设计了一组实验,使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法:(1)迭代自我修订:让模型多次尝试回答一个问...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新,以提高性能并降低成本。随着生产用例的出现,AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后,研究人员现在正在优先...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
...方案规划、目标拆解能力;判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力;道德中枢具有情感分析、道德法律能力;记忆中枢具有信息记忆能力。此外,360以安全大模型为“大脑”,构建出智能体框架,通过任务...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...据集和奖励模型打分机制,促进模型的快速迭代更新;在推理技术方面,京东采用了端到端低比特高精度量化技术,有效降低了模型体积,同时提升了推理性能,显存节约高达70%;在语音领域,言犀大模型通过迭代优化,实现了...……更多
从通用人工智能到科学智能,“AI爱因斯坦”还远吗?
...需要像AlphaGo Zero那样,从围棋本身出发,具备自我学习、推理和创新能力,这样才可以达到通用人工智能。要实现这一目标,一是需要结合快思考的“黑盒”预测和慢思考的“白盒”逻辑推理,打造“灰盒”可信大模型;二是融...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...型的“专业教材〞,供大模型训练学习,也能让大模型在推理中随时“翻阅”。这些“专业教材〞,是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例,蚂蚁即将发布的“百灵医疗领域大模型”,背...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...检索生成增强的技术方案,但大模型往往存在自我认知的局限性,因此清晰界定其能力边界十分关键。为了使基座模型在生产场景中发挥作用,通常需要将大模型作为一个智能体的核心中枢,将其与具体的外挂知识库工具结合、...……更多
能与人类谈判、游戏水平媲美真人,Meta 是如何构建新人工智能 CICERO 的?
...两个完全不同的人工智能研究领域并开发了新技术:战略推理(如 AlphaGo 和 Pluribus 等代理中使用的技术)和自然语言处理(如 GPT-3、BlenderBot 3、LaMDA 和 OPT-175B 等模型中使用的技术)。举个例子,CICERO 可以推断出,在游戏后期,...……更多
专家也不如AI了:GPT-4o道德推理能力已比专家更强
快科技6月24日消息,最新研究显示,人工智能在道德推理方面的能力可能已经超越了人类专家。美国北卡罗莱纳大学教堂山分校和艾伦AI研究所的研究人员开展的两项研究中,OpenAI的新型聊天机器人GPT-4o在提供道德建议方面,被...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...在成为通用智能体的强有力支持,被越来越多的用于多种推理和规划任务。然而,在解决问题时,需要的智能体通常是具有多个组件的复合智能体系统,而不是单片模型查询 。此外,为了使智能体能够解决复杂的现实世界任务...……更多
...系,取得了一定成果。但他们同时也指出,这一模型存在局限性,目前他们仅在没有瘫痪的志愿者身上做了试验,而且仅对12个单词做了测试,所以这个模型适用的范围可能还很有限,要实现对任意单词、完整语句乃至段落的理...……更多
AI智能体,构建智慧生活新图景
...使用的语言交流服务,AI智能体还能根据上下文进行智能推理和情感分析,并模仿人类行为进行相应的操作。比如,下达“帮我做一道菜”这项任务指令,“大模型厨师”只能输出一份食谱并指出需要哪些食材;“AI智能体厨师...……更多
更多关于科技的资讯:
日亏700万 日产汽车叫停本田合并
确定了,日产和本田一拍两散。从确认合体,到官宣“闪离”,只过去短短52天。这场合并,原本就被不少业内人士不看好,现实却也如他们预料那般
2025-02-16 14:53:00
直降4.3万!别克GL8陆上公务舱限时优惠:18.99万元起
快科技2月16日消息,上汽通用别克品牌宣布,别克GL8陆上公务舱限时优惠价为18.99万元起,相比官方指导价全系降低4
2025-02-16 14:53:00
节后多地机票节后低至一两折 上海飞三亚仅需199元
快科技2月16日消息,春节假期之后,多地机票价格明显回落,尤其是一些旅游城市机票回调幅度更大,适合错峰旅游。据报道,2月7日起至3月底
2025-02-16 14:53:00
中国电影的海外困境 藏在百亿《哪吒2》中
2023年,光线传媒董事长王长田预测《哪吒2》票房可能超70亿被群嘲时,谁也没有想到,他还是太保守了。2月13日晚,《哪吒2》票房冲破100亿元
2025-02-16 15:23:00
画面离谱!韩国多名空姐打开应急舱门还站机翼穿制服自拍 航司官方回应
快科技2月16日消息,据韩国JTBC电视台独家报道,近日,韩国廉价航空易斯达航空(Eastar Jet)多名空姐在清州机场站在机翼上身穿制服拍照
2025-02-16 15:23:00
男子利用15分钟内免停车费钻漏洞:逃费71次 少掏2500元停车费
快科技2月16日消息,不少停车场都有免费停车15分钟的政策,但有些司机却动起了歪心思,利用15分钟免费的规则钻停车场漏洞
2025-02-16 15:23:00
单张不到1毛钱!维达金盏花湿厕纸大促:35元到手6包
维达金盏花湿厕纸60片*6包(360片)日常售价52.9元,今日天猫百亿补贴直降至34.9元好价。单包折合5.82元、单张仅需0
2025-02-16 15:23:00
果粉再等等!新版AI Siri可能要到iOS 18.5了
快科技2月16日消息,据媒体报道,由于遇到“工程问题和软件错误”,苹果的新版AI Siri上线时间可能会推迟。此前有消息称
2025-02-16 15:53:00
旗舰机性能对决!三星S25 Ultra罕见碾压iPhone 16 Pro Max
快科技2月16日消息,在手机性能上,苹果iPhone凭借其A系列芯片一直占据优势地位,不过这一局面似乎正在发生变化,据YouTube频道PhoneBuff的最新测试结果显示
2025-02-16 15:53:00
零跑公布智驾计划:一季度实现城快/高架NAP全国覆盖
快科技2月16日消息,日前,零跑汽车公布了其智驾计划,宣布将在2025年一季度实现城快及高架NAP功能的全国覆盖。此外
2025-02-16 15:53:00
比芝麻还小!广州发现全球新物种“海珠微瓢虫”
快科技2月16日消息,据报道,广州海珠国家湿地公园举行的广东省“世界湿地日”暨红树林保护宣传活动上,正式发布了全球新物种——“海珠微瓢虫”
2025-02-16 15:53:00
北美首日票房超2200万 《哪吒2》距全球票房前10仅差不到3亿!即将超越《狮子王》
快科技2月16日消息,据灯塔专业版全球影史票房榜实时数据,《哪吒之魔童闹海》总票房(含点映、预售及海外票房)已超117
2025-02-16 15:53:00
HKC推出新款24.5寸电竞显示器:2K 300Hz屏首发1799元
快科技2月16日消息,HKC推出了一款2K 300Hz电竞显示器:ANT253PQ,首发1799元。新款主显示器的屏幕为一块24
2025-02-16 16:23:00
特斯拉Model Y发布OTA升级:激活车内毫米波雷达
快科技2月16日消息,特斯拉在北美地区发布了2025.2.6软件更新。此次更新主要针对2022年款及后续的Model Y车型
2025-02-16 16:23:00
日产业绩承压:计划削减中国50万辆产能
快科技2月16日消息,日产汽车为恢复业绩,公布了详细的结构改革计划,该计划包括在全球范围内削减产能。其中中国市场产能将减少50万辆
2025-02-16 16:53:00