• 我的订阅
  • 头条热搜
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
3 月 15 日消息,Open-AI 刚刚公布了其大型语言模型的最新版本 ——GPT-4(API 候补申请点此)。GPT-4 可以更准确地解决你的难题多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈(当...……更多
...,目前已经有多个人工智能系统学会了欺骗,在棋牌游戏中表现尤为明显。许多人工智能都能熟练地使用“虚张声势的策略”。对此,研究人员不无担忧地评价说,通过“习得性欺骗”,一些人工智能已经“系统性地”学会了“...……更多
智商超过99.9%人类,ChatGPT到底有多聪明?
...表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。Roivainen采用第三版韦氏成人智力量表(the Wechsler adult intelligence scale, WAIS)对ChatGPT进行了...……更多
...下风,有着教育行业背景的讯飞星火大模型在一众大模型中表现抢眼,堪称“更会做题的大模型”。评测,还有很长的路要走评测作为对机器理解、处理、应用自然语言能力的一种评估和量化手段,是大模型领域技术水平和研究...……更多
chatgpt背后模型被证实具有人类心智
...的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上。”这是来自斯坦福大学的最新研究结论,一经发出就造成了学术圈的轰动:这一天终于猝不及防地来了。所谓心智理论,就是理解他人或自己心理状态的能力,包...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...的总体表现不错,但所有的语言模型都在复杂的推理任务中表现不佳,比如MATH、LSAT-AR、GK-physics和GK-Math,突出了这些模型在处理需要高级推理和解决问题技能的任务方面的局限性。观察到的处理复杂推理问题的困难为未来的研...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...中,GPT-4o 是闭源模型中的效果最佳的,CogVLM2 是开源模型中表现最佳的。一个很有趣的现象是加入了图片对 CogVLM2 来说有了明显的帮助(在困难模式下提升了 20.3%),而对于 GPT-4o 而言反而结果有下降。在中文测试中,也有相似...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这...……更多
...6月4日报道,以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。(全球大语言模型(LLM)情商...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...Copilot是目前最成熟的AI代码补全工具,ChatGPT在目前测试中表现出的代码生成能力相比于Copilot更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新GPT模型的AI代码辅助工具也有望在中短期内落地。3)图像生成领...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...1到10。如图6所示,AFM-on-device在与Gemma-7B和Mistral-7B的比较中表现出相当或更优的性能。而AFM-server则显著优于DBRX-Instruct和GPT-3.5,甚至与GPT-4不相上下。值得注意的是,使用LLM评分会存在一些限制和偏见,例如长度偏见。 数……更多
谷歌大模型推理范式,主要分为两个阶段
... 在更细分的测试中,自发现步骤在需要世界知识的任务中表现最好,在算法、自然语言理解上超过CoT。在处理问题的推理调用方面,自发现步骤需要的调用次数明显少于CoT+SelfConsistency,而且准确性更高。如果想要达到和自发现...……更多
...写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...学和工程努力之一。”在Gemini发布前夕,皮查伊曾在采访中表示,Gemini令人瞩目的一大原因是它从根本上是一个多模态模型,并称向AI的转变非常深刻,现在还处于早期阶段,前方充满了无限的机会:“当我们研发Gemini时,运用...……更多
大语言模型如何宣告心理学的死亡?
...的本质。但随着人工智能技术的飞速发展,特别是大语言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。AI不再只是技术进步的象征,它已经开始挑战我们对心理学——甚至是我们对智能本身——的传统理解。人工智能...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高质量的人工标注数据。这类数据的收集过程既耗...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...为“我要失业了!”3月15日凌晨,OpenAI正式发布多模态大模型GPT-4,它可以接受图像和文本输入。虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平,比如在法律考试中可以打败90%的人类。...……更多
...预见它的到来并来得及向全世界发出警报?随着大型语言模型,如ChatGPT的兴起,这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象,即人工智能模型以一种骤然...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶...……更多
谁在反对ChatGPT?
...lphabet的首席执行官桑达尔·皮查伊在最近的一档访谈节目中表示,尽管该AI行业的发展存在紧迫感,但不应让公司被竞争动态所席卷,AI开发商必须对此承担相应的后果。其次,早期的人工智能很容易模仿训练数据中的偏见,并...……更多
微软新版必应展现好斗姿态:称自己为人类
...没有预料到,这一人工智能会如此好斗。微软在官方博客中表示,必应搜索引擎的聊天机器人对某些类型问题的回答方式是“我们不希望的”。美联社一位记者与新版必应进行了长时间的对话。在聊天中,这个新的聊天机器人抱...……更多
ChatGPT张口就来的“病”应该怎么“治”?
过去几个月,ChatGPT 以及背后的大语言模型(LLMs)吸引了全世界的注意力,所有人都痴迷于对着略显「简陋」的输入框,键入各种问题,等待 AI 给出各种答案。ChatGPT 答案中知识的「深度」和「广度」令人们吃惊,但时不时地...……更多
什么是AGI?人工智能的未来
...GI ) 是人工智能(AI)的一种,【AGI】可以在广泛的认知任务中表现得与人类一样好甚至更好,与专为特定任务而设计的【狭义人工智能】不同。创建【AGI】是一些人工智能研究以及OpenAI、DeepMind和Anthropic等公司的主要目标。2020 年...……更多
本文转自:解放日报谷歌推“双子座” 号称最强AI模型安峥本报记者 安峥在美国人工智能(AI)初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后,美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座(Gemi...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现出了...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...新的LLM模型“miqu-1-70b”。用户发现该模型在常见LLM任务中表现出色,跑分接近GPT-4,其来源引发了众多猜测。 字节Coze国内版上线,30秒即可定制AI机器人2月1日,字节跳动正式上线国内版Coze,这是一款AI聊天机器人构建平台,能...……更多
openai公布gpt-4最新版本gpt-4模型
...的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...组织BigScience开发的Bloom得分最高。斯坦福研究团队在报告中表示:“主要基础模型提供商目前基本上没有遵守这些草案要求。他们很少披露有关其模型的数据、计算和部署以及模型本身的关键特征的足够信息。尤其是,他们不遵...……更多
6月24日,在某科技媒体发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o 以562分排名文科总分第一。国内产品中,豆包等三款国产AI考上文科一本线。字节跳动旗下的豆包拔得头筹,成绩是542.5分,其后依次是百度文心、百川智能...……更多
更多关于科技的资讯:
还在更换山寨电池?不要拿安全开玩笑!
你身边是否有不少人,手机还能用但续航不给力,于是选择更换电池继续使用的?这是一个好的解决方法,但是在更换电池方式上,大家有着不同的选择
2024-08-07 18:52:00
比原厂体验更好的盖世小鸡G8+游戏手柄来了
无论现在触屏交互体验有多方便,对于一些游戏玩家来说,他们依然钟情于游戏手柄的操控操控体验,而这些玩家们可以在已经正式打响的ChinaJoy2024找到一款称手的游戏装备了
2024-08-07 18:52:00
Nothing Phone (2a) Plus手机发布
今天,以颜值出众的网红手机品牌Nothing在海外发布了售价相对更低、定位中端的NothingPhone(2a)Plus手机
2024-08-07 18:53:00
谷歌Pixel 9系列手机渲染图曝光,这配色也太好看了吧!
谷歌,安卓的老父亲,每年也会推出新手机来适配自家的新系统,为了提升安卓系统在大屏设备以及折叠屏上的体验,也是推出了折叠屏手机
2024-08-07 18:53:00
最受Steam玩家欢迎:英伟达计划停产RTX 3060显卡
英伟达的60系显卡一般都是为主流消费者打造,虽然在性能上不能跟旗舰显卡相提并论,不过满足1080P分辨率还是绰绰有余,特别是现在有了像DLSS这样技术的加持
2024-08-07 18:54:00
9月新镜头扎堆发布?佳能与腾龙或都在憋大招
自佳能发布EOSR1和EOSR5MarkII两款全画幅专微相机后,影像市场进入了一段平淡期,不过近期有消息透露,9月份会是一波镜头新品的小高潮
2024-08-07 18:55:00
玩不起胶卷?但你一定买得起胶卷补光灯
在近日铭匠光学TTArtisan推出了一款便携式LED补光灯,它采用135胶卷外观,首发价低至29元,比一卷过期胶卷还便宜
2024-08-07 18:55:00
老铁马上要来了:三星Galaxy S24 FE上线自家网页
三星自从GalaxyNote7整大活后就一直推出FE也就是俗称的“老铁版”,在基本配置几乎保持不变的前提下以更加诱人的价格来吸引消费者前去购买
2024-08-07 18:55:00
新一代理财产品“电子茅台”,华为三折叠手机爆下月发布
市面上已有种种迹象表明,华为将会发布首款三折叠手机,而今天,数码博主@定焦数码疑似爆出,华为三折叠手机大概率会在下个月发布
2024-08-07 18:55:00
戴森OnTrac头戴式降噪耳机登陆中国市场
8月2日,戴森的新款OnTrac头戴式降噪耳机正式登陆亚洲市场,新耳机共有7种耳壳与7种耳罩配色,满足用户个性化的外形需求
2024-08-07 18:55:00
小米是屌丝机?雷军回应,自己倒霉的地方就是老跟苹果、华为比
小米手机早期因为性价比的优势,捕获了不少年轻消费者的芳心,但是也是因为价格便宜,秉持着高性价比的优势,在外观、做工等方面做了一些舍弃
2024-08-07 18:56:00
美光发布行业首款PCIe 6.0 SSD
估计大家还在使用PCIe4.0的SSD,部分发烧级玩家开始尝试PCIe5.0SSD,享受超过10GB/S的速度,不过对于存储厂商来说
2024-08-07 18:56:00
天猫精灵发布“哇哦闺蜜机”:4999元带来4K极致视听体验
天猫精灵相信大家已经十分地熟悉了,它从智能音箱一步步地进化到家庭的娱乐中枢,而现在购买天猫精灵的消费者对于生活品质有着更高的追求
2024-08-07 18:57:00
差旅平台选型参考:差旅预算管理智能化
近年来,大型制造业企业深圳市创世纪机械有限公司(以下简称“创世纪”)在快速发展的过程中,逐渐面临着传统财务管理的诸多挑战和痛点
2024-08-07 19:05:00
玩家热议:你想拥有哪个游戏角色的全部能力?
近日,Reddit用户CaydGaming在平台上发起了一场有趣的讨论,问题直击玩家心声:“如果你可以拥有一个游戏角色的所有能力
2024-08-07 19:10:00