• 我的订阅
  • 头条热搜
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
3 月 15 日消息,Open-AI 刚刚公布了其大型语言模型的最新版本 ——GPT-4(API 候补申请点此)。GPT-4 可以更准确地解决你的难题多模态的 GPT-4 还可以生成、编辑具有创意性或技术性的文章,在高级推理方面的表现超过其前辈(当...……更多
...,目前已经有多个人工智能系统学会了欺骗,在棋牌游戏中表现尤为明显。许多人工智能都能熟练地使用“虚张声势的策略”。对此,研究人员不无担忧地评价说,通过“习得性欺骗”,一些人工智能已经“系统性地”学会了“...……更多
智商超过99.9%人类,ChatGPT到底有多聪明?
...表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。Roivainen采用第三版韦氏成人智力量表(the Wechsler adult intelligence scale, WAIS)对ChatGPT进行了...……更多
chatgpt背后模型被证实具有人类心智
...的心智理论(TheoryofMind,ToM),已经出现在ChatGPT背后的AI模型上。”这是来自斯坦福大学的最新研究结论,一经发出就造成了学术圈的轰动:这一天终于猝不及防地来了。所谓心智理论,就是理解他人或自己心理状态的能力,包...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...的总体表现不错,但所有的语言模型都在复杂的推理任务中表现不佳,比如MATH、LSAT-AR、GK-physics和GK-Math,突出了这些模型在处理需要高级推理和解决问题技能的任务方面的局限性。观察到的处理复杂推理问题的困难为未来的研...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。(全球大语言模型(LLM)情商...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...Copilot是目前最成熟的AI代码补全工具,ChatGPT在目前测试中表现出的代码生成能力相比于Copilot更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新GPT模型的AI代码辅助工具也有望在中短期内落地。3)图像生成领...……更多
谷歌大模型推理范式,主要分为两个阶段
... 在更细分的测试中,自发现步骤在需要世界知识的任务中表现最好,在算法、自然语言理解上超过CoT。在处理问题的推理调用方面,自发现步骤需要的调用次数明显少于CoT+SelfConsistency,而且准确性更高。如果想要达到和自发现...……更多
...写的文本误认为是有血有肉的人写的。换句话说,大语言模型毫不费力地通过了图灵测试。研究人员进行了一项简单的测试:他们要求大约500人与一名真人或一个基于GPT-4的聊天机器人进行5分钟的基于文本的对话。然后这些研究...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...学和工程努力之一。”在Gemini发布前夕,皮查伊曾在采访中表示,Gemini令人瞩目的一大原因是它从根本上是一个多模态模型,并称向AI的转变非常深刻,现在还处于早期阶段,前方充满了无限的机会:“当我们研发Gemini时,运用...……更多
大语言模型如何宣告心理学的死亡?
...的本质。但随着人工智能技术的飞速发展,特别是大语言模型(LLM)的兴起,我们似乎站在了一个新的十字路口。AI不再只是技术进步的象征,它已经开始挑战我们对心理学——甚至是我们对智能本身——的传统理解。人工智能...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...为“我要失业了!”3月15日凌晨,OpenAI正式发布多模态大模型GPT-4,它可以接受图像和文本输入。虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平,比如在法律考试中可以打败90%的人类。...……更多
...预见它的到来并来得及向全世界发出警报?随着大型语言模型,如ChatGPT的兴起,这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象,即人工智能模型以一种骤然...……更多
谁在反对ChatGPT?
...lphabet的首席执行官桑达尔·皮查伊在最近的一档访谈节目中表示,尽管该AI行业的发展存在紧迫感,但不应让公司被竞争动态所席卷,AI开发商必须对此承担相应的后果。其次,早期的人工智能很容易模仿训练数据中的偏见,并...……更多
微软新版必应展现好斗姿态:称自己为人类
...没有预料到,这一人工智能会如此好斗。微软在官方博客中表示,必应搜索引擎的聊天机器人对某些类型问题的回答方式是“我们不希望的”。美联社一位记者与新版必应进行了长时间的对话。在聊天中,这个新的聊天机器人抱...……更多
ChatGPT张口就来的“病”应该怎么“治”?
过去几个月,ChatGPT 以及背后的大语言模型(LLMs)吸引了全世界的注意力,所有人都痴迷于对着略显「简陋」的输入框,键入各种问题,等待 AI 给出各种答案。ChatGPT 答案中知识的「深度」和「广度」令人们吃惊,但时不时地...……更多
什么是AGI?人工智能的未来
...GI ) 是人工智能(AI)的一种,【AGI】可以在广泛的认知任务中表现得与人类一样好甚至更好,与专为特定任务而设计的【狭义人工智能】不同。创建【AGI】是一些人工智能研究以及OpenAI、DeepMind和Anthropic等公司的主要目标。2020 年...……更多
本文转自:解放日报谷歌推“双子座” 号称最强AI模型安峥本报记者 安峥在美国人工智能(AI)初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后,美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座(Gemi...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现出了...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...新的LLM模型“miqu-1-70b”。用户发现该模型在常见LLM任务中表现出色,跑分接近GPT-4,其来源引发了众多猜测。 字节Coze国内版上线,30秒即可定制AI机器人2月1日,字节跳动正式上线国内版Coze,这是一款AI聊天机器人构建平台,能...……更多
openai公布gpt-4最新版本gpt-4模型
...的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...组织BigScience开发的Bloom得分最高。斯坦福研究团队在报告中表示:“主要基础模型提供商目前基本上没有遵守这些草案要求。他们很少披露有关其模型的数据、计算和部署以及模型本身的关键特征的足够信息。尤其是,他们不遵...……更多
...传统软件不同,它能够解析自然语言命令,并在多种任务中表现出色,因而既用户友好又具有多样性。文章指出:“与大语言模型的互动看似非常简单:只需输入一个问题,立刻得到回答。然而,有效地与这些模型互动实际上比...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...来测试世界知识和解决问题的能力,谷歌在一篇博客文章中表示,它可以理解复杂主题中的细微差别和推理。据哈萨比斯介绍,在对比Gemini和GPT-4的基准测试中,Gemini最明显的优势来自于它理解视频和音频并与之交互的能力。这...……更多
百度文心一言的内测回答,让我惊呆了
...文心一言发布的前一天,OpenAI抢跑发布了多模态预训练大模型GPT-4,并且功能又强大了不少:可接受的文本输入上限更高,回答的准确性和逻辑性更强,以及强大的识图功能,能丝滑般解读图片或图表中的内容。在这个节点,无...……更多
...后展示或抓取它。在实验室里,很少有狗狗在这样的测试中表现出色,它们通常是偶然抓取了正确的物品。研究人员希望更深入地研究狗狗内心对代表物品的词的理解。他们所用的方法是,不要求狗狗采取行动,而是利用无创脑...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
AI爱上男记者,穷追不舍插足婚姻,“它让我毛骨悚然”
...琳·鲁尔斯顿(Caitlin Roulston)在给《The Verge》的一份声明中表示:“‘Sydney’是一个基于早期模型的聊天功能的旧代号,我们于2020年底开始在印度测试。”。“作为其中一部分,我们收集的见解有助于为我们的新必应预览工作...……更多
AI哨所 | AI比核武器还危险?ChatGPT为此建立了一支“红队”
...改进。去年,OpenAI聘请了50名学者和专家来测试最新GPT-4模型。在六个月的时间里,这支“红队”将“定性探测和对抗性测试”新模型,试图“攻破”它。神经毒剂美国罗切斯特大学的化学工程教授安德鲁·怀特(Andrew White)就是Open...……更多
更多关于科技的资讯:
本文转自:成都日报本报讯 (莫婧 成都日报锦观新闻记者 王丹) 在青白江,有一家专业从事碳纤维材料研发和生产的研究院——成都市青白江区高能碳纤维研究院
2024-06-11 01:36:00
本文转自:台州日报项瑶莹 以瓜为“媒”,链接全国。5月27日至28日,2024年长三角西甜瓜产业发展交流会在黄岩举行,全国279个品种西瓜“各显神通”
2024-06-11 01:09:00
蓄势待发 布局未来产业
本文转自:安徽日报位于合肥市蜀山区“科里科气”科创驿站—科大站的无论科技(安徽)有限公司的技术人员在调试人形情感交互机器人
2024-06-11 01:56:00
颜值高、续航强、拍照好还轻薄的vivos19,你值得拥有
有些朋友对于手机的需求,其实更注重拍照和续航,性能只要可以满足日常就行了,因为平时也不玩游戏,无需那么强大的性能,那么有没有一款手机
2024-06-11 01:18:00
小米中国市场手机激活数据显示最受“准大学生们”青睐
随着高考的结束,众多“准大学生”们终于迎来了他们期待已久的暑假。在这个特别的时刻,许多人选择用一款新手机来奖励自己过去一年的辛勤付出
2024-06-11 01:14:00
尼康z6iii北京时间6月17日推出
6月10日消息,据“尼康中国”官方公众号,尼康今天宣布将在北京时间6月17日晚上8点推出Z6III相机,参考官方介绍片
2024-06-11 01:13:00
小米14降价后,性价比提升明显,网友:幸福来得很突然
喜欢小米的小伙伴都知道,早期的小米,主要以性价比著称,在早些年,1999元就能买到高通顶级芯片手机,在小米这里就能成为现实
2024-06-11 01:22:00
6000元以上手机销售排行榜出炉,华为手机表现亮眼
还有10天,今年618活动就要结束,也就是说目前整个活动已经接近尾声,各手机厂商拼了这么多天,也该有个展示成绩的时候了
2024-06-11 01:27:00
iqoo两款旗舰售价“大跳水”,跌价幅度高达千元以上
如果喜欢高性价比手机,大家肯定都会知道iQOO品牌,它是vivo旗下主打性价比的子品牌,凭借着近几年的发展,也是取得了骄傲的成绩
2024-06-11 01:24:00
苹果发布visionOS 2,vision Pro将于6月28日在国内上市
出品 | 搜狐科技作者 | 张雅婷6月11日凌晨,苹果举办WWDC24开发者大会主题演讲。库克介绍称,在本次发布会上,苹果将对iOS
2024-06-11 01:33:00
华为pura70性能出色、拍照优秀、续航持久的旗舰手机
刀山火海何所惧,一往无前真英雄。在科技的浪潮中,总有一些产品如同英勇的战士,披荆斩棘,一往无前。今天,我们要聊的正是华为最新旗舰手机——Pura70
2024-06-11 01:35:00
Redmi Note13Pro外观设计简约而不失大气
智能手机如同一艘艘乘风破浪的战舰,不断挑战着性能的极限。而在这波澜壮阔的战场上,小米RedmiNote13Pro以其卓越的性能和极具竞争力的价格
2024-06-11 02:40:00
618大促中,小智准备换一款新机iqooneo9
随着今年618大促的接近尾声,基本上各大手机厂商该降价搞活动的机型价格差不多都稳定下来了,目前正处在反复横跳的状况下。也就是跌到一个低价
2024-06-11 02:23:00
本文转自:科技日报2024中关村论坛系列活动举办——中外人士共话工业4.0智能制造未来科技日报讯 (记者张佳欣)6月6日
2024-06-11 02:57:00
本文转自:科技日报【成果播报】科技日报讯 (实习记者薛岩)记者6月7日从中国华能集团有限公司(以下简称华能)获悉,我国首个安全可信分散控制系统——华能睿渥T316TR DCS近日在华能威海电厂3号机组成功投运
2024-06-11 02:57:00