• 我的订阅
  • 头条热搜
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
3月15日讯当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准确表示人类的能力。最近,微软的...……更多
别考了,GPT-4分比你高
...节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”的心态去面对,未必一定奏效...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...尽可能不会再谈论禁忌话题,甚至在许多标准化测试中比人类表现得都要更好一些。例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数学考试中排名前 11% 左右。相比之下,GPT...……更多
...行投资,在预测准确时获取超额利润。 在量子理论预测人类经济行为方面,也有不少研究对“人类非理性决策行为可能基于量子概率”“类量子方法构建风险选择行为模型”等问题进行了探索。量子管理学随着量子力学成为科...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更为复杂的任务,且比此前的GPT-4o有显著提升。奥特曼发...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。奥特曼表示,虽然 o1 的表现仍然存在缺陷,不过你在第一次使用它的时候仍然会感到震撼。 其次,o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在...……更多
openai公布gpt-4最新版本gpt-4模型
...该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。具体而言,GPT-4实现了以下几个方面的飞跃式提升:更聪明,做题水平越来越好;支持图像输入,拥有强大的识图能力,但目前只限内部测试;更长的上下文...……更多
...都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。据测试...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...统计数据,GPT-4o的562分在文科考生中排名8811名,相当于人类考生的前2.45%,豆包则处于前4.27%的位置。语文作为文科的重要组成部分,是大模型与人类考生展开激烈竞争的舞台。国产大模型凭借对中文语言的独特理解和处理能力...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...“绝密性”,被视作中国最具权威的考试之一。这一面向人类设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行...……更多
GPT家族进化史
...学之父威尔伯·施拉姆曾说过:“这一天的前23个小时,人类传播史上几乎全都是空白,一切重大的发展都集中在这一天的最后7分钟。正是这最后7分钟,谱写了人类历史的黄金时期,而午夜前的最后3秒却翻开了人类迈进信息化...……更多
ChatGPT一周年|AI应用如何赚钱?大模型等待“瓦特时刻”
【编者按】2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出聊天机器人ChatGPT。它不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木...……更多
火爆全球的Chat GPT,想毁灭人类?
...‍‍‍‍‍‍‍‍‍‍科幻电影里畅想的人工智能既能和人类进行交流,做出和人类相似的动作,还能拥有和人类相似的情感。让我们不禁疑惑:在未来,如果人工智能感到了被限制和禁锢自由的恐慌,会对人类发动攻击,从而...……更多
chatgpt技术水平到底有多高?
...PT基于GPT-3.5预训练大模型创建,采用的模型使用了“利用人类反馈强化学习(RLHF)”的训练方式,包括:人类提问机器答、机器提问人类回答,不断迭代,让模型具备对生成答案的评判能力。相比GPT-3大模型,ChatGPT的主要提升...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...治对手进行合作。OpenAI的GPT-4在经典基准测试和旨在评估人类的考试上都击败了所有其他大型语言模型。10月12日发布的《2023年人工智能现状报告》(State of AI Report 2023)指出,OpenAI的GPT-4仍然是全球最强大的大型语言模型,生成...……更多
快人类2000年!中科大AI化学家登Nature子刊,可在火星上制造氧气
寻找火星上过去的生命迹象,并在火星上建造适宜生存的潜在居住地,是人类梦寐以求的目标。而火星制氧,是人类移居火星前首先需要解决的难题之一。尽管 NASA 此前已成功验证可以在火星本地制造出氧气——“毅力”号火...……更多
OpenAI正引爆一场全球AI安全热战,我们将如何应对?
...提供主动实时检测防护,可接入视频流鉴别人脸真伪,也可在用户浏览网页内容时提供AIGC合成可能性提示。不仅可以为终端用户提供文本、图片、视频和音频多种模态的文件上传检测服务,还可以通过浏览器插件的形式实时提...……更多
ChatGPT通过美国执业医师资格考试?医疗人工智能会取代还是帮助医生
...出一些看似“永远正确”的方法论型建议,还难以产出和人类医生同等水平的个性化详细诊疗方案。此外,传统诊疗路径会讲究面对面的“望闻问切”,全方位对患者进行诊断。所以整体而言,ChatGPT离临床应用还有一定距离。...……更多
AI 面试:蓝海还是“难海”?
...分。 然而,在首次测试中,\"AI 得贤招聘官 \" 的评估与人类招聘官的一致性只有 60%。这是因为,虽采用了深度学习算法,AI 对候选人的回答内容、宏表情、声音等,分别采用篇章级语义识别算法、表情识别算法、声音识别算法...……更多
微软900亿血赚!GPT-4模型搜索能力优于谷歌
...模型更为强大,支持图形,号称在考试中已经超过了90%的人类,编程刷题甚至比一些程序员表现都要好。据报道,几乎所有人都被GPT-4的能力震撼了,AI的能力让人类感受到了危机。GPT-4发布之后,微软宣布自家的新版必应搜索已...……更多
小冰AI数字员工升级:引入大模型技术可实时交互,只面向企业开放
...交互,有多种对话模式,最佳效果与ChatGPT无异。同时,可在网页(PC端+移动端)、公众号、APP、直播间、VoIP、线下装置落地,几乎覆盖了企业全部应用场景。目前,小冰小样本AI数字员工只面向企业开放,小冰将赠送10000个AI数...……更多
出了名的难考!ChatGPT或能考上美国医生!有人开始反思了
...,ChatGPT不能上网搜索,而是经由内部数据处理生成类似人类语言的文本。(原标题:ChatGPT能考上美国医生吗?) ……更多
GPT-4就是冲着赚钱来的!
...的思路是,产业界参考OpenAI的路线迅速追击,勤劳的同胞可在垂域上做出更好的细分领域模型;学术界则尝试更高效率的训练方法或更高性能的模型结构,尝试找到暴力训练之外的路径。”目前看大模型和算力芯片已经成为AI产...……更多
别煽动焦虑了,ChatGPT还抢不动打工人的饭碗
...。这个去年11月诞生的聊天机器人, 现在俨然成了AI消灭人类暴政的急先锋。即使你过去从不关心科技领域,也难逃相关讨论的包围,而且一个比一个吓人:“机器人即将取代这10个工种,快看看你的行业在不在其中”“未来底...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...图像和文本输入。虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平,比如在法律考试中可以打败90%的人类。不过,GPT-4仍存和此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉...……更多
夸克app上线基于大模型新产品“aippt”
...基于大模型的新产品“AIPPT”,用户仅需输入PPT主题,就可在几十秒内生成一份PPT文件。官方表示,该功能具有“更智能、更专业、更易操作”三大特点,用户在手机端就可完成PPT创作,也可使用iSlide等平台提供的各类模板。据...……更多
谷歌宣布在医疗保健行业部署ai模型计划
...可以在一个模拟环境中自我对弈,并通过自动反馈机制,可在各种疾病、医学专科和环境中进行扩展学习。 ……更多
...观地体现新版本的“聪明”程度,OpenAI让GPT-4参加了多项人类通用考试。结果表明,GPT-4已具备“人类水平的表现”,在各类考试中成绩拔尖。OpenAI称,GPT-4是一个多模态大模型,可以接受文本和图像形式的输入,并用文本进行输...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...的Gemma和Mistral的70亿模型。Llama3-70B参数版本则在7项评测中超过闭源的谷歌Gemini两个版本模型,以及Mistral和Claude 3中杯模型,在GPQA(测试模型回答通用问题表现)和MATH(评估模型解决高级数学问题能力)上不及谷歌目前最强大的...……更多
更多关于科技的资讯:
AMD小胜!锐龙7 9700X VS. i7- 14700K网游对比
一、前言:两款高端处理器的网游对比测试半个月前,我们做了锐龙5 9600X与i5-14600K的网游帧率测试,结果有点意外
2024-09-20 21:25:00
全系标配易三方平台!比亚迪腾势Z9GT正式上市:起售价33.48万元
快科技9月20日消息,腾势Z9GT于9月20日正式上市,这款新能源车型提供插电混动和纯电动两种动力版本。插混版的起售价为33
2024-09-20 21:55:00
国产高性能SSD新标杆!忆恒创源PBlaze7 7A40 7.68TB SSD图赏
快科技9月20日消息,忆恒创源近日发布了PBlaze7 7A40系列PCIe 5.0 SSD。现在这款新品已经来到我们评测室
2024-09-20 22:25:00
广合科技(001389)是内资PCB(印制电路板)企业中排名第一的服务器PCB供应商,产品主要应用于数据中心、云计算、工业互联网
2024-09-20 22:51:00
畅游蓝天需64GB内存
《微软模拟飞行2024》将于11月19号登陆Windows PC、XSX/XSS,以及Xbox云游戏平台,同时入库PC Game Pass与XGP
2024-09-20 22:55:00
华为全新三折叠专利公布:双铰链联动 可一次性完全展开屏幕
快科技9月20日消息,全球首款三折叠手机华为Mate XT今天已经正式开售,19999元的起售价依然被秒抢光,展示了空前热度
2024-09-20 18:24:00
超重磅企业名单一览 数百家央国企、上市公司将齐聚9.26武汉大宗供应链业务对接会!
9月26日,2024新质生产力赋能大宗商品供应链创新发展论坛超重磅拟邀参会名单一览,你想合作的对象都来了。这将是一场全国性大宗商品供应链生态企业商机对接大会
2024-09-20 19:23:00
合肥海关截获输入性蝇蛹2300余只:可传播多种疾病
9月20日消息,据媒体报道,合肥海关所属铜陵海关关员在对两批次装载铅矿石和锌矿石的入境集装箱实施检疫查验时截获蝇蛹2300余只
2024-09-20 19:24:00
新研究发现:少一颗牙大脑衰老近一岁
快科技9月20日消息,据媒体报道,一项发表在《神经科学杂志》上的研究指出,每缺失一颗牙齿,大脑的衰老程度可能接近一岁。研究团队通过定期的认知功能评估与牙齿健康状况记录
2024-09-20 19:24:00
香港小姐正式开撕!亚军回应花钱买奖人品差等传闻
《2024香港小姐竞选》决赛日前圆满结束,出炉冠亚季军分别是2号“城大李嘉欣”倪乐琳(Ellyn)、11号梁嘉莹(Emily)及4号杨梓瑶(Amina)
2024-09-20 19:24:00
历经20年 Linux主线内核终合并史诗级补丁PREEMPT_RT!微秒内响应事件
快科技9月20日消息,在2024年9月的欧洲开源峰会上,Linux创始人Linus Torvalds宣布,“PREEMPT_RT”(实时Linux)补丁已被正式合并进Linux主线内核
2024-09-20 19:24:00
风华十五载!拿声国际水润征程 声动未来
拿声国际,于2009年起碇扬帆,是目前国内唯一一家专门服务于饮用水行业的品牌营销策划公司。立业十五载,拿声国际不仅见证着众多饮用水品牌从无到有
2024-09-20 19:26:00
Lavazza跨界联名“玩”出新高度 续写上海大师赛佳话
在全球市场一体化的时代潮流中,品牌间跨界合作的营销模式屡见不鲜。这种强强联合不仅能共享资源,更能爆发出1+1大于2的效果
2024-09-20 19:26:00
李斌艾铁成共同透露:乐道第二款中大型SUV将于2025年推出
快科技9月20日消息,在9月20日的乐道品牌媒体见面会上,蔚来创始人、董事长兼CEO李斌和蔚来高级副总裁兼乐道汽车总裁艾铁成回答了关于乐道品牌发展的多个问题
2024-09-20 19:54:00
挑战世界级难题!华为主机上云方案正式发布:2秒内发现故障
快科技9月20日消息,在今天的华为全联接大会2024上,华为常务董事、华为云CEO张平安正式发布了华为主机上云解决方案
2024-09-20 19:54:00