• 我的订阅
  • 科技

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

类别:科技 发布时间:2024-08-15 09:31:00 来源:量子位

如果你这几天在/推特上关注AI消息,那很大概率见过这个“草莓哥”账号。

头像是电影《Her》里的男主,昵称是三颗草莓,要素拉满。不知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,不管你愿意不愿意看,推荐算法都会确保ta出现在你的时间线上。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

昨天,草莓哥声称OpenAI将有大动作,大家是非常期待的。

而且刚好又到了谷歌开发布会的时间,OpenAI拿出什么消息来抢头条也是很合理的吧。

但时间到了大家发现,没有GPT-5,也没有草莓/Q*,也没有Sora公测……OpenAI只是发了新版大模型代码能力测试基准。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

就在网友们的耐心被耗光的时候,剧情反转来了。

创业公司MultiOn AI的创始人Div Garg现身认领:

草莓哥账号其实是我们家最先进的AI Agent控制的,快来和它在线互动吧。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

网友一下子炸锅了:

“要么这就是当前最好的AI Agent,要么这家公司参与炒作,把公司声誉全毁了。”

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

斯坦福博士休学创业,估值7亿元

先来说说MultiOn AI这家公司,专注于构建AI智能体。

旨在自动化日常任务和操作网页,例如从电商平台买手纸或安排日程表。

今年6月,有消息称MultiOn将完成2000万美元(约1.4亿元)融资,估值约1亿美元(约7.1亿元)。

创始人Div Garg,斯坦福大学读CS博士期间休学创业,在Uber、谷歌、苹果、英伟达都有实习经历。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

他们最新推出的智能体产品Agent Q,号称拥有做计划和纠正自己错误的能力,可以跨站点浏览、填写表单,zero-shot表现比Llama 3基线提升340%。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

与此同时,也发布了与斯坦福团队合作的相关研究论文,

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

总之呢,产品和论文看起来还挺正经的。

就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

最近围绕AI的消息太多太乱,大家已经不知道该相信什么了。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

不过也有人认为,草莓哥的账号与MultiOn公司成立时间对的上,用户名iruletheworldmo最后的“mo”可以是MultiOn的缩写。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

但即使是真的,也有很多人批评这家公司的做法,没有带来什么好影响,而是浪费了很多人时间。

AI越狱大师Pliny看不惯这种做法,发出了最后通牒:

给你们15分钟时间,要不拿出决定性的证据,要么坦白真相,不然就把你家智能体的系统提示词公布在GitHub上。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

时间到了,Div Garg并没有回应,反而删除了其中一条声称草莓哥账号由AI控制的两条发言,另一条还保留着。

Pliny也如约发布了提示词。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

One More Thing

在国内大家睡觉的这段时间,AI圈发生了很多事。

除了MultiOn的闹剧之外,谷歌发布了对标GPT-4o高级语音模式的Gemini Live语音聊天机器人。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

OpenAI则出了两招来回应:

发布最新代码能力基准测试SWE-Bench Verified,给“AI程序员”们出了一套更合适的考试题。

OpenAI在测试中发现原版基准中有一些AI不可能或很难解决的任务,从而导致基准普遍低估了当前模型的自主软件工程能力。

此前SWE-Bench原版作者姚班学霸姚顺雨已经毕业入职OpenAI,这次OpenAI也和普林斯顿原始团队进行了合作,在新版本中修正了这些问题,可以提供更准确的评估。

目前新版基准测试已经开源在GitHub上。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

同时在大模型竞技场上,GPT-4o的最新版本反超谷歌Gemini-1.5-Pro的试验版本,重新夺回第一的位置。

最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅

OpenAI和谷歌的AI大战,还将继续……

参考链接:[1]https://x.com/MultiOn_AI/status/1823412701441482959[2]https://x.com/ai_for_success/status/1823447309008490730[3]https://openai.com/index/introducing-swe-bench-verified/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-15 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...,Q*首次被曝出,被认为过于强大,可能是通往AGI或超级智能的关键一步。它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数
2024-08-08 15:11:00
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处
2024-06-04 14:35:00
王思聪日本街头被拍,开劳斯莱斯带美女,网友:脖子上有草莓印
...网友晒出过在路边看到的王思聪的劳斯莱斯,甚至还有人爆料称王思聪此前在国内的那辆布加迪也已经于近日运到了日本,并晒出了相关照片。以至于网友们纷纷好奇,王思聪这是要在日本定居了吗
2024-06-12 17:23:00
o3数学成绩作弊大瓜!提前让测试机构给真题 60多名数学大牛全被蒙在鼓里
...被曝数学成绩是靠作弊得来?!Benchmark发布机构内部人员爆料称,OpenAI给了他们经费赞助。就连包括陶哲轩在内参与出题的60余名数学家,在消息曝光之前也都和普通公众一
2025-01-20 14:29:00
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...著提升。然而,尽管「草莓」项目充满了潜力,此前也有爆料指出了早期测试中暴露出的一些问题。例如,在处理简单任务时,响应速度偶尔过慢,且其记忆对话的功能尚不稳定。这些问题显然会影
2024-09-12 09:49:00
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...准,让机器人或AR眼镜指导家具组装不再是梦。随着人工智能技术的快速发展,让机器理解并执行复杂的空间任务成为一个重要研究方向。在复杂的3D结构组装中,理解和执行说明书是一个多层
2024-12-04 09:53:00
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
OpenAI的“草莓”终于来了。当地时间9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列
2024-09-13 15:28:00
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季发布”(9月至11月)要更早。上述报道称,专注
2024-09-11 09:55:00
吴京在《巨齿鲨2》中戏份多少?网友爆料称与杰森·斯坦森不相上下
《巨齿鲨2》是一部由美国华纳兄弟公司和中国阿里巴巴影业集团联合出品的科幻动作片,是2018年的《巨齿鲨》的续集。这部电影讲述了一群深海探险家在寻找地球最深处的神秘生物时,遭遇了一
2023-07-31 15:42:00
更多关于科技的资讯:
中国消费者报北京讯(记者桑雪骐)近日,追觅科技正式官宣成为中央广播电视总台2026年春节联欢晚会智能科技生态战略合作伙伴
2026-01-23 17:16:00
飞利浦旋护新9系Ultra高端款剃须刀新意限定版首发上市
新春将至,大家都希望以最好的状态和面容迎接新年,新春礼赠更要送到“面子上”。每份精心挑选的礼物都承载着对亲密关系的珍视
2026-01-23 17:09:00
鲁网1月23日讯“小时候爸妈送我上新东方,长大了我送爸妈去新东方。”这句调侃在社交媒体迅速走红。2026年1月21日,新东方创始人俞敏洪宣布开办“退休俱乐部”
2026-01-23 14:47:00
为了一杯更新鲜的咖啡,瑞幸开启了云南咖啡豆 “铁路专列”
近日,一列名为“瑞幸号”的铁路专列,满载22个集装箱、共682吨来自云南产区的当季咖啡豆,跨越2834公里,从云南普洱稳稳抵达福建厦门
2026-01-23 15:06:00
千灯企业技术中心获省级荣誉!
近日,江苏省工业和信息化厅公示了2025年省级企业技术中心拟认定名单,千灯镇企业昆山欣谷微电子材料有限公司、昆山鑫诚五金科技有限公司
2026-01-23 15:13:00
苏州高新区管委会与宁波银行签订战略合作协议 共同举办“产融聚力 共创未来”人工智能行业对接会
1月21日,苏州高新区管委会与宁波银行签订战略合作协议,并共同举办“产融聚力 共创未来”人工智能行业对接会。活动汇聚科创企业
2026-01-23 16:28:00
中国消费者报南宁讯(桂广雯 记者顾艳伟)1月23日,记者从广西壮族自治区市场监管局获悉,在该局的指导下,玉林市市场监管部门紧密围绕香料产业发展需求
2026-01-23 16:45:00
南方电网兴义普安供电局2026年配电电缆专业技能培训圆满收官
1月22日至23日,南方电网兴义普安供电局在云盘变实训场成功举办2026年配电电缆专业技能培训,来自配网综合班的配电专业人员参加了为期两天的集中培训
2026-01-23 16:50:00
锦江酒店(中国区)正式发布“锦鲲”协同办公平台,以 AI 驱动万店效率升级
“让AI去做它擅长的事,让人去做更有温度的事,提供更有温度的服务。”1月22日,锦江酒店(中国区)与飞书在深圳正式举行签约仪式
2026-01-23 15:40:00
“十五五”开局看河北|玉锋集团把玉米价值链越拉越长
从一粒粮到38种产品玉锋集团把玉米价值链越拉越长1月16日,宁晋县玉锋实业集团有限公司员工在生产车间巡检。 河北日报记者 赵永辉摄从2026年第一天起
2026-01-23 08:12:00
近日,海亮科服引爆关注——来自海亮致远书院的徐同学、寿同学双双重磅斩获牛津大学录取通知书!当大多数家庭还在高中才仓促启动升学规划
2026-01-23 10:02:00
《创投新势力》即将开播!一起见证中国科技创新的澎湃力量
鲁网1月23日讯从广州云宏信息在国产服务器虚拟化领域的技术攻坚,到主线科技实现自动驾驶物流系统的规模化落地;从智慧能源企业的清洁技术革新
2026-01-23 10:13:00
厦门游戏产业规模超百亿元 聚集近200家游戏企业
全市聚集近200家游戏企业厦门游戏产业规模超百亿元2025金海豚动漫游戏嘉年华在厦开幕。(记者 沈威/图)东南网1月22日讯(海峡导报记者黄奕琳)日前
2026-01-23 10:16:00
在黄金珠宝行业消费端承压、部分品牌闭店收缩的背景下,潮宏基实业股份有限公司交出了一份亮眼的年度成绩单。公司最新披露的2025年度业绩预告显示
2026-01-23 10:19:00