• 我的订阅
  • 科技

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

类别:科技 发布时间:2024-09-07 09:48:00 来源:量子位

GPT-5有3-5万亿参数,由7000块B100炼成?!

一夜间,下面这张图在网上疯转:

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

仔细看,这是三星高管Jung Bae Lee(李禎培)在一场高级管理层峰会(CEO Summit)上演讲。

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

上面明晃晃写着GPT-5 3-5T、B100 7000、HBM3E 8TB/s。

网友发现,不只是三星高管有“剧透”,OpenAI日本办事处负责人Tadao Nagasaki最新演讲中也有一张这样的照片:

上面展示,就在今年,将推出“GPT Next”,比GPT-4强大100倍。

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

巧了,今年早些时候,微软 CTO Kevin Scott也有这么一张图:

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

一系列消息拼凑起来,网友炸开锅,纷纷表示等不及了。

OpenAI:我们有很多事情要跟大家讲

除了上面的PPT,有网友从OpenAI相关域名更新中发现了华点。

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

就在昨天,更新中含有”staging”(cdn.staging.openai.com),网友推测这可能意味着该设置是为了测试接近生产环境的配置。

谷歌揭秘大模型不会数r原因:嵌入维度是关键,不止分词器问题

在往下看,8月29号似乎有一个新的关于“video”的域名,是Sora吗?

有意思的是,在传言满天飞的时候,OpenAI这边也有新动作了。

不是澄清,而是表示:有很多事情要告诉您。

就此新开设了一个新闻账号——OpenAI Newsroom。

再联系到之前的草莓、猎户座的爆料。

最近关于OpenAI要推出新模型的消息越来越密集,网友纷纷表示,这下GPT-5真的要来了。

有网友分析:

2到3倍的提升,意味着:使用了新架构,可在不需要更多计算的情况下,保持指数级能力增长;LLM已经趋于稳定。

不过,除了期待,也有大量网友表示希望这一次是真的,可别又是光打雷不下雨的炒作……

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-07 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

数势科技智能分析AI Agent 何以在市场中脱颖而出?
...有指令都会被精确映射到一系列预定义的要素上,如时间维度、地域维度、公司维度等。以该零售客户的问题为例,大模型仅需将“最近三个月”识别为时间要素,“商品”识别为产品维度,“好评
2024-12-30 17:00:00
自动化、可复现,基于大语言模型群体智能的多维评估基准
...业生产目标,还是科学场景辅助需求,评估 LLM 在精细化维度上的能力都是至关重要的,例如:数学及其专门分支领域,如代数、几何、概率和微积分。 不同类型的推理能力,例如符号推理
2024-10-23 12:03:00
GPT-4正在变笨
...是,你说对了!大模型确实在变笨! 论文试图通过多种维度评估GPT的表现为何让人感到如此不稳定和不一致,于是为GPT3
2023-07-20 22:34:00
国内第一款AI搜索来了!首发实测:0广告、自动总结成文
...信息来源不仅是高度相关的,同时也保持了广泛的视角和维度,从而实现搜索结果的丰富性和深度。最后通过召回用户之前查询的搜索结果,提高搜索结果与用户交互的连贯性,打造了一种更自然、
2023-08-25 10:42:00
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...果的影响。为了评估模型的性能,我们采用了基于LLM的多维度比较方法。具体定义了全面性、多样性、赋能性和总体表现四个评估维度。这些维度从不同角度衡量模型的回答质量,确保评估的全
2024-10-15 09:57:00
大模型惨遭国内各领域专家组团“投毒”
...令)微调。但这次项目有点不同,主要有两个方面:更多维度的反馈。以往常见的对齐操作,主要是基于人类示范回答监督微调(SFT)
2023-07-16 14:23:00
...教师胜任力模型,从专业素养、专业知识、专业技能3大维度的27个子维度出发,分析教师在教师胜任力上的优势和短板,为有关方面提供教师分层分类培养方案提供精准的建议。对企业来说,同
2023-02-15 07:15:00
关于暗物质隐藏地点的新理论
...挑战,但近两年,有科学家提出的一个创新性概念——暗维度场景,这为我们提供了一种可能的解答路径,因为它至少在一定程度上回应了关于宇宙构成的一些根本性问题。这一理论不仅为暗物质的
2024-05-11 14:02:00
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...义理解的SQL生成任务需要精准理解用户查询的指标和相关维度。为了增强问数服务层的数据精度与效能,浩鲸科技的BI大模型团队聚焦于构建一套全面的BI知识数据管理体系。该体系深刻涵
2024-09-23 09:53:00
更多关于科技的资讯: