• 我的订阅
  • 头条热搜
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...识图能力,长度限制提升到32Ktokens,即能处理超过25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等,同时回答准确性显著提高,同时能够生成歌词、创意文本等。OpenAI表示,当任务的复杂性达到...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...ansformer模型中的每层捕捉到的表示不同,包含不同级别的单词级和句子级信息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层...……更多
深挖 ChatGPT 原理,保姆级解说!
...符号集合作为输出。下面是结构化符号集合的一些示例:单词中的字母句子中的单词图像中的像素视频中的帧将一个符号集合转换为另一个相关符号集合的方法有很多种,这些方法并不限于计算机程序。你可以编写一个使用规则...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...过损坏再重建恢复。例如,你可以取一段文本,通过删除单词或更改其他单词来损坏它,这可以是文本、DNA序列、蛋白质或其他任何东西,甚至在一定程度上可以是图像。然后,你训练一个大型神经网络来重建完整的、未损坏的...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...队认为,语言空间并不总是最佳推理空间。例如,大多数单词 token 主要是为了保持文本的连贯性,对推理并不重要,而一些关键 token 则需要复杂的规划,给 LLM 带来了巨大的挑战。为了探索 LLM 在不受限制的潜空间中进行推理的...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...leaving Speech and Text)对于对齐的语音+文本数据集,通过在单词级别交错语音和文本来混合:[TEXT]the cat [SPEECH][Hu3][Hu7]..[Hu200][TEXT]the mat研究人员认为,交错训练可以帮助模型学习语音和文本之间的对应关系,从而实现更……更多
Sora“超级涌现力”将把AI引向何方
...关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致的连续时空内,对一系列...……更多
ChatGPT大流行的思考-解析篇
...ining Data?”,对于Bert类型的语言模型来说,只用1000万到1亿单词的语料,就能学好句法语义等语言学知识;而世界知识,指的是在这个世界上发生的一些真实事件(事实型知识,Factual Knowledge),指美国现任总统为拜登,太阳从东...……更多
万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?
...词”)。但是,好吧,在每一步,它得到一个带有概率的单词列表。但是,它究竟应该选择哪一个来添加到它正在写的文章(或其他什么)中呢?人们可能认为它应该是 “排名最高” 的词(即被分配到最高 “概率” 的那个)...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...的质量瓶颈,从数十万亿的数据中清洗、筛选出了3万亿单词数据用于训练大模型。优质的中文语料库让“天工”作为国产AI,在“更懂中文”这件事上具备天然的优势。与其他模型相比,“天工”能更好地理解中文语境、词汇和...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...自编码器发现特征激活的示例。每个气泡代表一个 Token(单词或词片段),可变的蓝色说明了这个特征的存在强度。在这个例子中,该特征显然与成语有关Gemma Scope有何独特之处?比起此前的稀疏自编码器,Gemma Scope有许多独特...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...到困难。 本质上,Transformer 中的注意力机制通过将每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...朴素贝叶斯分类器的一种,专门用于离散型特征(通常是单词计数或词频等文本数据)。 ·朴素贝叶斯模型:基于贝叶斯定理的一种简单但功能强大的概率分类器,假设特征之间是条件独立的。 ·多项式模型:适用于特征表示...……更多
【重磅】OpenAI最新解密,ChatGPT的本质是无损压缩器
...的翻译任务。 最简单粗暴的方式,就是列举出每个英文单词对应的中文,即rule-based mapping。假设我们枚举完了所有英文单词的中文对照表,写出了一本1000页的词典。 但通过这本词典,我们真的能够有效完成所有英译中的翻译任...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...的表示。这是由于 LLM 的文本理解能力隐藏在内部,它的输出特征空间并不具备很好的特征可分性。于是,该团队设计了一个图像 caption 到 caption 的检索实验,使用 COCO 数据集上同一张图像的两个不同 caption 互相作为正样本进行...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...好优化进行多轮对齐。并加入安全缓解数据,保障模型的输出既安全又实用。这在期间,模型所使用的高质量微调数据,正是来自合成数据生成技术——使用Llama 3.1模型在领域内图像的基础上过滤和增强问题答案,并使用奖励模...……更多
...网络,分析数据并找到输入内容之间的联系(例如,哪些单词经常一起出现)。它们在2017年取得重大飞跃,谷歌推出Transformer模型,这是一种神经网络手段,可以快速识别输入内容之间的模式和联系。例如,它寻找文本中每个单词...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...据张宁介绍,在应用生成式AI技术之前,WPS只能针对单个单词进行拼写检查,无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic Claude 3系列模型进行语义检查与文档润色。Claude基础模型拥有平均1.3秒到1.5秒...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...个简单的线性层将门控扩散卷积层和多层次关联注入层的输出进行整合,最终生成的时空依赖性特征表示为为应对可能在各种城市场景中出现的复杂情况,本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...界中的语义含义或真实性」无关,而是与在训练集中所有单词及其出现位置的统计概率最有可能的情况有关。比如说「草是绿色的」之所以真实,是因为在真实世界中草是绿色的,大模型会告诉用户草是绿色的,因为「草是」这...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...态编码器 + 投影模块 + 大语言模型主干。如果需要多模态输出,后面还会对称地拼接投影层和各种解码器。所以,在模型结构方面,我们可以分部分来看Pixtral都做了哪些工作。模型结构Pixtral 12B整体为Transformer架构,在大规模交...……更多
微软发布ai声音生成工具vall-e
...以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。康奈尔大学的一篇论文使用VALL-E合成了几种声音,大家可以在 GitHub上聆听这些AI合成的音频。研究人员指出,在许多情况下,Vall-E的性能优于当前的文本...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...布谈起。齐宪标表示:「我们得把一个图像块表示成一个单词。如果只是单纯的硬编码,我们是做不到的,因为它的空间太大了。所以,我们首先就是想办法来表示图像。这也就是所谓的 token 化。」图像的 token 化通常需要一个...……更多
chatgpt「克星」来了
...支持测中文):将它粘贴进测试框(需注意每句至少5个单词,建议每段能有10个句子,结果会更准一些)。很快,GPTZero计算出这段文字的总文字困惑度为27,句子平均困惑度为171.2,每条句子的困惑度图长这样:以及困惑度最高...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建超过人类水平的超级认知智能(super intelligence...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...持冻结状态,以固定的分辨率448×448处理图像,生成1024个输出token,在训练中最多6个图块(tiles),预定义的宽高比为{1:1, 1:2, 1:3, 1:4, 1:5, 1:6, 2:1, 2:2, 2:3, 3:1, 3:2, 4:1, 5:1, 6:1},覆盖了所有可能情况。……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...理长距离的依赖关系,也就是说,对于句子中距离较远的单词,模型也能有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展...……更多
ChatGPT模型API接口1折开放,全球AI格局巨变进行时 | 焦点分析
...一。目前的ChatGPT API定价为每1000个tokens 0.002美元,约750个单词。用户需要按照输入和输出的tokens总数来付费。 同时,OpenAI提供了专用实例选项,面向需要通过API运行大量数据,以及希望控制特定型号版本和系统性能的开发人员...……更多
重磅!国产AI写作模型比ChatGPT强1000%,360前员工AI团队取得重大突破
...成,最核心的优势在于可一键生成超20000字内容,长文本输出能力要比ChatGPT多10倍。今年上半年,Moonshot AI、阿里、360等一众大模型厂商纷纷开卷长文本,但这个“长文本”是指长文本处理能力,是 “喂进”大语言模型进行处理...……更多
更多关于科技的资讯:
全产业链展示秀出硬实力 “集优品·向辛行”2025辛集国际皮革盛会开幕
河北新闻网8月2日讯(侯淼、毛宇)今天,2025外贸优品中华行(辛集专场)暨辛集国际皮革皮草时装周、中国(辛集)国际皮毛时装博览会在辛集国际皮革城正式开幕
2025-08-02 21:44:00
7月31日下午,一场科技与美学的奇幻碰撞正在上演,孩子们的手指轻划屏幕,一件又一件充满设计感的服装瞬间“穿”在虚拟模特身上
2025-08-02 08:14:00
250万元撬动2000万元!六盘水:“小”券激活“大”经济
7月31日晚七点,金鸿购物超市人潮涌动。王女士的购物车里放着刚挑选好的榴莲和小龙虾,手机里一张“满100减30”的消费券即将核销
2025-08-02 13:57:00
德州扒鸡:在传承与创新中焕发新生
鲁网8月2日讯(记者 吴美琳 实习记者 费书慧)8月1日,德州市举行第二场“产业链上的山东好品牌”系列记者见面会,邀请山东德州扒鸡股份有限公司副董事长
2025-08-02 14:13:00
从清晨到日暮 恩博力以“冠军标准”定义健康家居新体验
(广告)在碧波与奖牌的背后,一位花样游泳世界冠军的日常,由无数个对细节的精准把控和对健康的不懈追求构筑而成。作为恩博力品牌代言人
2025-08-02 14:25:00
深国际·太原智慧物流制造项目主体完工
8月2日,深国际·太原智慧物流制造项目主体建设已经完工,目前,正在进行内部平台的改造,部分设备已进场。
2025-08-02 18:21:00
振健科技布局全国八大直营生产基地,引领行业高质量发展
近日,广东振健生物科技股份有限公司(以下简称:振健科技)宣布,企业已在全国范围内成功建立八大直营生产基地,主要分布在广州
2025-08-02 19:24:00
《聊斋志异·崂山道士》系列数字资产首发上线乐数通
由人民美术出版社正版授权,云栖博悟(杭州)文化传播有限公司设计发行的首款文化数字资产——《聊斋志异·崂山道士》,于2025年7月31日在浙江文化产权交易所长三角文化数字资产交易平台“乐数通”正式首发
2025-08-02 19:24:00
寻找会“讲故事”的声音展品! 三诺AI+智造博物馆老物件征集活动进行中
导语:在你的记忆中,是否有这样一些物件,它们曾用独特的“声音”在时光里留下印记?或许是流淌着咿呀戏曲的老式收音机,是旋转时沙沙低语的黑胶唱片
2025-08-02 19:24:00
8月1日晚,倍轻松(股票代码:688793.SH)发布公告,将“信息化升级建设项目”的节余募集资金,用于面向实感交互智能的传感器矩阵搭建与应用研究
2025-08-02 19:24:00
近日,重庆中京云智人工智能科技有限公司宣布完成数千万天使轮融资。本轮资金将重点投入核心项目“京店长”的技术研发与全国布局
2025-08-02 19:24:00
当家 APP 与龙牌集团达成战略合作,共筑家装行业新生态
7月30日上午,国内领先的互联网装修平台当家APP与建材行业龙头企业北新建材龙牌集团正式签署战略合作协议。双方宣布将在龙骨
2025-08-02 19:24:00
即小评丨“混搭”潮出圈 蚂蚁市集何以成为即墨“新地标”?
大众网记者 朱晓娟 青岛报道“混搭”一词来源于时尚界,从服饰营销策略扩展到一种文化符号,特指通过巧妙的平衡的协调,创造出新颖
2025-08-02 14:19:00
创新服务企业模式,为数字资产保护提供新的解决方案河北开具首张数据知识产权公证存储证明河北日报讯(记者马彦铭)7月28日
2025-08-02 08:54:00
石家庄食草堂文化饰品有限公司总经理牛睿仪:“选择一行,就要脚踏实地干下去”7月,牛睿仪又打卡了三个城市。作为石家庄食草堂文化饰品有限公司总经理
2025-08-02 09:01:00