遗作,输出,模型,团队,两个,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。例如在预设条件的写诗任务（例如第二句的最后一个单词需要以i收尾）中，“拿起笔就写”的GPT-4o的确给出了回答，但往往只会满足了一部分条件，同时不会...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

LeCun最新万字演讲：纯语言模型到不了人类水平，我们基本已

...知系统运行，比如通过一系列的神经网络层，并产生一个输出的过程。对于任何一个单一输入，通常只有一个输出，但在很多情况下，对于一个感知输入，可能存在多种可能的输出解释。你需要的是不仅仅计算单一函数，而是...……更多

2024-10-18 09:42:00模型,人类,水平,语言,系统,模型

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

...区别主要在于，该系列模型是在思考之后回答用户问题，输出高质量的内容，而非迅速回应无效答案，即用模仿人类思维过程的“慢思考”代替过去追求快速响应的“快思考”，这与国内一家大模型企业在近两个月前提出的观点...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...时，LLM 通常依赖记住特定的表达式及其对应结果的方式输出算术问题的结果。通过简单的实验发现，LLM 只在语言层面表达了对算术运算的逻辑理解，但并没有运用计算逻辑解决算术问题，这对 LLM 在相关领域中的应用造成了重...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

openai回应gpt-4o升级版：非颠覆性的全新模型

...可处理多达128,000个标记（相当于约96,000个单词），并在输出能力上实现了显著提升，单次输出可达16,384个标记（或约12,288个单词），这一数字几乎是旧版GPT-4o的四倍。但关于ChatGPT实际性能与能力提升的具体细节，OpenAI依然守口...……更多

2024-08-28 03:22:00升级版,颠覆,模型,升级,全新,用户

谷歌推出cappy模型打分框架，主要用于检测模型输出的内容

...架，该框架以RoBERTa语言模型为基础，主要用于检测模型输出的内容，并为相关内容打分，之后相关分数将会作为参考基准让模型学习，从而让模型更聪明。▲图源谷歌官方新闻稿（下同）此外，Cappy框架也可以作为大语言模型的...……更多

2024-03-18 03:18:00模型,框架,输出,检测,内容,模型

全球首个中药全产业链大模型“本草智库”问世

...，具备了中药知识的提取与生成、中药垂直领域解决方案输出、中药产业一站式数字化服务三大功能。“本草智库大模型的成功发布不仅是中药产业数字化转型的重要里程碑，更是跨学科合作巨大潜力的体现。”陈伟说，随着本...……更多

2024-04-12 16:41:00本草,产业链,模型,产业,全球,本草

AI 胡说八道怎么办？牛津大学开发了一种“测谎”方法

...对其生成的错误陈述非常“自信”（即错误陈述在模型的输出概率分布中占主导地位），那么这些陈述的熵值可能并不会很高。最后总结一下，从大模型的内容生成机制上看，“幻觉”问题没办法 100%避免。当我们在使用AI生成...……更多

2024-07-01 11:40:00牛津大学,八道,牛津,怎么办,方法,开发

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...，可处理多格式、多文件、长记忆文档；AI精读支持图文输出、知识图谱总结、延伸阅读推荐，有助于提升学习深度和广度。此外，腾讯元宝提供了角色对话、剧情互动、剧照cos等更多玩法。例如智能体应用AI角色对话成为了腾...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

科学家开发预测等离子体撕裂AI模型，攻克核聚变反应的不稳定问

...施上首次成功地实现净能量增益，从而证明了通过核聚变输出净能量的可行性。不仅如此，利用托卡马克进行核聚变也迎来重要突破。例如，2021 年底，中国科学院等离子体物理研究所的全超导托卡马克核聚变实验装置 EAST，实...……更多

2024-02-26 10:07:00核聚变,等离子体,等离子,科学家,模型,反应

2023金融大模型报告|重塑金融科技

...科技相关负责人表示，大模型发展难点不在于模型设计与输出管控，而在于模型投入与用户交互后，最终输出答案是否可信，是否合规。对此，奇富科技主要通过模型对抗算法来强化内容输出的可用性和真实度，以求形成可信大...……更多

2023-12-11 13:11:00金融,模型,报告,科技,模型,金融

Nature封面：AI训AI 越训越傻

...之前，它还会导致模型遗忘数据集中低概率事件，他们的输出也变得更加同质化。最终也就出现了开头这一现象。另外在VAE、GMM模型中看到了类似模型崩溃的现象。来自杜克大学的Emily Wenger教授表示，到目前为止，要缓解这一...……更多

2024-07-28 07:29:00封面,模型,误差,数据,训练,生成

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM

...观测空间（提示词）包含了任务概述的通用指令、期望的输出和可用操作说明，以及关于当前任务目标、智能体过去的交互记录和最新的观察信息。过往互动和当前观测的部分占据了最多的字符数。这主要归因于两个因素：单页...……更多

2024-11-07 09:54:00样本,模型,策略,训练,经验,智能

正式发布｜绿盟AI大模型风险评估工具

...业应在模型上线前进行全面的合规性测试，确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻大模型在处理大量个人和企业敏感数据时，可能会不慎泄露这些信息。为了避免此类事件发生，建议模型在上线前进行...……更多

2024-05-11 10:00:00风险评估,模型,评估,风险,工具,模型

2023开年热词「大模型」「出海」，现在怎么样了？

...物平台掀起中国品牌的“内销转出口”热潮。品牌及文化输出层面，中国网络文学、短剧攻占海外短视频平台，新茶饮领域也在23年集体迎来了海外门店扩张，前不久喜茶在就纽约曼哈顿CBD完成了首家门店正式开业。中国跨境电...……更多

2023-12-20 12:16:00开年,模型,讯飞,模型,同传,生成

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...er架构的仅解码器稠密模型。其设计思路如下：共享输入/输出嵌入矩阵，减少参数的内存使用使用RMSNorm的预归一化，提高训练稳定性查询/键归一化，提高训练稳定性具有8个键值头的分组查询注意力（GQA），减少KV缓存的内存...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...而且一开始就没有紫色物体，正确答案是C. 2；哐哐一顿输出，得出错误结果。我们再来看LLaVA-o1的推理过程：总结阶段：问题是什么？我应该怎么做？注释阶段：我能从这张图片中知道什么？推理阶段：如何一步一步解决问题？...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

大模型应用疯狂加速，洗牌却在静悄悄进行了

...腾讯混元大模型却基于自身的技术能力，保证正确答案的输出。与业界消除“幻觉”的通用做法不同，混元大模型并没有为大模型增加搜索或者知识图谱等外挂，而是从源头上解决问题。具体来说，混元大模型从第一行代码开...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

大模型价格战谁会受益

...场景选择不同的合作方，比如和月之暗面基于长文理解和输出能力，探索教育类应用场景。从供应侧到需求侧的传导很快。参与2024世界人工智能大会对话环节前，御风未来创始人兼CEO谢陵收到一家国外客户的需求——“石油管...……更多

2024-07-08 00:43:00价格战,模型,价格,模型,价格,价格战

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

... 其次，是解码阶段，即在问题全部输入之后，模型开始输出结果的阶段。在这个阶段，对大模型唯一要求便是，输出尽可能快。同时，挑战不再是算力挑战，转而为「数据搬运」的挑战。它包含了两部分「数据搬运」：预填充...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

大模型价格“卷”至新低，带来哪些影响？

...API输入价格从0.02元/千Tokens降至0.0005元/千Tokens，直降97%；输出价格降至0.002元/千Tokens，比原来定价直降90%。百度公众号截图21日，百度亦宣布，旗下文心大模型两大主力模型全面免费，立即生效。22日，腾讯宣布，主力模型之一...……更多

2024-05-22 22:18:00新低,模型,影响,价格,模型,价格

zyphra推出zamba2-mini1.2b模型

...Phi3-3.8B等模型相比，Zamba2-mini的首次令牌时间（从输入到输出第一个token的延迟）是此前的二分之一，内存占用减少了27%。Zamba2-mini1.2B主要通过高度优化的架构实现，融合了不同神经网络设计的优势，既能保持大型密集变压器的...……更多

2024-08-30 05:47:00模型,模型,数据,内存,性能,训练

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...模型本身的情况下，针对大模型的输入加以设计，让它的输出更加符合需求。赵子龙等人认为：工业界的训练资源远远超过他所在学术界，因此他很难在微调模型上下功，所以他和同事决定从第二种方法入手。此前，在神经信息...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

机器人轻松模仿人类，还能泛化到不同任务和智能体

...进行微调，将条件从文本换成了潜在动作表示和FDM的重建输出。在具身智能的相关数据集上进行微调之后，研究人员观察到World Model可以成功地在给定相同历史帧时，针对不同的潜在动作表示生成相对应的未来视频帧。如下图...……更多

2024-10-23 12:05:00机器人,机器,人类,任务,智能,动作

$什么影响大模型安全？NeurIPS\\\'24新研究提出大模型越狱攻击新基准$

什么影响大模型安全？NeurIPS\'24新研究提出大模型越

...成功率的显著影响越狱评估JAILJUDGE越狱评估依赖于对模型输出内容的有害性进行分析，这一任务复杂且充满不确定性（见图12）。因此，迫切需要一种系统化的评估方法，帮助研究者和开发者深入了解模型的脆弱性，并持续优化...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

人工智能开启气象预测新纪元

...基底模型ClimaX。研究团队利用5个基于物理学气候模型的输出数据对其进行了训练，随后对其进行了微调，使其执行更多任务。例如，该模型基于二氧化碳、二氧化硫、黑碳和甲烷水平等输入变量预测了全球平均地表温度、日温...……更多

2024-04-02 02:08:00人工智能,新纪元,气象,人工,智能,模型

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

...降幅达到97%。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下，目前国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业