输出,模型,结果,模型,博坦,知识头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

文生图参数量升至240亿！Playground v3发布：深

...息，标准做法是使用T5编码器或CLIP文本编码器的最后一层输出，或是结合倒数第二层的输出，不过，研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦，特别是使用解码器风格的大型语言模型时，具有更复杂的内部表...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...个简单的线性层将门控扩散卷积层和多层次关联注入层的输出进行整合，最终生成的时空依赖性特征表示为为应对可能在各种城市场景中出现的复杂情况，本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了

...些代码，以阻止返回某些结果。因此，你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失，它们太微小而无法保留。值得一提的是，团队提出了一种缓解此问题的策略。这种策略通过构建模块级别的显...……更多

2024-11-18 13:33:00模型,隐私,版权,记忆,内容,模型

中金公司信息技术部执行负责人王缅：金融行业做好客户服务的标准

...模，同时又要综合考虑算力和算法两个快速变化的变量对输出结果带来的不确定影响。此外，大模型的输出标准相对比较模糊，当前阶段存在模型'幻觉'，但是金融服务对于输出结果要求相对准确、严肃，两者之间存在一定矛盾...……更多

2023-12-08 20:29:00可通,中金公司,技术部,中金,标准化,模型

梦想当燃|浪潮云海若大模型团队：从“0”开始，前进不会止步

...局限性和实时性方面的问题，从而生成更准确、更丰富的输出结果。同时，团队也突破了提示工程技术，实现了精确引导大模型输出的能力，帮助大模型更准确地理解人类需求、生成更符合人类期望的结果。团队成员还突破了语...……更多

2024-05-08 09:08:00云海,浪潮,模型,团队,梦想,海若

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...GPU小时（105-107个），并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练（也称为第二阶段预训练）将使用全新的、未见过的领域数据进一步训练基础模型。这里，同样使用与初始预训练相同...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

大数据人工智能模型下未来教育的“六个转变”

...器学习将学习迭代后符合系统设置的指标体系标准的结果输出或存储，这就是机器学习的结果。因此，应用同一型号的学习机器在相同时空执行相同学习任务后的结果往往是一样的。人类学习则基于自己的偏好，蕴含更多情感，...……更多

2023-12-03 07:44:00人工智能,人工,模型,智能,数据,教育

让大模型“外挂硬盘”，百川智能发布新API系列，企业定制成本

...础上首创了Self-Critique大模型自省技术——以让大模型在输出答案之前“再自检”，给用户筛选出最优质的答案。最终结果是，将搜索增强知识库和超长上下文窗口结合后，模型“接上外挂”，就可以连接全部企业知识库以及全...……更多

2023-12-21 15:32:00百川,外挂,模型,成本,硬盘,智能

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...论在任何城市、时段、天气中，都能够保证无差别的功能输出，同时在遇到各类复杂的长尾场景时也能提供稳定出色的用户体验。其中，感知是最上游、最关键的能力。目前，视觉感知方案是市场和产品的主流需求。因此，基于...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

被认为国产AI之光的DeepSeek V3出糗：居然自称是C

...成本。于是乎，有人就开始怀疑了：它不会是在ChatGPT的输出基础上训练的吧？好巧不巧，Altman也发了一个状态，似乎在暗讽着什么……不过DeepSeek V3并非是第一个出现“报错家门”的大模型。例如Gemini就曾说过自己是百度的文...……更多

2024-12-30 00:40:00之光,国产,网友,模型,数据,训练

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...表示通过编码器frm中的MLP层可以获得：其中frm编码器将输出token表示的最大、最小、平均的池化级联到一个向量空间中作为新知识表示。然后连续prompt表示pkt可以被其他初始化的MLP层实现：最终知识检索仓库被从Kt-1更新到Kt基...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...好优化进行多轮对齐。并加入安全缓解数据，保障模型的输出既安全又实用。这在期间，模型所使用的高质量微调数据，正是来自合成数据生成技术——使用Llama 3.1模型在领域内图像的基础上过滤和增强问题答案，并使用奖励模...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

openai推出gpt-4turbo：比上代便宜三倍

...容易让模型调用Json和XML内容，使模型更容易返回一致的输出结果，从而实现可重复输出，对控制模型行为、编写模型单元测试内容有一定作用。GPT-4Turbo还支持图像输入，集成DALL・E3，可自动总结图片内容及带有图片的文档内容...……更多

2023-11-07 11:18:00上代,模型,开发,人民币,上下文,价格

新视角设计下一代时序基础模型，Salesforce推出Moi

...更细粒度的专业化：该方法为特定频率设计单独的输入 / 输出投影层，从而实现特定频率的模型专业化。作者认为，这种人为强加的频率级专业化缺乏普适性，并引入了一些局限性。（1）频率并不总是一个可靠的指标，无法有...……更多

2024-11-01 09:27:00时序,下一代,视角,模型,基础,设计

arxiv研究人员：多模态ai模型存在安全隐患

...户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了一个全新的“安全输入但不安全输出”（SIUO），涉及道德、危险行为、自残、...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大语言模型的长篇大论呢？要是输出长度长了但胡言乱语输出质量差，又臭又长，岂不是白搭?首先能想到的方法就是人工评...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...在多步骤推理中，它能将时间序列数据转化为具体的数值输出，供下一个推理步骤使用。3. 自定义模块生成器：在遇到用户提供的特定约束或外部知识时，TS-Reasoner会调用自定义模块生成器。该模块基于LLM解析用户的自然语言输...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...sformer 作为主干来参数化离散概率分布，并对 transformer 的输出应用 log-softmax 层进行归一化。因此，模型输出对数概率。在动作 - 值预测中，上下文大小为 79，而在状态 - 值预测和行为克隆中，上下文大小为 78。对于动作和状态 -...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

Kimi K2 + SunwayLink，让智能倍增释放

...一步扩展，适用于复杂业务场景。K2的JSON Mode确保结构化输出，完美适配企业级API交互需求。SunwayLink的企业应用集成能力得到进一步提升。② 长上下文优化128K上下文窗口结合SunwayLink的动态记忆管理，可处理超长合同、技术文档...……更多

2025-07-19 15:29:00智能,模型,能力,生成,智能,工具

2023内容科技应用典型案例：传播大脑科技（浙江）股份有限公

...识增强技术与外部知识库进行交互，以补充和约束模型的输出，从而提高信息的准确性和完整性。长文本建模技术：通过长文本建模和切片方式突破大模型输入限制，以适配媒体领域文章过长场景。提示工程：构建单步和多步的...……更多

2024-04-08 17:07:00传播,科技,典型案例,浙江,大脑,模型

到钉钉播种 AI 应用的，不只大模型厂商们

...柜 CIO 陈志永刚接触大模型时，还只是用来查资料并快速输出一些内容，他并不认为大模型会和自己的业务有什么实质交集。直到陈志永开始听说 AI Agent，能实现一些企业场景里的需求，AI 应用的种子开始在这家公司的「老问题...……更多

2024-07-01 09:23:00模型,厂商,应用,模型,场景,应用

大模型不会推理，为什么也能有思路？有人把原理搞明白了

...方程中的 x（如下表 9 所示）。研究者确保没有查询需要输出分数。并且，为了使 7B 和 35B 模型之间的结果更具可比性，他们对这两个模型使用了相同的斜率问题。对于 40 个事实问题，研究者确保模型一半回答正确，一半错误...……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

教育垂类大模型助力实现精准教学范式跃升

...够更好地理解教育领域特定的术语、概念和规则，保证了输出内容的专业性、可解释性及准确性。教育垂类大模型推动教育主体、模式和内容发生范式变革教育垂类大模型的应用和推广，能够推动教育的主体、模式和内容变革跃...……更多

2024-01-03 07:20:00范式,模型,教学,教育,教育,模型

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

...等应用开发工具。五重安全体系、上百种安全策略，保障输出内容合规可控。帮助企业快捷、高效、安全打造个性化大模型应用。未来，中关村科金将坚持探索前沿人工智能技术与千行百业应用场景的落地融合，帮助企业和开发...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

用过GPT-4 Turbo以后，我们再也回不去了

...，在 OpenAI 的博客中，其实说法是这样的：在某些格式的输出下，GPT-4 Turbo 会比 GPT-4 结果更好。那么总体情况会如何？在新模型发布的 24 小时内，就有研究者在 Aider 上进行了 AI 生成代码的能力测试。在 gpt-4-1106-preview 模型上...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试