范式,推理,模型,阶段,两个,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...pic开发者关系主管表示，「计算机使用」是全新人机交互范式的第一步。同时也是，AI模型应该具备的全新基础能力。许多做浏览器智能体的初创公司，一夜之间过时了。网友们纷纷感叹：Agent和工作流都要变天了……会自己用...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

...大模型性能逐渐提升，AI应用创新正进入密集探索期，但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略，不仅是对当前市场的一次重大推动，更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...面的 leaderboard 榜单。同时我们也在评测集上实验分析了推理 scaling law、模型校准、RAG、对齐税等研究问题，后续本评测集都可以作为这些方向的重要参考之一。总之，我们希望 Chinese SimpleQA 能帮助开发者深入了解其模型在中文...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

ChatGPT已经慢了，这是国内AI搜索新高度，免费可用

...力。最近一两年，以 GPT 为代表的大语言模型催生了搜索范式的转变，无论是在原有搜索产品上的 AI 能力升级（如谷歌、微软），还是以对话式搜索为代表的 AI 新应用（如 Perplexity），搜索引擎与 AI 的融合已经被按下了「快进...……更多

2024-11-06 09:44:00高度,这是,搜索,天工,搜索,模型

NeurIPS 2024|水印与高效推理如何两全其美？最新理

... sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效果和生成速度上达到了现有最...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Moo

...学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构，提升了推理吞吐量。近日，为了进一步加速该技术框架的应用与推广，月之暗面 Kimi 和清华大...……更多

2024-11-29 09:22:00清华大学,清华,推理,架构,模型,联合

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...的任务对应套件，包含总结、感知（回忆、跟踪）、视觉推理（空间、时间、预测、因果、反事实）和导航（房间到房间、对象检索）任务，共18个子任务。其中，总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

大模型价格战“卷”向何方？｜深度

...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制，推理时只激活部分专家，以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2，就是其通过架构创新，实现了大模...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

学习“小样本” 练出“大智慧”（新知）

...据为基础，利用大量算力和存储进行数据“检索”，核心范式是深度学习。近年来，这类人工智能取得显著进展，诞生了以生成式人工智能为代表的热门应用。国际学术前沿追逐的另一个焦点是“小样本概念学习”，这一人工智...……更多

2024-04-29 06:24:00新知,样本,智慧,学习,人工智能,人工

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...hLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行反馈的开源检索增强框...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

商汤科技sensetime推出“云端边”全栈大模型体系

...的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

联想创投宋春雨：中国AI十年的错过与过错

...有停顿。他认为其中关键一环是在先后投资了旷视、第四范式、思谋科技等七十多家人工智能公司后，他们对于算力的重要性有了更早觉知。某种意义上，这是他们连续4轮加注AI芯片公司寒武纪的根源，也是在2021、2022年，就要...……更多

2023-11-27 15:12:00春雨,过错,中国,错过,春雨,模型

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...推出后，空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于今年3月起，研究团队与鹏城实验室深度合作，基于中国算力网“鹏城云脑II”枢纽节点，采用512张昇腾910显卡，历时数月攻关完成了在4亿张国产化...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

大模型价格战谁会受益

...价值联系在一起，在他看来，大模型商业模式建立在用于推理的算力显著超过训练的算力，C（用户）端的推理成本显著低于获客成本，那时可能会产生新的商业模式，不会像现在在B（企业）端打价格战。创业公司和大公司、大...……更多

2024-07-08 00:43:00价格战,模型,价格,模型,价格,价格战

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

1行代码改进大模型训练，Llama训练速度升至1.47倍，华

...任务的特殊性，训练过程采用了随机遮挡图像块并重建的范式，因此优化目标是最小化重建误差，而非通常的分类损失。作者对比了AdamW和C-AdamW的表现，即训练50轮后的最终重建误差，结果C-AdamW的误差为0.5926，低于AdamW的0.6085。...……更多

2024-11-28 09:58:00训练,模型,团队,速度,代码,华人

人工智能大模型陆续上线加速赋能产业发展

...会大范围落地，并且在适合的场景会逐渐形成典型的应用范式。最后，大模型仍然会面临一些长期的科学问题，如可靠、可控和可信问题，同时也会在大范围的落地过程中发现新的科学问题，这些问题需要政府、企业界和学术界...……更多

2023-10-17 07:35:00人工智能,产业发展,人工,模型,智能,产业

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval ……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型