推理,模型,能力,论文,社区,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...实现以超低成本进行量化。它支持多种压缩算法、模型和推理后端，具有强大的扩展性和全方位的评估能力。目前，研究团队已将使用方法放在GitHub主页上，戳文末链接即可获取。Llama3.1 更大也更难压缩低比特量化是解决资源受...……更多

2024-08-05 09:34:00工具包,模型,工具,模型,算法,工具

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...的「我在飞」，进一步询问的话，此外，video-SALMONN还能推理出男人的名字是「杰克」。我们都知道，正是这两句对白成就了这个经典场景，而video-SALMONN恰恰抓住了这个场景的精髓所在！再来一段《疯狂动物城》的动画片段：看...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。强化学习技术能够显著提升模型解决复杂问题的能力，尤其是在 o1 所采用的细粒度奖励机...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...技等也分别推出全新的大模型产品。李开复表示，大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段，今年会迎来“大模型应用爆发元年”。他同时预测，明年下半年，随着大模型推理成本的大幅度下降，人们...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

苹果公司公布“mm1”多模态大模型

...0亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...精度，还显著降低了计算负担，完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围：Time-MoE支持任意长度的输入和输出范围，能够处理从短期到长期的各种时序预测任务，实现了真正的全域时序预测。3. 全球最大...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效

...模型，赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力，实现 4D 空间中的交互和行动，走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作，以及自动驾驶、具身智能等物理空间的数据生...……更多

2024-10-30 09:54:00模型,世界,驾驶,场景,突破,效果

chatgpt低成本复现流程来了

...。相比原生PyTorch，单机训练速度最高可提升 7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量 3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...部署模型与人类交互，收集反馈信号用于训练。采用联合推理和数据共享策略，如将理解数据点转换为生成数据点。实验结果显示，耦合方法使模型性能大幅提升，理解准确率提高 19.48%，生成准确率提高 26.07%，且数据效率更高...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

NeurIPS 2024 | FaceChain团队新作，开

...脸表征模型 TransFace 后，FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作，FaceChain-FACT。继 TransFace 之后，FaceChain 团队最近被机器学习顶级国际会议 NeurIPS 2024 接收了一篇人脸表征学习新作， \"TopoF……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

... 的参数，并使用完整的绘画序列微调时间注意力 LoRA。在推理阶段，当从文本生成绘画序列时，ProcessPainter 不使用艺术品复制网络。在绘画过程重建和补全任务中，ProcessPainter 使用艺术品复制网络接收特定帧的参考输入。为了确...……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

...题通常需要复杂的领域知识、世界知识、精确计算和语义推理的组合。为了解决这一问题，该研究提出了 TAG 系统，其实现主要包含三个步骤：查询合成、查询执行和答案生成。TAG 模型很简单，但功能强大，由以下三个方程定义...……更多

2024-09-10 13:38:00自然语言,表格,生成,自然,语言,数据库

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...计算具备高算力低功耗的特性，能够加速AI大模型训练与推理。戴琼海提到，清华大学提出光电混合全模拟智能计算架构，研制ACCEL芯片，突破光电模数转换瓶颈。相比A100，ACCEL系统级算力提升3个数量级，能效提升6个数量级（百...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

阿里通义上新：AI终于能做真正的PPT了！还免费

...千问大模型2.5，相比上一版本，Qwen 2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，性能超越GPT-4 Turbo。在对长文档的支持方面，通义PPT支持1000万字长文档，包括PPT、PDF和网页。多模态方面，支持上传...……更多

2024-09-02 06:05:00通义,阿里,通义,模型,实时,效率

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

“3D视频版Sora”来了！

...，用户可任意指定摄像机角度。目前，SV4D可以通过一次推理，在约40秒内生成8个视图的各5帧视频，整个4D优化需要20-25分钟。该模型已在Hugging Face上开源，适用于游戏开发、视频编辑、虚拟现实（VR）等场景的应用，可免费用于...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...的开源模型，开发者及企业无需从头训练，即可直接用于推理，并可基于腾讯混元系列打造专属应用及服务，能够节约大量人力及算力。同时，各大模型研发团队均可基于腾讯混元模型进行研究与创新，加速行业创新步伐。据技...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

记者实测|速度更快成本更低，人机交互更自然，OpenAI新模

...代表Omni，也就是“全能”的意思。据介绍，GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的两倍，但成本仅为GPT-4 Turbo的一半，视频、音频功能得到改善。OpenAI CEO奥尔特曼（Sam Altman）在博客中表...……更多

2024-05-14 14:39:00实测,人机,更快,模型,成本,速度