推理,模型,能力,论文,社区,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...技等也分别推出全新的大模型产品。李开复表示，大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段，今年会迎来“大模型应用爆发元年”。他同时预测，明年下半年，随着大模型推理成本的大幅度下降，人们...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...精度，还显著降低了计算负担，完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围：Time-MoE支持任意长度的输入和输出范围，能够处理从短期到长期的各种时序预测任务，实现了真正的全域时序预测。3. 全球最大...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效

...模型，赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力，实现 4D 空间中的交互和行动，走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作，以及自动驾驶、具身智能等物理空间的数据生...……更多

2024-10-30 09:54:00模型,世界,驾驶,场景,突破,效果

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...部署模型与人类交互，收集反馈信号用于训练。采用联合推理和数据共享策略，如将理解数据点转换为生成数据点。实验结果显示，耦合方法使模型性能大幅提升，理解准确率提高 19.48%，生成准确率提高 26.07%，且数据效率更高...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

... 的参数，并使用完整的绘画序列微调时间注意力 LoRA。在推理阶段，当从文本生成绘画序列时，ProcessPainter 不使用艺术品复制网络。在绘画过程重建和补全任务中，ProcessPainter 使用艺术品复制网络接收特定帧的参考输入。为了确...……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

NeurIPS 2024 | FaceChain团队新作，开

...脸表征模型 TransFace 后，FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作，FaceChain-FACT。继 TransFace 之后，FaceChain 团队最近被机器学习顶级国际会议 NeurIPS 2024 接收了一篇人脸表征学习新作， "TopoFR……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

...题通常需要复杂的领域知识、世界知识、精确计算和语义推理的组合。为了解决这一问题，该研究提出了 TAG 系统，其实现主要包含三个步骤：查询合成、查询执行和答案生成。TAG 模型很简单，但功能强大，由以下三个方程定义...……更多

2024-09-10 13:38:00自然语言,表格,生成,自然,语言,数据库

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...计算具备高算力低功耗的特性，能够加速AI大模型训练与推理。戴琼海提到，清华大学提出光电混合全模拟智能计算架构，研制ACCEL芯片，突破光电模数转换瓶颈。相比A100，ACCEL系统级算力提升3个数量级，能效提升6个数量级（百...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

阿里通义上新：AI终于能做真正的PPT了！还免费

...千问大模型2.5，相比上一版本，Qwen 2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，性能超越GPT-4 Turbo。在对长文档的支持方面，通义PPT支持1000万字长文档，包括PPT、PDF和网页。多模态方面，支持上传...……更多

2024-09-02 06:05:00通义,阿里,通义,模型,实时,效率

AI搜索助手心流正式上线

...超大规模知识中融合学习，并通过知识图谱进行增强知识推理，高效回答用户的复杂问题。“心流在长文本评测实验中达到超过99%的准确率，具有非常优秀的长文本阅读能力。”据心流的技术人员介绍，在语义理解方面，心流的...……更多

2024-07-10 15:23:00手心,搜索,知识,能力,搜索,模型

记者实测|速度更快成本更低，人机交互更自然，OpenAI新模

...代表Omni，也就是“全能”的意思。据介绍，GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的两倍，但成本仅为GPT-4 Turbo的一半，视频、音频功能得到改善。OpenAI CEO奥尔特曼（Sam Altman）在博客中表...……更多

2024-05-14 14:39:00实测,人机,更快,模型,成本,速度

“3D视频版Sora”来了！

...，用户可任意指定摄像机角度。目前，SV4D可以通过一次推理，在约40秒内生成8个视图的各5帧视频，整个4D优化需要20-25分钟。该模型已在Hugging Face上开源，适用于游戏开发、视频编辑、虚拟现实（VR）等场景的应用，可免费用于...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...次采取扩容等措施保证流量异常增高后的稳定，这对Kimi推理算力、成本等也构成挑战。实际上，长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示，很多大模型仅停留在长度和简单...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

李飞飞空间智能之后，上交、智源、北大提出空间大模型Spati

...度的分布，猜测其中可能包含的物体；空间关系理解和推理；机器人场景理解：描述 Open X-Embodiment 和本文收集的机器人数据中的场景、包含的物体、可能的任务，并人工标注物体、机器人的 bounding box。空间关系理解Open X-Embodim...……更多

2024-08-08 09:39:00空间,北大,模型,智能,深度,模型

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

...果比较有限。因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？他们设计了一组实验，使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法：（1）迭代自我修订：让模型多次尝试回答一个问...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...I正在壮大。能力一览11B和90B这两款模型，不仅支持图像推理场景，包括图表和图形在内的文档级理解、图像描述以及视觉定位任务，而且还能基于现有图表进行推理并快速给出回答。比如，你可以问「去年哪个月销售业绩最好...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

苹果黑科技将彻底改变iPhone 已有重大进展

...已经攻克了其中的重要技术挑战，可以最大限度减少AI在推理过程中，对于闪存和内存的占用，从而将推理延迟降低了4-5倍。而且，如果将其运行在GPU上，那么加速效果将提升20-25倍。一旦实现，就可以让智能手机真正部署大语...……更多

2023-12-24 19:50:00进展,苹果,科技,语言,智能,论文

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...外，HuggingFace上还发布了7B模型的指令微调版本，在数学推理任务GSM8K上的性能实现大规模提升，分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本，1.4B版本也同步上线。神奇的是，训练数据量相比7B版本不……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据