版本,实验,模型,测试,能力,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

全球首个！西电“玄知”密码大模型问世！

...，包含 10,000+道精编题目，实现能力边界精准探测。建立版本迭代流程，持续适配密码技术演进需求。在权威测评基准CryptoBench的全面评估中，玄知大模型（CryptoLLM）展现出全球领先的密码学专业能力：其综合性能超越当前最优...……更多

2025-08-20 09:45:00西电,模型,密码,全球,密码学,密码

Llama版o1来了，来自上海AI Lab，强化学习代码已开

...级算法，专注于数学奥赛问题，作为OpenAI草莓项目的开源版本。10月初，团队上传新论文，使用成对优化（不直接给出绝对分数，而是比较两个答案的相对优劣）提高Llama模型数学奥赛能力。在最难的AIME2024基准测试30道题中，原...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...行训练，可能在多语言或长上下文上表现不佳。在未来的版本中，作者计划包括对更多具有更长上下文的多语言数据集的训练。最后，这项工作一直以有监督的多任务方式训练FLAMe模型。探索RLHF和DPO等其他训练方法是未来工作的...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

更快、更强、更经济！港大开源大模型RAG系统LightRAG

...，同时具备对新数据快速适应的能力。在多个数据集上的实验表明，LightRAG在检索准确性和响应多样性方面均优于现有的基线模型，并且在资源消耗和动态环境适应性方面表现更优，使其在实际应用中更为有效和经济。随着大语...……更多

2024-10-15 09:57:00更快,模型,经济,系统,检索,数据

谷歌史上最强大模型！Gemini 2.0正式发布

...，开发人员便可在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用，而且该版本也已经在网页版中为Gemini Advanced开放试用，移动版后续也将推出。为了帮助开发者构建动态和交互式应用程序，谷歌还发布了新的Multimodal Live API..……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...作与炫酷特效》。今年 5 月份，豆包视频生成模型的早期版本开始在即梦 AI 上应用，收获了不少好评。现在又过去了几个月时间，豆包视频生成模型已经完成迭代升级，能力更是大幅提升，机器之心也测试体验了其最新版本。...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上，相较于现有方法具有显著的性能优势。随着近年来大型语言模型（LLMs）的迅速发展，学...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

神秘模型“小熊猫”一夜刷屏：排名超Flux、Midjourn

...厂，另一呼声来自Midjourney V7。Midjourney于8月1日发布了v 6.1版本，且官方一直透露正在测试V7，所以很多人猜测Midjourney有偷偷提前测试的可能。（匿名竞技场测试，很熟悉的配方了）还有人猜测是中杯Stable Diffusion 3.5，这是Stabili……更多

2024-10-30 09:55:00小熊猫,模型,模型,文生,生成,中国

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

...月28日，DeepSeek发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社区信息显示，Janus-Pro是去年发……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型

Sora泄露了三小时，网友调侃Altman急拔网线，艺术家们

...，这些泄露的 API 背后是速度更快的 Sora Turbo 版，更大的版本并未被泄露。正如 The Information 之前报道的那样，请求负载表明存在多个模型（提到「turbo」模型），以及不同的「风格」（Hugging Face 空间中使用的是「自然」风格） ...……更多

2024-11-27 13:39:00网线,艺术家,小时,网友,艺术,艺术

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...一方法的有效性，我们在多个公共数据集上进行了广泛的实验，这些实验涉及多种时空预测任务。实验结果一致显示，UrbanGPT 在性能上始终超越了现有的顶尖模型。这些成果证明了在数据标记较少的情况下，利用大型语言模型进...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

智能体首达Kaggle Grandmaster,华为结构化推

...，从而动态地、分步骤地解决问题。近日，华为诺亚方舟实验室、伦敦大学学院（UCL）和达姆施塔特工业大学的一个研究团队在这个研究方向上做出了自己的贡献。他们采用第一性原理方法，将数据的分析、处理和预测（即数据...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

Google 创始人谢尔盖·布林回归，直面 Gemini、G

...试一试。这应该会产生很大的影响。你们正在试用的这个版本Gemini 1.5 Pro，并没有在公众端的应用中，我们曾经的 Bard，并不应该有太大的影响，除了一个普遍的情况：如果你对任何 AI 模型进行彻底的测试，总会出现一些奇特的...……更多

2024-03-11 11:28:00谢尔盖,布林,谢尔,创始人,问题,布林

交通类 AI 项目预演阶段，本地化部署的一些新思路

...能化升级和物流的智能化转型。大部分应用场景仍在项目实验阶段。此阶段需要有效地平衡项目需求、成本和开发效率。在项目预演阶段中，通常小规模算力就可以满足需求。此阶段主要是对模型的可行性、架构设计的合理性以...……更多

2025-04-24 18:00:00思路,阶段,交通,项目,模型,交通

谷歌AlphaFold 3在《自然》杂志刊登：准确率超50%

...bs共同署名的论文，介绍了AlphaFold3，这是AlphaFold的第三代版本，全新的蛋白质结构预测系统能以前所未有的精度预测“蛋白质数据库（ProteinDataBank）”内几乎所有分子类型的复合物结构。论文称，AlphaFold3是一款革命性的系统。...……更多

2024-05-12 23:11:00准确率,自然,杂志,结构,蛋白质,蛋白

安兔兔评测pc版正式发布，欢迎大家下载体验

...兔官网以及各大渠道上线，欢迎大家下载体验。与Android版本测试流程相似，安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy（内存和存储）和UX（用户体验）四大项，通过模拟多种复杂场景最终得到电脑性能评分。另外，除了...……更多

2024-10-04 00:33:00评测,体验,测试,模型,处理,电脑

商汤科技与金山办公达成商业合作，“日日新”大模型补强办公软件

...试集HumanEvalCoding的测试中，日日新·商量大语言模型-通用版本（SenseChatV4）的一次通过率达到75.6%（GPT-4此项数据为74.4%），代码解释器则在数据分析场景下的数据测试集（1000+题目）中以85.71%的正确率超过GPT-4。基于商汤“日日新...……更多

2024-04-12 15:11:00商汤,办公,补强,金山,办公软件,理科

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab.……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

商汤科技发布日日新5.0大模型

...AIGC应用。在技术交流日，记者发现，这五大模型以全新版本全面亮相，其中一些局部能力甚至赶超GPT-4。大语言模型完成各种任务的基础，是能够理解用户提出的问题，并搞清楚文字背后的意图。许多中国的公司比较自研模型与...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

大语言模型逻辑推理“很糟糕”

...德”、Anthropic公司的“克劳德2”和元宇宙公司Llama的三个版本。例如，它们如何应对“比例偏差”？“比例偏差”指的是比起正确比例的方案，更倾向于元素最多的方案。一个盒子里有9个白球和1个红球，另一个盒子有92个白球...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：

...，研究团队采用了以下方法将数据集从英文扩展至多语言版本：1. 自动翻译：使用Llama 3.1 405B模型将原始英语指令翻译为中文、法语、俄语、印地语、西班牙语、意大利语和葡萄牙语七种语言。2. 人工校对：翻译结果经过语言专...……更多

2024-11-26 09:51:00多语,大比,基准,指令,任务,语言

OpenAI o1 模型 PlanBench 规划能力实测：

...确率为 62.6%）。在更具挑战性的“Mystery Blocksworld”加密版本中，传统模型几乎全部失败，而 OpenAI 的 o1 模型准确率达到 52.8%。IT之家附上报告图片如下：研究人员还测试了一种新的随机变体，以排除 o1 的性能可能源于其训练集...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

入职一年半，这个AI员工晋升为了国内首位AI架构师

...学习开发者大会上拥有了自己的中文名，并升级到了 2.5 版本。算起来，自 2023 年 4 月推出以来，文心快码已经是一位「练习时长快一年半」的 AI 程序员了。在岗这么长时间，文心快码现已支持了 C/C++、Java 等 100 多种编程语言...……更多

2024-08-09 09:37:00年半,晋升,架构,员工,快码,文心

马斯克xAI发布首款大模型；苹果发布M3芯片；ChatGPT

...平台实时访问信息，具有互联网浏览能力，还有一个本地版本，可以在特斯拉汽车上运行。OpenAI的联合创始人兼首席科学家Ilya Sutskever采访称，AI可能已经有意识，当前首要任务是研究“如何阻止超级AI的失控”。与此同时，被誉...……更多

2023-11-05 17:03:00马斯,马斯克,硅谷,芯片,模型,苹果

模型即服务，卓世科技MaaS平台 2.0 正式上线

...用效能的模式。上新了，上新了，卓世科技MaaS平台V2.0版本正式上线。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyRe

...图2所示，在同等RTX4090资源情况下对比(4卡)，SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s)；SkyReels-Infer版本具备更鲁棒的部署策略，支持用户级别显卡1卡-8卡的推理部署。图2丨推理生成544……更多

2025-02-18 11:13:00短剧,万维,昆仑,中国,格局,生成