模型,更新,模型,价格,得分,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

openai更新gpt-4turbo预览模型

1月27日消息，OpenAI近日发布新闻稿，在更新GPT-4Turbo预览模型之外，还下调API调用价格，优化现有模型性能，并发布全新嵌入性模型。OpenAI今天一口气宣布了5个新模型，包括两个文本嵌入模型、升级的GPT-4Turbo预览版和GPT-3.5Turbo...……更多

2024-01-27 20:36:00模型,更新,模型,价格,得分,性能

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

AI大模型或将在保险理赔受理等金融类场景应用

...、中关村科技园区管理委员会发布的《北京市人工智能大模型行业应用分析报告》（以下简称《报告》）显示，金融领域与AI大模型的结合点较多，目前AI大模型已经在保险售前、智能投研、招股书生成编写、智能研报合规审查...……更多

2024-05-27 06:38:00保险理赔,金融类,理赔,模型,场景,金融

连发两款模型“补课”，百度AI成色如何？

...杨锦没有发布会、没有李彦宏，百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1，免费。两年前的3月，百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品，也让外界看到百度相对迅速的先手布局...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型，阿里通义又上新！4月29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

用过GPT-4 Turbo以后，我们再也回不去了

...，OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型，和基于它的一系列应用，一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo，新的大模型更聪明，文本处理上限更高，价格也...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...题、增加候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：许多声称开源的AI模型，实际上在...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶A

...读】DIAMOND是一种新型的强化学习智能体，在一个由扩散模型构建的虚拟世界中进行训练，能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中，DIAMOND的平均得分超越了人类玩家，证明了其在模拟复杂环境中处理细节和进...……更多

2024-11-19 09:49:00模型,训练,小时,学习,世界,模型

DeepSeek的一次小更新堪比发布新模型

...， DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。模型参数 6850 亿，跟上一个版本的 V3 （ 6710 亿）相差不大，采用 MoE 架构，还支持了更开放的 MIT 开源协议。根据官方更新的版本说明， DeepSeek -V3……更多

2025-03-26 07:33:00堪比,模型,更新,模型,版本,生成

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

国产大模型打响“价格战”

本文转自：劳动报国产大模型打响“价格战”业内人士称今年迎来“AI应用爆发元年”■劳动报记者陈宁在刚刚结束的春季功能更新会上，OpenAI宣布了其最新模型GPT-4o，不仅性能有大幅提升，价格也下调了50%。据悉，这是去...……更多

2024-05-23 02:54:00价格战,模型,国产,价格,模型,价格

1行代码改进大模型训练，Llama训练速度升至1.47倍，华

只要改一行代码，就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者，提出了大模型训练优化器Cautious Optimizers。在提速的同时，Cautious能够保证训练效果不出现损失，而且语言和视觉模型都适用。...……更多

2024-11-28 09:58:00训练,模型,团队,速度,代码,华人

摩尔线程MTT S80发布一年有多大长进

...部署。目前，摩笔马良支持StableDiffusion生态，包括文生图模型、图生文模型、DeepDanbooru、TextualInversion、LoRA训练和推理、ControlNet系列模型、DreamBooth、图像超分模型Real-ESRGAN等。现在国内也有越来越多人开始接触AIG……更多

2023-10-30 09:39:00摩尔,长进,线程,摩尔,驱动,线程

主流显卡填新秀：RX 7650GRE综合性能超4060达20

...到DeepSeek相信大家都非常的熟悉，这一开源的人工智能大模型一经推出就受到了各界的关注。而与AMD关系密切的LM Studio也趁势推出了对DeepSeek大模型的加载。首先登入到lmstudio.ai/ryzenai，点击下方蓝色的图标进行LM Studio最新版本的...……更多

2025-02-14 11:15:00新秀,显卡,主流,性能,综合,测试

"股王"英伟达，在制造焦虑

...图：英伟达AI产品更新路线图就性能的升级对比，H200在大模型Llama和GPT-3.5的输出速度分别是H100的1.9倍和1.6倍，在高性能计算方面的速度达到双核x86 CPU的110倍。而到了GB200，与H100相比，可以将LLM推理工作的性能提高30倍，并将成...……更多

2024-06-20 12:52:00股王,英伟,焦虑,制造,英伟,苹果

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外

...iddenMath（内部保留的竞赛数学问题集）基准测试中，两种模型有约 20% 的显著改进，其中Pro版本以86.5%的成绩超过了o1-preview（85.5%）。除此之外，在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人员的反馈，这两个...……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

AI圈卷疯了！xAI、Anthropic同日上线API：Gr

...。Anthropic的开发者关系运营负责人Alex Albert发帖说，「该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。」性能方面，Claude 3.5 Haiku可谓是表现不俗，已经在接近Sonnet的表现了。它在编程和代理任务上的表现也...……更多

2024-11-06 09:44:00公测,价格,模型,公测,价格,性能

DeepSeek V3小版本大升级：推理、前端开发加强这些

快科技3月25日消息，今晚，DeepSeek官宣，DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。虽然是小版本更新...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

openai推出gpt-4turbo：比上代便宜三倍

...天的OpenAI首届开发者大会上，OpenAI推出了GPT-4Turbo，这款模型正处于预览状态，号称对于开发者而言“比上代GPT-4便宜三倍”。据悉，GPT-4Turbo支持128k上下文，输入价格比GPT-4便宜了三倍，速率限制翻倍，知识库更新到2023年4月，此...……更多

2023-11-07 11:18:00上代,模型,开发,人民币,上下文,价格

自动化、可复现，基于大语言模型群体智能的多维评估基准

...BZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners，以及……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

记者实测|速度更快成本更低，人机交互更自然，OpenAI新模

...搜索引擎，也未推出GPT-4.5或GPT-5，而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本，聚焦多模态和端侧应用。此前OpenAI公司CEO奥尔特曼（Sam Altman）就已经否认了公司将会发布GPT-5，他表示新版GPT非常“神奇”。...……更多

2024-05-14 14:39:00实测,人机,更快,模型,成本,速度

大模型厂商急寻PlanB：英伟达改良版芯片已调试华为等国产

...无相关回应。仍可以在国内销售的AMD MI 210则被认为在大模型微调阶段具有相当竞争力。“最近算力涨价太多，我们确实感到很吃力。”一家大模型创业公司人士告诉《IT时报》记者，他们迫切希望有Plan B方案。最好的Plan B当然是...……更多

2023-11-29 10:32:00华为,英伟,芯片,模型,国产,厂商

“AI考生”闯关高考，谁是最会做题大模型？

...报记者赵广立2024年全国高考的“硝烟”刚刚散去，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

4月大模型排行榜出炉，文心一言大模型居首

...来发展的重要力量。而作为人工智能的核心技术之一，大模型在深度学习、自然语言处理等领域发挥着举足轻重的作用。然而，面对市场上琳琅满目的大模型产品，究竟哪家大模型最强？日前，鸥维数据基于superCLUE整理新增了"...……更多

2024-05-15 02:51:00模型,文心,排行榜,模型,文心,人工智能

IBM宣布将更多人工智能模型开源；通义千问9款主力模型降价

NO.1 IBM宣布将更多人工智能模型开源5月21日，IBM宣布，将以开源软件的形式发布一系列人工智能模型。IBM称，在watsonx平台推出一年后，该平台将进行多项新的更新，并即将推出数据和自动化功能，旨在使人工智能对企业而言更...……更多

2024-05-22 20:20:00通义,模型,人工智能,主力,人工,智能

全面AIGC时代，豆包模型家族准备好了

AI时代，大模型更新的速度是多少？火山引擎的答案是：两个月。今年5月，火山引擎一口气推出了9款豆包大模型家族；紧接着，7月在「AI创新巡展」成都站中发布了豆包·图生图模型；9月24日，「AI创新巡展」深圳站中，豆包模...……更多

2024-09-26 13:49:00豆包,模型,家族,准备,时代,模型

国产大模型 DeepSeek-V3 开源：6710 亿参数自

...（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3 模型，用户可以登录官网 chat.deepseek.com，与最新版 V3 模型对话。IT之家援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同...……更多

2024-12-27 09:20:00模型,国产,参数,模型,缓存,价格