模型,测试,用户,代码,基准,尝试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程，尝...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini，其最强大的TPU（张量处理单元）系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本，谷歌承诺其速...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

我用 Rust 改写了自己的C++项目：这两个语言都很折磨人

...一筹呢？构建速度和运行时性能对我来说非常重要。构建测试的周期越短，我编程就越高效、越快乐。我会不遗余力地让我的软件速度更快，让我的客户也越快乐。因此，我决定亲自试试 Rust 的构建速度到底怎么样，计划如下：...……更多

2023-01-24 12:00:00C++,两个,语言,项目,C++,小越

语言、机器人破壁，MIT等用GPT-4生成模拟任务，并迁移到

...能包含数十到数百个任务。如何解决呢？近年来，大语言模型在自然语言处理及各类任务的代码生成方面不断取得重大进展。同样，LLM 已经应用于机器人的多个方面，包括用户界面、任务和运动规划、机器人日志总结、成本和...……更多

2023-10-17 16:58:00机器人,生成,机器,任务,语言,世界

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

文｜王怡宁编辑｜邓咏仪尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面，Meta更新了编程模型Code Llama 70B，是Code Llama系列中规模最大，性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face，跑分接近GP...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题，可谓是绞尽脑汁。目前来看，合成数据或许就是大模型的未来，也成为业...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型。12月1日，三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通义千问大模型也升级到...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

meta推出全新开源大模型codellama70b

近日，Meta正式宣布推出全新开源大模型CodeLlama70B，据悉，CodeLlama70B在HumanEval基准测试中的准确率达到了53%，超过了GPT-3.5的48.1%，并且接近OpenAI的一篇论文（PDF）报告的GPT-4的67%，是目前评分最高的开源大模型。据CNMO了解，Cod……更多

2024-01-30 10:46:00模型,全新,代码,模型,开发者,生成器

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日，在2024商汤技术交流...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

又热闹了！OpenAI的加强版“Her”正式开放，压过了Ge

...gle，更确切地说，是Google今天刚刚更新的两款升级版Gemini模型：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。狙击方式简单粗暴：直接宣布万众期待的GPT语音功能今天起正式开放。两个小时不到，就双叒抢走了Google好不容易的高光时刻。我...……更多

2024-09-25 09:54:00升级,开放,生产,开发者,开发,模型

腾讯混元大模型批量上新：10秒生成AI图像，超过180个腾讯

揭开大模型“混元”的面纱两个月后，10月26日，腾讯混元迎来第一次“批量上新”，并且对外开放。首先，通过测试申请的用户，都能够在“混元”上画画了——从生成图像的准确度、美观度而言，如今混元搭载的“灵感”模...……更多

2023-10-29 10:13:00腾讯,接入,生成,模型,图像,业务

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外

...iddenMath（内部保留的竞赛数学问题集）基准测试中，两种模型有约 20% 的显著改进，其中Pro版本以86.5%的成绩超过了o1-preview（85.5%）。除此之外，在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人员的反馈，这两个...……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

下载次数破39万！CMU、Meta联合发布VQAScore文

【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

Mamba再次挑战霸主Transformer！首个通用Mam

【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天，阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...G42和软银集团。2.能力达到奥数金牌级，DeepMind几何推理模型登上Nature，这个叫AlphaGeometry的模型在国际数学奥林匹克（IMO）的30道几何题中做出了25道，这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

Google 创始人谢尔盖·布林回归，直面 Gemini、G

...谢尔盖·布林（Sergey Brin，以下简称布林）因为谷歌在大模型之战的大失利而亲赴前线，深入谷歌的大模型 Gemini的研发工作，继我们看到布林亲自给 Gemini 写代码、经常加班到凌晨的传闻之后，布林本人在 Gemini黑客松现身，对一...……更多

2024-03-11 11:28:00谢尔盖,布林,谢尔,创始人,问题,布林

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

9月5日，腾讯宣布推出新一代大模型“混元Turbo”，相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

自动化、可复现，基于大语言模型群体智能的多维评估基准

...BZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners，以及……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估