版本,实验,模型,测试,能力,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌终于赢了OpenAI一回：实验版本Gemini 1.5

...放出最强端侧 Gemma 2 2B 小模型后，刚刚，Gemini 1.5 Pro 实验版本 (0801) 已经推出。用户可以通过 Google AI Studio 和 Gemini API 进行测试和反馈。既然免费，那我们帮大家测试一下最近比较火的比大小问题。当我们问 Gemini 1.5 P……更多

2024-08-05 09:36:00版本,实验,模型,测试,能力,生成

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...据的时效性。目前已有UDK-VQA-240401-30、UDK-VQA-240816-20两个版本的数据集，涉及到的时间跨度分别是2024年4月1日-2024年4月31日和2024年8月16日-2024年9月5日。研究者在超过15个开源、闭源模型上进行了实验，包括GPT-4o、Gemini 1……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

ai实验室阿里通义将推出创新视频生成大模型

...次。回顾今年5月，在阿里云AI智领者峰会上，通义千问2.5版本正式发布，同时，其1100亿参数的开源模型在多个基准测试中表现优异。会上还宣布了原通义千问APP更名为“通义APP”，旨在整合通义大模型的全栈能力，向所有用户...……更多

2024-09-15 02:18:00通义,阿里,生成,实验室,模型,实验

开源大模型新的里程碑！Llama 3.1 模型准时发布

...Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本，分别是8B、70B和405B。从基准测试结果来看，超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任务中，Llama3.1405B得分9……更多

2024-07-24 12:13:00模型,里程,里程碑,准时,模型,伯格

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...完成了。他称，在大约 6 次提示后，o1 便创建了一个运行版本的 Python 代码，描述出研究论文「方法」部分的内容。虽然 AI 生成的代码框架，模拟了 Kabasares 实际代码功能，但它使用的是「合成数据」，并非真实的天文数据。论...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...的结果，测试领域包括 Blocksworld 和 Mystery Blocksworld（混淆版本），其中前者是在 600 个 3 到 5 个 blockBlocksworld问题静态测试集上运行的结果，后者是在 600 个语义相同但语法混淆的实例（称之为 Mystery Blocksworl……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

MediaTek携手阿里云在天玑移动平台完成通义千问大模型端

...，双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署，该部署可适配天玑8300移动平台，可实现离线状态下即时且精准的多轮人机对话问答。未来，双方将携手打造面向应用开发者和终端设备厂商的生成式AI软...……更多

2024-03-28 15:35:00天玑,通义,阿里,模型,移动,平台

Mamba再次挑战霸主Transformer！首个通用Mam

...升模型性能。性能评估使用lm-evaluation-harness包对新排行榜版本的所有基准测试进行模型评估，然后使用HuggingFace分数归一化处理评估结果。如下图所示，Falcon Mamba 7B获得15.04的均分，超过Llama 3.1 8B 13.41分和Mistral 7B ……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...的几K几十K，发展到了如今的百万token级别。Gemini的最新版本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗？毕竟100K已经相当于一部比较长的...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

智谱AI新大模型来袭：部署价格大降50%，免费商用，做应用能

...模型训练和部署方案。据智谱AI CEO张鹏介绍：ChatGLM3-turbo版本，也就是企业级部署版本，在最新AgentBench上测试后，其Agent能力已经接近GPT-3.5，不过与GPT-4还存在明显差距。△在最新AgentBench上，ChatGLM3-turbo版本的Agent能力智……更多

2023-10-28 14:00:00商用,模型,能力,应用,价格,模型

类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究

...两者之间的关系「划上了不等号」。该团队通过大规模实验发现 ——即便依照 Scaling Law 扩大模型参数与训练数据量，模型依然无法抽象出一般物理规则，甚至连牛顿第一定律、抛物线运动都无法领会。「视频生成模型目前就...……更多

2024-11-09 09:59:00模型,豆包,系统性,字节,规律,团队

三星990 EVO AI应用体验

...能效。在存储颗粒方面，三星990EVO搭载了经过改良的V6版本TLCNAND存储颗粒。单颗颗粒为1TB，高密度设计不仅提升了整体存储效率，还增强了数据的可靠性和耐久性。性能测试中，CrystalDiskMark空盘1GiBSeqQ8T1读写速度分别达到5081.52M...……更多

2024-10-27 22:03:00三星,体验,应用,三星,存储,性能

一块GPU都没用，苹果自研大模型干翻GPT-4？

...苹果发布iOS 18.1开发者测试版，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能：1、Siri升级。Siri唤醒后具备屏幕边缘发光特效，能理解用户表述不通顺的指...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

CMU&清华：让LLM自己合成数据来学习，特定任务性能同样大

...收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文主要作者来自清华大...……更多

2024-08-02 09:40:00清华,性能,任务,数据,学习,生成

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...官方博客显示，ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重，但仅限于非商业用途。仓库地址：https://huggingface.co/EvolutionaryScale/esm3-sm-open-v1/tree/main此外，ESM3与不同于模拟多种生物分子的……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外

...开发者可以通过 Google AI Studio 和 Gemini API免费访问。聊天版本还得再等等。不过也有网友发现了华点，虽然数学能力很强，但还是没有打败o1-mini以及o1完整版（94.8）。谷歌Gemini 1.5大升级此次更新的有两个型号：Gemini-1.5-Pro-002和G……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速

...准测试上进行训练，因为无法确定这就是用于训练该特定版本模型的数据集。项目地址：https://github.com/lm-sys/llm-decontaminator随后，他又进行了另一个测试——对于基准测试集中的每个问题，将问题字符串分成两半，然后在温度...……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

StableDiffusion原班人马新公司官宣！连发新模型

...黑森林团队正缓步提升API中FLUX.1 [pro]的推理计算能力。此版本可以通过Replicate和fal.ai访问；提供专用和定制的企业解决方案。 FLUX.1 [dev]：系列中杯。一个允许非商业途径使用的模型，开放权重、经过蒸馏。[dev] 直接从[pro] 中蒸...……更多

2024-08-05 09:38:00人马,绘画,格局,模型,公司,黑森林

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...大模型的智能水平。在前不久高考结束后，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日， OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

精准狙击Llama 3.1？Mistral AI开源Larg

...新了性能和服务成本的新标准。特别是在 MMLU 上，预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestral Mamba 的经验，在很大一部分代码上训练了 Mistral Large 2。Mistral Large 2……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

AI落地千行百业，存储痛点凸显，浪潮信息如何助力AI向实？

...领先。值得一提的是，本次MLPerf存储基准测试已升级至1.0版本，这一升级提出了哪些新的要求，浪潮信息又是如何凭借其技术积淀与整体解决方案，获得新版测试中的多项最佳成绩的呢？一、MLPerf测试迎升级，存储助力AI算天...……更多

2024-11-08 09:46:00浪潮信息,痛点,浪潮,百业,落地,存储

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

AI视野：OpenAI发布GPT-4Turbo；xAI推出P

...项目，可以实现图片、视频和直播的实时换脸。最新1.3.1版本更新提升了性能，速度，用户界面，并引入了高性能版本和面部增强技术。聚焦开发者微软研究员推LoRAShear技术:高效对大语言模型结构化剪枝微软的LoRAShear技术旨在...……更多

2023-11-07 15:42:00视野,工具,模型,生成,工具,人工智能

文生图参数量升至240亿！Playground v3发布：深

...E）相同，由于图像是二维的特征，所以研究人员探索了2D版本的RoPE：「插值-PE」（interpolating-PE）方法不管序列长度如何，保持起始和结束位置ID固定后，在中间插值位置ID，不过该方法在训练分辨率上严重过拟合，并且无法泛化...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...前的大模型和各种方法无论是在文本、视频、还是多模态版本的 MMToM-QA 上都表现较差，而 BIP-ALM 则展现了较好的结果。论文作者认为 BIP-ALM 得益于：(1)使用适用于不同模态信息的符号表示，(2)模仿人类心智推理的逆向规划方法...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

..._rephrase = M(P_system, P_eg, D_task, T)生成，其中M是ChatGPT的GPT-4o版本。图5（上）详细说明了P_system和P_eg的内容，以ScanRefer数据为例。通过使用sentence=和rephrase=的结构化提示，GPT-4o能够轻松遵……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

全模态对齐框架align-anything来啦：实现跨模态指

...的时间内，北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B，表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据