模型,测试,用户,代码,基准,尝试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

微软发布旗下最小语言模型phi-2

...会已拉开帷幕，微软在本次活动中发布了旗下最小的语言模型Phi-2，共有27亿参数，相比较此前版本有明显提升。注：微软于今年6月发布Phi-1，只有13亿代码，适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多

2023-11-17 14:00:00微软,旗下,模型,语言,模型,微软

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营

...、平台运营、企业提效和游戏智能体等方面,以及生成式AI模型Claude3在视觉能力、安全性、代码辅助等方面的优势。演讲重点介绍了亚马逊云科技如何通过Claude3等生成式AI模型,为游戏公司沐瞳科技提供高效的游戏运营解决方案,实...……更多

2024-04-16 18:17:00亚马,亚马逊,科技,生成,运营,体验

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

Llama 3.1 405B“最强模型”宝座还没捂热乎，就被砸场子了——Mistral AI发布最新模型Mistral Large 2，参数123B，用不到三分之一的参数量性能比肩Llama 3.1 405B，也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

Pika爆火，但AI视频还没到「GPT时刻」；首个GPT-4

...PT时刻」》AI视频背后有两条技术路线，一条基于Transformer模型，另一条基于扩散模型（Diffusion model）。尽管AI视频技术取得进展，但还未达到真正的GPT时刻，即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多

2023-12-14 09:34:00模型,微软,人形,早报,机器人,机器

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

...营收上取得如此惊人的成绩？原来，它主攻的就是如今AI模型的一大软肋——对数据的巨大需求。我们正在进入LLM开发的第三阶段。第一阶段是早期的试验，从Transformer到GPT-3 第二阶段是规模扩展第三阶段是创新阶段：除了o1之...……更多

2024-09-26 13:37:00华裔,收入,突破,创业,数据,数据

AI圈卷疯了！xAI、Anthropic同日上线API：Gr

...。Anthropic的开发者关系运营负责人Alex Albert发帖说，「该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。」性能方面，Claude 3.5 Haiku可谓是表现不俗，已经在接近Sonnet的表现了。它在编程和代理任务上的表现也...……更多

2024-11-06 09:44:00公测,价格,模型,公测,价格,性能

Scaling Law瓶颈，Cursor编程为什么这么强？新

...者，该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题：Planning In Natural Language Improves LLM Search For Code Generation 论文地址：https://arxiv……更多

2024-09-12 09:47:00瓶颈,武器,秘密,编程,研究,模型

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将

...消息，美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊（Sundar Pichai）的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2016...……更多

2023-12-07 17:28:00人工智能,人工,深度,模型,智能,时代

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

最癫OpenAI爆料者竟是AI智能体？？CEO出来认领，网友

...满。不知疲倦一天24小时在线水贴，内容多是OpenAI下一代模型爆料消息，时准时不准……自从OpenAI奥特曼和草莓哥配合互（炒）动（作）过之后，不管你愿意不愿意看，推荐算法都会确保ta出现在你的时间线上。昨天，草莓哥声...……更多

2024-08-15 09:31:00爆料,智能,网友,草莓,斯坦,基准

AI圈又炸锅了！Claude 4突然发布：连跑7小时不带喘气

...的复杂应用场景，这简直是革命性的福音！不仅如此，新模型还装备了强大的工具使用能力（目前尚处于Beta测试阶段），这意味着Claude 4学会了在需要时主动“调用工具”。当它在思考棘手问题、感觉自身知识储备不足时，可以...……更多

2025-05-27 22:27:00小时,能力,开发者,模型,用户,开发

Github Copilot 初体验

...rative Pre-trained Transformer 3）是一个用于处理自然语言的 AI 模型，由 OpenAI 训练开发。GPT-3 通过阅读几乎一切人类可阅读的内容来进行训练，理论上，它能够完成一切通过语言完成的工作，而且完成效果还非常接近人类。已经有实...……更多

2023-01-24 09:00:00体验,代码,提示,开发,生成,函数

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

LLM取代的第一个编程语言竟是SQL？网友吵翻天

...开源的桌面端程序，Prompt 的调试与管理工具，支持 OpenAI 模型、Claude、Google Gemini 等。从大模型出现以来，改变的不仅是文字、图片生成领域，还有编程领域。这些 AI 助手给句提示就能自主学习新技术、构建和部署应用程序、以...……更多

2024-08-28 09:43:00编程语言,编程,语言,网友,数据,模型

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

GPT-4最强对手出现！Claude-3 AI模型发布

...凌晨Anthropic公司宣布Claude-3正式发布，带有三个高性能的模型形态，并宣布在AI逻辑基准测试中超过了ChatGPT-4。可能国内的小伙伴很少知道Claude，这是一个在海外备受关注且用户基数较大的一个AI模型，其从诞生以来就一直与GPT相...……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代

让AI管理大型代码库，开发者福音 | 阿里/新加坡国立/西安

代码生成和补全任务做不完了？！不如试试让大语言模型（Large Language Models, LLMs）来帮忙。不过，如果是处理大规模、多文件的代码库，LLMs就可能犯了难。这时候，往往需要需要Retrieval-Augmented Code Generation（RACG）系统来检索相...……更多

2024-08-12 09:49:00西安交大,新加坡,阿里,西安,开发者,福音

GPT-4劲敌，谷歌进入高能+高产模式

...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

智东西6月3日消息，大模型“套壳”的回旋镖，这次扎到了美国科研团队身上。最近几天，斯坦福大学AI团队陷入抄袭风波，被质疑“套壳”清华系大模型开源成果，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...0%的Triton内核Pytorch最近发表了一篇技术博客，他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例，100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型，专为代码生成任务设计。仓库地址：……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟