模型,测试,用户,代码,基准,尝试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Pika爆火，但AI视频还没到「GPT时刻」；首个GPT-4驱动的人形机器人；微软小模型击败大模型丨AI新零售早报

...PT时刻」》AI视频背后有两条技术路线，一条基于Transformer模型，另一条基于扩散模型（Diffusion model）。尽管AI视频技术取得进展，但还未达到真正的GPT时刻，即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多

2023-12-14 09:34:00模型,微软,人形,早报,机器人,机器

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

...营收上取得如此惊人的成绩？原来，它主攻的就是如今AI模型的一大软肋——对数据的巨大需求。我们正在进入LLM开发的第三阶段。第一阶段是早期的试验，从Transformer到GPT-3 第二阶段是规模扩展第三阶段是创新阶段：除了o1之...……更多

2024-09-26 13:37:00华裔,收入,突破,创业,数据,数据

AI圈卷疯了！xAI、Anthropic同日上线API：Gr

...。Anthropic的开发者关系运营负责人Alex Albert发帖说，「该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。」性能方面，Claude 3.5 Haiku可谓是表现不俗，已经在接近Sonnet的表现了。它在编程和代理任务上的表现也...……更多

2024-11-06 09:44:00公测,价格,模型,公测,价格,性能

Scaling Law瓶颈，Cursor编程为什么这么强？新

...者，该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题：Planning In Natural Language Improves LLM Search For Code Generation 论文地址：https://arxiv……更多

2024-09-12 09:47:00瓶颈,武器,秘密,编程,研究,模型

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将

...消息，美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊（Sundar Pichai）的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2016...……更多

2023-12-07 17:28:00人工智能,人工,深度,模型,智能,时代

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

最癫OpenAI爆料者竟是AI智能体？？CEO出来认领，网友

...满。不知疲倦一天24小时在线水贴，内容多是OpenAI下一代模型爆料消息，时准时不准……自从OpenAI奥特曼和草莓哥配合互（炒）动（作）过之后，不管你愿意不愿意看，推荐算法都会确保ta出现在你的时间线上。昨天，草莓哥声...……更多

2024-08-15 09:31:00爆料,智能,网友,草莓,斯坦,基准

Github Copilot 初体验

...rative Pre-trained Transformer 3）是一个用于处理自然语言的 AI 模型，由 OpenAI 训练开发。GPT-3 通过阅读几乎一切人类可阅读的内容来进行训练，理论上，它能够完成一切通过语言完成的工作，而且完成效果还非常接近人类。已经有实...……更多

2023-01-24 09:00:00体验,代码,提示,开发,生成,函数

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

LLM取代的第一个编程语言竟是SQL？网友吵翻天

...开源的桌面端程序，Prompt 的调试与管理工具，支持 OpenAI 模型、Claude、Google Gemini 等。从大模型出现以来，改变的不仅是文字、图片生成领域，还有编程领域。这些 AI 助手给句提示就能自主学习新技术、构建和部署应用程序、以...……更多

2024-08-28 09:43:00编程语言,编程,语言,网友,数据,模型

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

GPT-4最强对手出现！Claude-3 AI模型发布

...凌晨Anthropic公司宣布Claude-3正式发布，带有三个高性能的模型形态，并宣布在AI逻辑基准测试中超过了ChatGPT-4。可能国内的小伙伴很少知道Claude，这是一个在海外备受关注且用户基数较大的一个AI模型，其从诞生以来就一直与GPT相...……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代

让AI管理大型代码库，开发者福音 | 阿里/新加坡国立/西安

代码生成和补全任务做不完了？！不如试试让大语言模型（Large Language Models, LLMs）来帮忙。不过，如果是处理大规模、多文件的代码库，LLMs就可能犯了难。这时候，往往需要需要Retrieval-Augmented Code Generation（RACG）系统来检索相...……更多

2024-08-12 09:49:00西安交大,新加坡,阿里,西安,开发者,福音

GPT-4劲敌，谷歌进入高能+高产模式

...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

智东西6月3日消息，大模型“套壳”的回旋镖，这次扎到了美国科研团队身上。最近几天，斯坦福大学AI团队陷入抄袭风波，被质疑“套壳”清华系大模型开源成果，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...0%的Triton内核Pytorch最近发表了一篇技术博客，他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例，100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型，专为代码生成任务设计。仓库地址：……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

谷歌王者归来？最新推出的大模型到底有多强，能否挑战GPT-4

科技巨头谷歌推出了造势已久的新大模型，可以在移动手机上运行，并大幅降低计算成本。当地时间12月6日，谷歌公司宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型，被应...……更多

2023-12-07 18:27:00王者,模型,模型,视频,微软,测试

首个自主机器学习AI工程师，刚问世就秒了o1，Kaggle

...动化整个 ML 工作流程，节省数千小时工时。Open AI 的推理模型 o1，这么快就被比下去了？本周五，AI 社区见证了又一项突破：一个完全自动化机器学习流程的 AI 工程师，能轻松获得 Kaggle 大师水平，在参与的 50 个 Kaggle 竞赛上获...……更多

2024-11-19 09:48:00机器,大师,工程师,工程,学习,学习

$什么影响大模型安全？NeurIPS\'24新研究提出大模型越狱攻击新基准$

什么影响大模型安全？NeurIPS'24新研究提出大模型越狱

全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学（Guangzhou）USAIL研究团队，从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...成的博士论文代码，竟被 AI 在 1 个小时之内实现了。o1 模型已经强到，能够直出博士论文代码了！来自加州大学欧文分校（UCI）的物理学博士 Kyle Kabasares，实测 o1 preview+mini 后发现：自己肝了大约 1 年的博士代码，o1 竟在 1 小时...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...斯克旗下人工智能公司 xAI 于 3 月下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、.……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型