灵机,模型,训练,过程,语言,运算符头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

史上最严中文真实性评估：OpenAI o1第1豆包第2，其它

新的大语言模型（LLM）评估基准对于跟上大语言模型的快速发展至关重要。近日，淘宝天猫集团的研究者们提出了中文简短问答（Chinese SimpleQA），这是首个全面的中文基准，具有“中文、多样性、高质量、静态、易于评估”五...……更多

2024-11-22 09:51:00豆包,中文,真实性,评估,模型,中文

为什么DeepSeek回答前总先“嗯”一下

...中尤为明显。当用户提出需要多步推理的问题时，AI语言模型生成填充词的概率会有所提升。这种模式与人类在烧脑对话中的表现完全一致——我们的大脑需要处理信息时，会不自觉地用填充词维持对话的连续性。通过模拟这种...……更多

2025-04-29 18:36:00人类,语言,对话,模型,自然,数据

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 20

...智元了解，字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向，团队规划了VAR为高优项目，投入研究小组和大量资源。除了VAR，团队还发表了LlamaGen等相关技术论文，新的研究成果也将在近期陆续放出。事...……更多

2024-12-05 09:47:00实习生,下巴,字节,实习,论文,模型

黄仁勋明天登港！沈向洋3小时重磅演讲：发布多款大模型，具身智

...粤港澳大湾区为窗口，深入探讨了全国及全球视角下的大模型算力趋势、具身智能、AI+编程、AI for Science、低空经济等热点议题。作为IDEA研究院创院理事长，沈向洋进行了近3小时的主题演讲，期间发布多个IDEA研究院创新成果，...……更多

2024-11-23 09:42:00重磅,碰撞,模型,小时,激情,智能

共赢生成式AI时代

...更前沿、更有价值的业务场景。第二是选择合理的工具和模型。生成AI无比强大,但模型和工具的选择也很多,企业需要根据业务和场景选择最适合的模型和工具,因为没有一个模型能够适用于所有场景。第三是数据战略。选择合适...……更多

2024-04-11 16:48:00生成,时代,陈晓,亚马,生成,亚马逊

大模型还能怎么创新？复旦教授邱锡鹏：需在新的架构、多模态等方

...目第31期，对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。嘉宾简介：邱锡鹏，复旦大学计算机科学技术学院教授，中国计算机学会会员，国内第一个对话式语言大模型“MOSS”负责人，曾获中国中文信息学会...……更多

2023-09-28 12:01:00复旦,模态,架构,模型,教授,方面

首个多模态连续学习综述，港中文、清华、UIC联合发布

...态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时，新的任务训练会严重干扰之前...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

chatgpt低成本复现流程来了

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需 1.62GB 显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch，单机训练速度最...……更多

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

ChatGPT张口就来的“病”应该怎么“治”？

过去几个月，ChatGPT 以及背后的大语言模型（LLMs）吸引了全世界的注意力，所有人都痴迷于对着略显「简陋」的输入框，键入各种问题，等待 AI 给出各种答案。ChatGPT 答案中知识的「深度」和「广度」令人们吃惊，但时不时地...……更多

2023-04-14 18:04:00幻觉,模型,数据,训练,语言,人类

腾讯钟学丹：人工智能成为汽车行业新质生产力推动数智化升级

...《AI驱动汽车“新智能”》的主题演讲，分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。腾讯智慧出行副总裁钟学丹钟学丹表示：“人工智能将作为新质生产力，推动汽车产业从数字化向数智化升级。”随着大模型技...……更多

2024-03-19 14:00:00智化,腾讯,人工智能,汽车行业,生产力,人工

生成式AI的抄袭输出问题值得关注（附图片）

...中均包含“screencap”。（图片来源：IEEE Spectrum）大语言模型（LLM）在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明，大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多

2024-01-11 06:45:00生成,输出,抄袭,问题,图片,输出

前谷歌工程师创业造AI芯片！产品明年问世，已拿到1.8亿融资

...MatX正在挑战英伟达在AI芯片领域的霸主地位，其为大语言模型训练而设计的AI芯片将于明年问世。这家公司的官网显示，使用MatX芯片，训练70B大模型的延迟将小于10ms/token。该公司还预言，使用其芯片训练，能够让世界上最好的...……更多

2024-03-30 11:11:00融资,芯片,工程师,创业,工程,产品

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度，并提升人工智能技术的综合应用效能的模式。上新了...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

ChatGPT席卷全球，内容产业最先被革命？

...挥生成式人工智能（Generative AI）作用，以及基于预训练模型技术的文学创作辅助算法领域进行探索。这一次，双方将AIGC技术扩展至了漫画、动画、视频等IP衍生业务领域的新型内容生产方式上，并将共建AIGC技术在文学创作领域...……更多

2023-02-20 17:00:00最先,革命,产业,内容,全球,人工智能

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

微软、英伟达纷纷押注小模型，大模型不香了？

...发展的道路上，科技巨头们曾经竞相开发规模庞大的语言模型，但如今出现了一种新趋势：小型语言模型（SLM）正逐渐崭露头角，挑战着过去“越大越好”的观念。视觉中国当地时间8月21日，微软和英伟达相继发布了最新的小型...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间，曾以一作身份，发表了关于模型微调的论文。（思维链作者Jason Wei同为一作）回到正题。在...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安

在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前，基于规则的系统长期以来是语言模型的主导范式。顾名思义，基于规则的系统就是依赖人类编码的规则来执行决策。这种方式构建的 AI 虽然简单，但在某些特定...……更多

2024-11-07 09:54:00定律,机器人,模型,规则,机器,安全

OpenAI提出用GPT-4代替人类审核网络内容：更快、判断

...以防止人类审核员遭受的精神损伤。·OpenAI承认，“语言模型的判断很容易受到训练过程中可能引入模型的不良偏见的影响。”“与任何人工智能应用程序一样，结果和输出需要通过让人类参与其中来仔细监控、验证和完善。”O...……更多

2023-08-17 17:08:00更快,一致,人类,内容,网络,策略

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-mo...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

北大字节VAR最佳论文、厦大清华亚军，NeurIPS 202

...可扩展图像），论文一作为田柯宇（此前因涉攻击内部大模型，被字节起诉）。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻！北大 & 字节提出 VAR 范式》。机器之心获悉，从 2023 年开始，字节商业化技术团队就...……更多

2024-12-05 09:47:00论文,清华,亚军,字节,北大,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

就在刚刚，Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍，Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

德国OpenAI加入开源大战！发布欧洲纯血版模型，曾获博世和

...VentureBeat报道，德国AI创企Aleph Alpha今日发布了两个大语言模型（LLM）。这两个模型各拥有70亿个参数，可以在多种欧洲语言中提供简洁、长度可控的响应，并已开源。该公司宣称，其模型的性能可以与其他在70亿到80亿参数量级的...……更多

2024-08-28 09:43:00博世,纯血,惠普,欧洲,德国,模型

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...其坚定信心及历史使命。以下为访谈实录：建立 “世界模型”触发机器人 “灵性”问：被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向，引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

华人团队爆火instructblip抢跑看图聊天

碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线，就已经被超越了。近来，华人团队开源了多模态基础模型InstructBLIP，是从BLIP2模型微调而来的模型。BLIP家族...……更多

2023-05-15 20:17:00团队,华人,指令,数据,模型,研究

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微

【新智元导读】谷歌DeepMind的小模型核弹来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型，又上新了！就...……更多

2024-08-02 09:55:00小钢炮,显微镜,大脑,模型,编码器,特征