训练,模型,团队,速度,代码,华人头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...中更多的细节。2、视觉编码器部分，支持混合图片/视频训练，提升压缩重建性能视频生成模型中的视觉编码器，在压缩图片/视频数据，保留细节信息方面起着关键作用。混元团队自研了3D视觉编码器支持混合图片/视频训练，...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

智算领航，移动云携手伙伴共筑大国智能基座！

...每秒670亿亿次浮点运算），中心从投产即开始承接大模型训练任务，入选我国“2023年度央企十大超级工程”。大模型爆发为智算服务带来巨大的机遇和挑战，通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛，...……更多

2024-05-27 09:18:00基座,领航,大国,伙伴,移动,智能

首位AI科学家问世！已独立生成10篇学术论文，还顺手搞了AI

...。本研究探索了将强化学习应用于动态调整transformer模型训练中的学习率，使用验证损失和当前学习率作为状态，动态调整学习率以优化训练过程。结果在所有数据集上都优于基线模型，在训练时间上也表现出优势。第四篇，研...……更多

2024-08-14 09:40:00审稿人,学术论文,科学家,生成,独立,学术

Sam Altman 2023首次中国演讲：十年内将出现超级

...模型，团队目前主要使用来自人类反馈的强化学习来进行训练。而从从GPT-4完成预训练到部署，OpenAI花费了超过8个月的时间来进行这项工作。为了提出更好的监督措施，Sam提到，OpenAI最近发表的几篇论文，就尝试搞明白大模型运...……更多

2023-06-10 18:13:00人工智能,国际合作,中国,监管,人工,智能

GPT-4震惊四座，中国创业者激战“小模型” | Futur

...、有用户数据的小企业，已经基于国内外大模型的基座，训练出适配自身业务的小模型。而一家拥有百亿参数大模型储备的公司，也自行“瘦身”，针对金融、广告等领域，推出了轻量化的模型，以进行新一轮的数据储备。当下...……更多

2023-03-15 16:33:00创业者,中国,模型,创业,模型,企业

京东：推动大模型加快落地应用助力培育发展新质生产力

...发者可以更加专注于系统架构设计和关键程序开发……大模型行业应用前景广阔。根据《全球数字经济白皮书（2024年）》统计，目前，全球的人工智能大模型有1328个，中国的人工智能大模型达478个，约占全球数量的36%。在各类...……更多

2024-07-30 06:38:00京东,生产力,落地,模型,应用,生产

前瞻2024人工智能四大趋势

据消息人士称，OpenAI正在训练下一代的人工智能，暂名“Q*”（读作Q-star）。新的一年，OpenAI下一代产品可能发布数据瓶颈指的是可用于训练AI的高质量数据的有限性，合成数据有望打破这一瓶颈。除了对大量高质量数据的需求...……更多

2024-01-03 15:49:00人工智能,前瞻,人工,趋势,智能,量子

AIGC应用爆发，相关岗位需求增长超300%

...招人状态。招聘岗位涉及从底层算力、芯片设计，到模型训练、商业落地等多环节、全链条。招到一个生成式人工智能岗位的平均耗时是普通岗位的两倍。不仅是科技类企业，生成式AI由于商业应用广泛，人才稀缺也蔓延到了...……更多

2024-05-08 10:09:00岗位,需求,增长,应用,人工智能,人工

国内首个类chatgpt模型：复旦大学moss今日正式开源

...。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到，后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 MOSS来自复旦大学自然语言处理实验室的邱锡鹏教授团队，名...……更多

2023-04-21 22:51:00复旦大学,复旦,模型,大学,数据,模型

谷歌deepmind公布ai模型训练法

...消息，谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法，号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind（下同）据悉，FunSearch模型训练法...……更多

2023-12-16 02:20:00模型,训练,模型,问题,训练,研究人员

权威AI开源标准1.0版发布：Llama也不算开源

...，但人工智能系统包含传统许可未涵盖的元素，例如模型训练数据。现在，要使 AI 系统被视为真正的开源系统，它必须提供：可访问用于训练 AI 的数据的详细信息，以便其他人可以理解和重新创建；用于构建和运行 AI 的完整...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...Ascend与鲲鹏部门首席运营官汪涛表示，Ascend 910B AI芯片在训练性能上已成功超越英伟达A100 AI GPU达20%，缩小了与英伟达 A100 的差。除此之外，腾讯控股和百度等中国领先企业也购买了Ascend 910B芯片，主要用于会议任务。华为将把小...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

把GPT-4接入《我的世界》，科学家正在发掘AI的新潜力

...实现的目标还是在游戏之外，研究人员表示通过这种方式训练语言模型，将来或许可以使许多日常办公任务自动化，或者根据使用者提出的需求来自动实现某些效果。不过虽然前景美好，该项实验依旧还停留在初期阶段，想真正...……更多

2023-06-08 14:55:00接入,科学家,潜力,正在,科学,世界

Bengio团队提出多模态新基准，直指Claude 3.5和

...z/VCR （点击阅读原文即可直达，包含评用于模型评测和预训练的数据生成代码） Hugging Face 链接：huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务，研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D：无需训练的「图生视频」目标控制方法Moxin-7B：一个完全开源的大语言模型微软研究院：创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D：超快速文本到 3D 生...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

让大模型更具行业黏性

...强大的基础模型，之后再结合场景开展与业务结合的相关训练。为此，亚马逊云科技与美国人工智能企业Anthropic开展合作，对Claude 3系列模型进行训练。当前，该模型在复杂任务中表现出优秀的理解能力。但仅有基础模型还远远...……更多

2024-04-15 02:18:00黏性,模型,行业,模型,亚马,亚马逊

谷歌员工曝AI改进速度放缓，Gemini已成立新团队解决问题

...。回到谷歌本身，上述人士称，谷歌在投入了大量算力和训练数据，如来自网页的文本和图像后，并没有实现一些高管所期待的性能提升。当研究人员使用更多的数据和算力来训练模型时，过去版本的Gemini大模型改进速度更快。...……更多

2024-11-15 09:51:00立新,团队,员工,速度,问题,模型

ChatGPT能取代多少程序员？

...互能力极强，“它其实是用整个人类在互联网中的语调，训练成了一个大语言集合，可以想象它会开启一个使用自然语言和机器交互的新时代。”而作为曾经的技术人员，樊高也承认，⼤部分初级和重复劳动的工作都会被AI代劳...……更多

2023-03-04 09:53:00程序员,程序,程序,程序员,阿晨,工作

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...s & Insights from Multimodal LLM Pre-training》（MM1: 多模式LLM预训练的方法、分析和见解）中可以看到，MM1是一个图文的多模态大模型，参数规模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...tcome supervision）和过程监督（process supervision）两种方法在训练奖励模型上的效果。结果监督侧重于模型最终输出的正确性。而过程监督则关注模型在推理过程中每一步的正确性，能够指出答案中具体哪一步是错的：团队使用 GPT-4...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

人形机器人：通用之战和未解之题

...一到两年才能让人形机器人学会走路，现在利用 AI 算法训练一个月就可以实现。\" 传统人形机器人的训练算法，相当于是靠一些聪明的人类大脑去写一些数学方程式，然后去求解这个方程，制定机器人的运动轨迹。但这些方程...……更多

2024-04-30 23:00:00人形,机器人,机器,机器人,机器,人形

讯飞星火：致力于成为每个人的AI助手

...等痛点，iFlyCode2.0还可以提供企业定制优化工具，通过预训练和SFT训练，大幅提升代码推荐采纳率。AI有态度，“走出去”助力全球沟通无障碍今年杭州第19届亚运会举办期间，科大讯飞以讯飞翻译机深度服务亚运会。讯飞翻译机...……更多

2023-11-21 05:25:00讯飞,星火,助手,致力于,讯飞,星火

谷歌绝地反击：新模型部分能力超GPT-4，Bard将支持中文

...对PaLM2进行了介绍。皮查伊称，PaLM 2接受了100多种语言的训练，因此它在语言理解、生成和翻译上的能力更强，并且会更加擅长常识推理、数学逻辑分析。据介绍，训练PaLM 2的海量论文和网页中包含了大量数学和科学数据集，比...……更多

2023-05-11 23:00:00微软,绝地,中文,模型,能力,部分

从0到1：国产化千卡集群的一小步，AI算力主动权的一大步

...求关系紧张是产生算力焦虑的根源所在。一方面，大模型训练与推理需求呈几何级数爆发——自2022年以来，人工智能算力需求每3~4个月就翻一番，每年训练AI模型所需算力增幅高达10倍，而生成式AI使上升曲线进一步陡峭，未来...……更多

2024-04-28 11:52:00小步,主动权,集群,大步,主动,国产

Sora为何没能诞生在中国？

...员聂再清对《中国新闻周刊》解释称，OpenAI进行视频数据训练的一大“秘籍”，就是将不同尺寸、分辨率的视频拆分成patch（视觉补丁，相当于token），然后直接输入模型学习。OpenAI官方介绍，Sora可以采样宽屏1920x1080p、垂直屏108...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...提供API接口的闭源经营理念不同，LLaVA1.6的代码、模型与训练数据全开源，且在标准评测数据集上跑出了较为亮眼的成绩。一、LLaVA1.6：卷上加卷LLaVA是一种端到端训练的大型多模态模型，又被称为“大型语言和视觉助手”。LLaVa-...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

...破了 200+ stars！值得注意的是， LLM2CLIP 可以让完全用英文训练的 CLIP 模型，在中文检索任务中超越中文 CLIP。此外，LLM2CLIP 也能够在多模态大模型（如 LLaVA）的训练中显著提升复杂视觉推理的表现。代码与模型均已公开，欢迎访...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

现场直击一文总结！OpenAI开发者大会，史上最强GPT-4

...，比如帮助学习任何棋盘游戏的规则、帮助教孩子数学、训练写作或是设计贴纸，还可以与他人分享这种自定义的GPT。用户无需编写代码就可以创建自己的GPT，就像开始对话一样简单，只需要给GPT指令和新的知识，然后选择它能...……更多

2023-11-07 09:18:00一文,开发者,地震,大会,开发,用户

Nature：探秘世界最快超算 Frontier 的一天

...有 10 万张 H100 的 Colossus 集群，号称是世界上最强大的 AI 训练系统。而在这之前，截止到 2023 年 12 月，世界上运算速度最快的超算，是位于美国田纳西州橡树岭的 Frontier，也被称为 OLCF-5。Frontier 配备的是 AMD 的 CPU 和 GPU，有……更多

2024-09-18 09:52:00世界,研究,模型,研究人员,工业界,速度