模型,参数,模型,训练,项目,上实头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

小米大模型：不搞军备竞赛

轻量级的模型亦有其存在的市场空间。2022年11月底，基于GPT-3.5的ChatGPT刚出来的时候，小米集团AI实验室主任、自然语言处理（NLP）首席科学家王斌给ChatGPT抛出一个问题：证明一下勾股定理。最终，ChatGPT给出了一个基于数学归...……更多

2023-11-08 18:13:00军备,小米,竞赛,模型,模型,小米

华人团队爆火instructblip抢跑看图聊天

碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线，就已经被超越了。近来，华人团队开源了多模态基础模型InstructBLIP，是从BLIP2模型微调而来的模型。BLIP家族...……更多

2023-05-15 20:17:00团队,华人,指令,数据,模型,研究

infini-attention：谷歌大内存机制

...歌大改Transformer，“无限”长度上下文来了。现在，1B大模型上下文长度可扩展到1M（100万token，大约相当于10部小说），并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中，拿下最新SOTA。这就是谷歌最新提出的...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

chatgpt低成本复现流程来了

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需 1.62GB 显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch，单机训练速度最...……更多

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

垂直大模型竞争，能突破数据“卡点”吗？

AI大模型火遍全球，中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐，市场正在分化为通用与垂直两大路径，两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多

2023-05-19 14:01:00模型,突破,竞争,数据,模型,数据

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...之心开源社区有福了。说到做到，马斯克承诺的开源版大模型 Grok 终于来了！今天凌晨，马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

oppo首个端侧应用70亿参数大模型findx7系列

...的首个听筒/免提双模卫星通话，首个端侧应用70亿参数大模型，首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列，为2024年旗舰手机树立全新的技术标杆，并为消费者带来刷新...……更多

2023-12-28 10:13:00模型,参数,应用,技术,模型,芯片

OPPO首个AI大模型！安第斯大模型AndesGPT发布

...举行了FindX7系列技术沟通会，在这次会议上，OPPO首个AI大模型——安第斯大模型AndesGPT正式发布。据官方介绍，AndesGPT具备功能全面、强大的生成式视觉模型，能够对图像进行精准语义理解，并在此基础上实现了对超过120类主体...……更多

2023-12-27 21:23:00安第斯,模型,模型,生成,图像,上实

复旦MOSS升级版开源上线

...昨天获悉，复旦大学自然语言处理实验室开发的新版MOSS模型已上线，成为国内首个插件增强的开源对话语言模型，支持搜索引擎、图像生成、计算器、方程求解器等插件工具。目前，相关代码、数据、模型参数已在Github、Hugging ...……更多

2023-04-22 05:44:00复旦,升级版,升级,模型,数据,对话

oppofindx系列三大技术突破

...方面。首先介绍的的是近期大热的AI，OPPO首个自助训练大模型平台——安第斯大模型正式亮相。据悉，全新的AndesGPT首次应用70亿参数的大模型，相比10亿大模型，同时更大的模型数据量，在AI处理的能力方面会更好，并且这次大...……更多

2023-12-28 02:13:00突破,三大,技术,模型,背景,技术

中科创达：已率先发布端侧运行130亿参数模型

中科创达：已率先发布端侧运行130亿参数模型【中科创达：已率先发布端侧运行130亿参数模型】财联社12月11日电，中科创达接受调研时表示，公司已经率先发布端侧运行130亿参数模型。充分利用模型压缩、分布式以及张量并行...……更多

2023-12-11 22:21:00科创,模型,运行,参数,科创,模型

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

多模态大模型是当下很火的一种创新技术，加快对多模态大模型技术的布局，可进一步提高金融服务效率，缓解行业发展困境。为了攻克创新技术领域的难题，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型

亚马逊开发史上最大文本转语音模型

...能研究团队宣布开发了一个据称是史上最大的文本转语音模型，该模型拥有最多的参数，并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文，详细描述了模型的开发和训练过程。近年来，像ChatGPT这...……更多

2024-02-18 12:49:00开发史,亚马,亚马逊,语音,模型,文本

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...受瞩目的热门话题。在若愚科技CEO孙腾看来，机器人是大模型最理想的落地载体和应用平台，大模型的引入彻底改变了机器人仅能在单一场景下执行单一任务的困境，使机器人智能化水平显著提升，变得更聪明，能够承担更复杂...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

百川智能、阿里云等进入开源大模型领域，开启商业化前奏

闭源商业化的“百模大战”暂告段落，开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后，基于该模型微调的大模型不断涌现。此外，阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B，国内8、9月份...……更多

2023-10-14 00:21:00百川,阿里,前奏,模型,领域,智能

商汤如何玩转大模型+大算力？详解“日日新SenseNova”

出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下，国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上，商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多

2023-04-14 14:00:00商汤,模型,体系,关键,模型,商汤

谷歌没开源的 PaLM，网友给开源了

...了。昨天，一位开发者在GitHub上开源了三种微缩版的PaLM模型：参数分别为1.5亿（PalM-150m），4.1亿（PalM-410m）和10亿（PalM-1b）。项目地址：https://github.com/ conceptofmind/PaLM这三种模型在谷歌C4数据集进行了训练，上……更多

2023-05-13 17:42:00网友,模型,训练,数据,生成,脚本