进一,模型,公司,模型,训练,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

马斯克打脸OpenAI！全球最大模型Grok-1开源

...nAI“反击”称，“当创始团队讨论以营利为目的的结构以进一步实现使命时，马斯克希望我们与特斯拉合并，否则他想要完全控制。马斯克离开了OpenAI，表示需要有一个与Google/DeepMind相关的竞争对手，而他将自己做这件事。他说...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...如何确保AI技术的公平使用和共享？这些问题都需要业界进一步探讨和解决。尽管s1模型的低成本训练引发了争议，但其背后的研究思路无疑为AI领域提供了新的思考方向。武汉人工智能学院一位资深研究人员向《科创板日报》记...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

对话国投智能滕达：将聚焦大模型技术应用、生成式人工智能和人工

...召开的“AI赋能产业焕新”中央企业人工智能专题推进会进一步强调了人工智能在推动产业发展中的重要作用，并明确指出中央企业要主动拥抱人工智能带来的深刻变革，将发展人工智能放在全局工作中统筹谋划。那么，国投智...……更多

2024-06-05 00:24:00人工智能,智能,滕达,人工,技术应用,生成

张云泉：集中力量，促进国产AI大模型发展

...辑顾佳贇算力建设能否及时跟上，成为AI大模型向各领域进一步渗透的关键因素。2024年8月21日，观众在北京世界机器人大会上参观（李欣/摄）以OpenAI ChatGPT为代表的通用人工智能的快速发展，预示着全球新一轮科技革命和产业变...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...预测，同时还不会显著影响输出的质量。基于这些观察和进一步的实验，云天励飞得到了一个结论：在图像生成方面，自回归（AR）方法并不比掩码式语言模型（MLM）差，甚至可能还更好一点。虽然在语言领域，AR 优于 MLM 已经...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

金融大模型观察

...究机构。这些应用产品是科技公司在开源大模型的基础上进一步开发完成的。金融机构更多的是采购科技公司提供的方案，也有一些探索是设计一些Agent用大模型来解决自己的研发能力的问题。高校等研究机构在做自己的开源模...……更多

2023-12-09 10:47:00模型,观察,金融,模型,金融,应用

大模型新趋势之MoE：现状、挑战及研究方向

...推进MoE广泛应用至关重要，但可能会损害模型性能，需要进一步优化并行预训练和推理策略。MoE未来重点研究方向1.通过优化MoE架构、改进门控算法等，提高模型性能和稳定性。一是业界正在加快研发各种新型MoE架构，以提升模...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...复杂问题并验证输出内容，代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出，借助“草莓...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...引用 / 定位训练。团队还进行了空间感知的负样本挖掘，进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时，往往表现出产生“幻觉”。对此，团队通过图像条件类别定位以及语义条件类...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知，并推动人工智能通用智能（AGI）的实现。五大特点全面超越昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

LLM训练通信量减少10000倍！全新分布式优化器，整合世间

...则每个节点只需上传2.8MB数据（接收数据不变），通信量进一步减少。另外，不对称性是有优点的，因为大多数消费互联网的带宽严重偏向于更高的下载速度。假设稳定的网速为100Mbps下载和10Mbps上传，则最坏情况下的延迟仅为下...……更多

2024-09-10 13:39:00训练,分布式,世间,整合,全新,通信

权威AI开源标准1.0版发布：Llama也不算开源

...素。行使这些自由的先决条件是能够对系统进行修改。再进一步，对于机器学习系统可修改的形式，OSI 也进行了定义。必须包含以下所有元素：数据信息：用于训练系统的数据的足够详细的信息，以便技术人员可以构建基本等...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...。这为构建轨迹基础模型提供了充足且丰富的数据支持。进一步，研究团队设计并预训练了 UniTraj 这样一个通用的轨迹基础模型结构，并集成了多种重采样和掩码策略，能够有效支撑不同区域、任务和数据质量的需要。论文地址...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

...区驱动的方式同样可以实现。他们的下一步计划是将模型进一步扩展到前沿规模，最终目标是实现开源 AGI。这一点在其在线 Demo 的模型选项中已有暗示 —— 其中包含开放推理模型甚至 AGI 和 ASI 的潜在选项。看起来这确实是一...……更多

2024-12-03 13:34:00三洲,欧亚,开发者,模型,流程,训练

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...此外，方言语料库的稀缺以及高质量标注数据的匮乏，也进一步增加了技术难度。巨人网络 AI Lab 的技术创新与突破为了解决上述难题，巨人网络 AI Lab 团队中的算法专家和语言学家共同努力，基于中国方言体系，构建了涵盖 20...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

全球首个亿级参数量的地震波大模型在蓉正式发布，年底公测

...测，同时十亿参数量级的版本预计2024年8月完成预训练，进一步为新时代防震减灾事业现代化提供科技支撑。强强联手发布全球第一个亿级参数量的地震波大模型成都数据集团党委副书记、超算运营公司董事长郭黎表示，2023年9...……更多

2024-07-29 09:29:00公测,地震波,地震,模型,参数,全球

Meta联合开发机器人AI模型，任务成功率达90%

...型能够教导机器人在全新的环境中完成基本任务，而无需进一步的训练或微调。研究团队训练了五个 RUMs，分别用于执行开门、开抽屉、拾取纸巾、拾取纸袋以及重新摆正圆柱形物体等任务。令人惊喜的是，这些模型在未知环境...……更多

2024-09-23 10:02:00成功率,机器人,模型,机器,任务,联合

中国智算建设潮背后，谁在推动十万卡集群

...总裁、百度智能云事业群总裁沈抖透露，为了支撑大模型进一步的高速发展，百度在打磨十万卡集群能力方面，已在两大问题上取得关键突破。与此同时，字节和阿里在智算上投入巨大，今年以来，华为也联合厂商在攻克更大规...……更多

2024-11-15 10:01:00万卡,集群,中国,背后,建设,万卡

人类和AI在推理任务中的表现相似，Google DeepMi

...题时，人们往往会错误地判定其无效。Google DeepMind的研究进一步揭示，大型语言模型也表现出类似的行为，在提示下能够表现出一致的逻辑推理，但也会受到“内容效应”的影响，即在处理与已有知识或信念相符的信息时，推理...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

...计算和传输。同时在计算流程中实现了高效的算子融合，进一步提升模型的训练性能。通信与计算重叠：由于MoE架构的专家之间需要大量通信，会影响整体计算效率。为此团队设计了“多维度的通信与计算重叠”机制，即在进...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

中广天择2024年发力视频语料业务建设AI模型训练的算料综

...坚持“稳中拓新”的基调，在稳固好基本盘的基础上，将进一步深化“文化和科技融合”，实现由内容制作公司向文化科技公司转型的高质量发展目标，在谋求转型中找到适合自己发展的“道路”。事实上，中广天择在运营音视...……更多

2024-05-01 11:24:00中广,语料,交易平台,模型,训练,业务

较传统采标方法降本80%，合成数据服务商「卓印智能」获天使轮

...性上具有独特的优越性，且随着AI技术的发展，优势将会进一步放大。目前，卓印智能选择先在场景复杂、数据需求大的领域切入市场，来完成早期的商业拓展，比如自动驾驶、工业等赛道。俞开文博士认为，比如在具身智能等...……更多

2024-05-31 13:59:00采标,服务商,融资,传统,天使,智能

百度云升级模型服务，百度版GPTs即日开放 | 最前线

...el as a Service）；在算力层，MaaS依赖的新型IT基础设施也将进一步在底层颠覆现有的云计算市场格局。而百度云对模型服务的升级，也主要围绕大模型、智能计算、AI原生应用开发新范式三个层面。1、在大模型层面，围绕建设模型...……更多

2023-12-21 14:31:00模型,升级,开放,服务,模型,应用

马斯克偏心 xAI，被曝挖走十多名特斯拉人才训练 Grok

... electrek 昨日（8 月 8 日）报道，埃隆・马斯克（Elon Musk）进一步向其 xAI 公司倾斜资源，目前已为其语言模型 Grok 聘请了十几名特斯拉员工，特斯拉公司股东因此提起诉讼。遭股东起诉马斯克在过去一段时间里，多次在公开场合...……更多

2024-08-10 09:42:00特斯,马斯,马斯克,特斯拉,多名,模型

激活数据价值！贵州：构建数据流通新生态培育数字产业竞争力

...通、数据资产投融，数据抵质押、担保、处置六大板块，进一步推动数据流通，产业升级和场景应用，为数据要素全国统一大市场打下坚实基础，全面推进数字经济的融通和发展。贵安华为云数据中心贵阳大数据交易所是全国第...……更多

2024-08-25 02:09:00数据,贵州,激活,流通,竞争力,生态

破解AI“胡说八道”，这家公司要给大模型投喂好原料｜产品观察

作者｜黄楠编辑｜袁斯来大模型今天所展示出的强大能力，源于背后海量数据，为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车，数据语料便是珍贵的“燃料”。其中，语料质量的提升对模型性能取得阶段...……更多

2024-07-30 00:59:00八道,模型,原料,观察,产品,公司

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...作者提出，可以应用「专家迭代」（expert iteration）方法进一步提升性能。具体来说，从初始的Lean-CoT模型M0以及初始数据集D开始，让M0对每个问题进行K次采样，每次采样都会产生一个证明轨迹 [(s0,t0,a0),(s1,t1,a1),⋯,(sn,tn,an)]，之后...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

中科大联合华为诺亚Entropy Law，揭秘大模型性能、数

...性能下降的潜在可能。这一预测通过随后的模型性能评估进一步得到证实。因此，entropy law 可以作为 LLM 训练的指导原则，无需在完整数据集上训练模型直到收敛，便可预测 LLM 训练失败的潜在风险。鉴于训练 LLM 的高昂成本，这...……更多

2024-07-23 09:41:00诺亚,华为,模型,性能,联合,数据

让人工智能模型训练提速10倍以上

...又将MDT版本升级，引入了一个更为高效的宏观网络结构，进一步优化了学习过程，同时通过采用更优的训练策略进一步加速模型的训练过程。实验结果证明，通过视觉表征学习增强对物理世界的语义理解，能够提升生成模型对物...……更多

2024-04-03 07:20:00人工智能,提速,人工,模型,训练,智能

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...准确率分数为 60.73、58.59 和 62.79。在 MMedC 语料库上进行进一步自回归训练后，也观察到性能的提升。具体来说，最终模型 MMed-Llama 3 与其基座模型 Llama 3 相比，表现出了显著的性能提升，在全量微调评估下，MMed-Llama 3（67.75）平...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模