推理,模型,四季,背后,合同,关键头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

360智脑7b参数模型采用3.4万亿tokens训练

...AMBADA，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一，平均分为第三。在LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

商汤科技发布日日新5.0大模型

...法不准确。同时，它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现，得益于其最新发布的日日新5.0版本大模型。记者了解到，自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

大模型步入推理Scaling时代,SambaNova如何挑战

...震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外，更重要的是，它揭示了大模型...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

新鲜早科技丨谷歌发布AI基础世界模型Genie；苹果可能取消

...的大幅提升。同时，正不断提升一体化算力产品、训练及推理供给能力。联通和华为还签署了《无线网络OPEN API联合创新合作备忘录》。5、中国移动携手华为等产业伙伴发布裸眼3D产业推进倡议。MWC期间，中国移动携手中东的阿...……更多

2024-02-28 11:29:00电动车,模型,电动,生态,苹果,联合

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...Hot Chips 2024大会上，Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示，WSE-3依然是采用了一整张12英寸晶圆来制作，基于台积电5nm制程，芯片面积为46225平方毫米，拥有的晶体管数量达到了4万亿个，拥有90...……更多

2024-09-02 13:36:00晶圆,芯片,生成,模型,性能,参数

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

字节版Sora火爆24小时，同名论文再次被热议

...令描述了视频片段的主要场景尾帧图像指令（在训练和推理过程中可选使用）描绘了视频片段的结尾，并提供了额外的控制这里要插一句，与文本指令相比，图像指令更加直接且易于获取——使用真实视频帧作为训练中的图像...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

NVIDIA首秀Blackwell GB200超级芯片系统：

...性能方面只给出了一个数据：Llama 3.1 700亿参数大模型的AI推理性能对比H200提高了足足1.5倍。散热怎么办？NVIDIA透露正在开发热水散热系统，可以将耗电量减少28％。不过，NVIDIA仍然没有给出Blackwell GPU服务器的出货时间，估计在...……更多

2024-08-26 09:50:00推理,芯片,性能,系统,性能,服务器

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

华为harmonyosnext重塑全新“星盾”安全架构

...应用设计；PanguP系列，百亿级参数，为低时延、低成本的推理场景提供支持；PanguU系列，千亿级参数，适用于处理复杂任务，成为企业通用大模型的坚实基础；PanguS系列，万亿级参数，作为超级大模型，能够处理跨领域多任务，...……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

硅谷大模型“价格战”上演，一味“卷”价格会有未来吗？

...左右API“价格战”？在降价之外，有媒体指出，加快模型推理速度（即每秒生成Token的数量）也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗？硅谷在“拼”什么？5月中旬，字节跳动豆包以0.0008...……更多

2024-05-27 15:27:00硅谷,价格,价格战,一味,模型,模型

华为HarmonyOS NEXT搭配Mate 70系列

...一方面指为人工智能关键技术发展，尤其是大模型训练和推理提供可持续的算力，构建共赢的生态；另一方面是用AI增强华为产品和解决方案的竞争力。华为轮值董事长表示，HarmonyOSNEXT将提供纯粹而智能的本地体验。与此同时，...……更多

2024-04-18 16:18:00华为,华为,智能,消息,系统,战略

机器人多模态模型及双臂协作系统在川发布

...模态模型RRMM及双臂协作系统RTACS，该模型能使机器人理解推理抽象的语义指令，并调度双臂协作系统执行任务。此前，仅OpenAI等国外人工智能头部企业发布了类似成果。此次发布，标志着成都在我国多模态模型应用于人形机器人...……更多

2024-08-13 06:37:00模态,人多,双臂,协作,模型,机器

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能