推理,模型,极限,突破,学习,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里CEO吴泳铭：AI计算正在加速演进，成为计算体系的主导

...会变成智能机器人。5、未来几乎所有的软硬件都会具备推理能力，它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。6、过去一年，阿里云投资新建了大量的AI算力，但还是远远不能满足客户的旺盛需求。7、人...……更多

2024-09-19 13:53:00阿里,主导,体系,正在,世界,模型

大模型价格战谁会受益

...价值联系在一起，在他看来，大模型商业模式建立在用于推理的算力显著超过训练的算力，C（用户）端的推理成本显著低于获客成本，那时可能会产生新的商业模式，不会像现在在B（企业）端打价格战。创业公司和大公司、大...……更多

2024-07-08 00:43:00价格战,模型,价格,模型,价格,价格战

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

2024　ASC世界大学生超级计算机竞赛启动

...13日在上海大学举行的总决赛。预赛赛题主要聚焦大模型推理优化和渗流数值模拟两个技术领域。当前,随着大模型开发和应用的快速发展,对大模型推理性能和成本的优化受到业界重视。本届大赛的大语言模型推理优化赛题要求...……更多

2024-01-05 01:38:00竞赛,计算机,大学生,大学,世界,模型

一代更比一代强，AI 时代的至强如何为云服务保驾护航？

...，五代至强® 在相同功耗下的平均性能提升了 21%，而 AI 推理和训练性能的提升更是高达 42% 和 29%。一系列技术创新，使第五代至强® 可扩展处理器成为 AI 时代云厂商的基础设施关键角色。目前，已经有多家客户在实际业务中部...……更多

2023-12-26 10:08:00一代,时代,服务,英特,英特尔,处理器

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

...到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多个同类模型。包括国内千亿MoE模型 Skywork-MoE、传统MoE霸主Mixtral-8x22B 以及3140亿参数的Mo...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

中国科技创新“乘”数直上

...15家厂商的模型产品已经通过备案。凭借语言理解、逻辑推理、知识问答、文本生成等通用能力，这些大语言模型产品一经推出，便受到用户的欢迎。“科技创新实现新突破。讯飞星火认知大模型处于全国领先水平。”这是写进...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

...学习还能决策可以看到，Figure 01不管是在理解能力，还是推理反应都非常强大。团队特别强调，所有这些行为都没有经过远程操作，而是通过机器人自主学习。并且整段视频没有任何加速，也没有任何剪辑，全部一镜到底拍摄。...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...M类似的下一词预测（Next Token Prediction, NTP）进行预训练。推理时，模型可通过自回归生成任意长度的序列。模型结构：剑走偏锋的仅解码器结构不同于当下时序领域流行的仅编码器结构，Timer采用GPT风格的仅解码器Transformer。作...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

值得收藏！2023 年，你应该知道的所有机器学习算法~

【CSDN 编者按】经过数十年的演进，人工智能走出了从推理，到知识，再到学习的发展路径。尤其近十年由深度学习开启神经网络的黄金新时代，机器学习成为解决人工智能面临诸多难题的重要途径。然而，这一涉及概率论、...……更多

2023-01-25 13:00:00算法,机器,学习,算法,数据,学习

刘庆峰谈科大讯飞与华为合作：任正非高度重视，双方共同看好，非

...“心中有数”，也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。“国内大模型都有不小差距，那些说跟它差不多的，我觉得还是要更客观。要有科学精神，才能真正实现从追赶到超...……更多

2023-10-25 21:02:00讯飞,华为,双方,高度,合作,讯飞

智谱AI推出第三代基座大模型可在手机上部署

...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例，它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码，也可以成为程序员的帮手，让它帮助生成...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估