• 我的订阅
  • 科技

日本发布大规模语言模型

类别:科技 发布时间:2024-05-15 02:03:00 来源:每日看点快看

本文转自:科技日报

科技日报讯 (记者李杨)东京工业大学、日本理化学研究所及富士通公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。

“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语进行自然对话,并展现出在人文社会科学领域的能力。

面对全球范围内用于大语言模型计算的GPU短缺现状,此次研究团队选择使用富士通制造的CPU。通过提升“富岳”的计算能力,研究团队成功实现了完全基于CPU的AI学习。

“Fugaku-LLM”目前已向全球研究者和技术人员开放,以鼓励更多的专业人士参与到模型的进一步改进和新的应用研究中,旨在推动更多创新性研究和商业应用的发展。随着该模型的推广,预计将加速推动AI技术在各行各业的应用,尤其是在需要深度理解并运用日语的领域。

普通公众可在富士通的官网上免费下载并体验这一技术。这种开放的策略有助于提高公众对AI技术的理解和接受度,同时也可促进技术的广泛应用与可持续发展。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-15 06:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集
2024-09-24 22:07:00
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库
2024-09-30 09:51:00
大模型如何开始生成一个全新时代
...生成一个全新时代。大模型可以定义为大语言模型,具有大规模参数和复杂网络结构的语言模型。与传统语言模型(如生成性模型、分析性模型、辨识性模型)不同,大语言模型通过在大规模语料库
2023-07-07 04:46:00
...过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在考虑采用分级方法来监管生成式人工智能(A
2023-10-18 17:03:00
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...mer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models
2024-10-21 10:03:00
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供
2024-07-22 09:44:00
微软推出14b参数“最先进”小型语言模型
...以及训练后的创新,Phi-4在数学推理方面超越了同类和更大规模的模型。其在数学竞赛问题上的表现超过了包括GeminiPro1.5在内的多个更大规模模型。IT之家附有关基准测试
2024-12-14 00:08:00
...内出现了做通用大模型和做垂直大模型两条路径。算力、大规模数据、高成本人才成为大部分企业入局通用大模型的“拦路虎”。深度定制、广阔的场景应用,则催生了国内垂直领域大模型的开发。
2023-07-27 07:50:00
OPPO 小布助手将具备 AI 大模型能力
...RT也曾一度跃居中文语言理解测评基准CLUE1.1总榜第五名、大规模知识图谱问答KgCLUE1.0排行榜第一名。OPPO透露
2023-08-14 19:32:00
更多关于科技的资讯: