• 我的订阅
  • 科技

十方融海率先开发出全球第一个免费使用开源可商业化中文大语言模型

类别:科技 发布时间:2023-07-03 18:14:00 来源:中国网

在人工智能领域,大语言模型正以前所未有的速度发展,已经成为众多企业、研究机构和个人开发者的新宠。十方融海作为以数字科技创新为展新引擎的数字职业在线教育科技企业,也将AI大语言模型作为公司科研创新主要发力方向之一,技术团队一直刻苦钻研,致力于提供开放、免费获取、公开下载、可离线部署的,具备真正认知能力和顿悟能力的大语言模型,并在多语言模型训练方面积攒了丰富的经验。

近日,十方融海集团旗下威科软件联合OpenBuddy团队宣布:领先业界推出了国内首个基于Falcon架构、可商用的中文跨语言模型——OpenBuddy-Falcon-7B。这也是全球第一个可免费使用开源的中文大语言模型,适用于大多数商业应用场景需求,且家用显卡也能轻松运行,为个人和企业提供更便捷、更全面的大语言模型智能化应用。

今年 5月,Tii研究机构发布了 Falcon模型,使用 Apache 2.0的可商用开源协议,Falcon模型不仅在协议和数据集方面更加开放,还采用了最新的 Flash Attention等技术,展现出了惊人的性能和内容质量。Falcon模型一经发布,便荣登 Huggingface Open LLM Leaderboard的首位,成为最新的 SOTA开源大语言模型。

十方融海在Falcon模型推出之初,便对其产生了浓厚的兴趣。十方融海技术团队深知,现有的 SOTA开源语言模型,包括 LLaMA和 Falcon,都存在“跨语言支持能力薄弱”这一问题。这些模型主要以英语、法语等印欧语系为基础,并且缺乏跨语言对话场景的深度优化。因此,它们在理解中文等非印欧语系语言方面存在困难,更无法进行有意义的对话。

对此,为了给个人和企业提供更便捷、更全面的大语言模型智能化应用,经过不懈的研究和试错,十方融海旗下威科软件联合OpenBuddy团队成功地掌握了 Falcon模型的训练诀窍,推出了全球首个基于 Falcon架构、开放可商用的中文跨语言大模型——OpenBuddy-Falcon-7B。

相较于原始Falcon模型,OpenBuddy-Falcon-7B在跨语言能力方面更具优势,支持包括中文、日语、韩语、英语、法语、德语等多种语言。

十方融海率先开发出全球第一个免费使用开源可商业化中文大语言模型

通过采用新颖的跨语言学习技术与深度优化对话场景,大幅提高了模型对跨语言知识的理解能力和融合能力,模型可以实现在各种语言之间进行自由、流畅的对话,并能在多种语言直接切换,完成翻译等需要跨语言能力的任务。

十方融海率先开发出全球第一个免费使用开源可商业化中文大语言模型

此外,模型具备插件使用能力,能分析用户的意图,自动选取并调用插件。例如,调用Stable Diffusion开源模型画图,调用内置的搜索引擎搜索资料等等;模型更是能够深度理解用户的需求,可以完成问答、写作、模仿、创作等多种任务,还可以完成“画一个车水马龙的街道”,“画一个丑小鸭长大后变成的动物”等复杂指令。

十方融海率先开发出全球第一个免费使用开源可商业化中文大语言模型

这并非十方融海首次推出中文大语言模型。事实上,十方融海技术团队已经在多语言模型训练方面积累了丰富的经验,早在falcon模型推出之前,十方融海联合OpenBuddy团队就曾在 LLaMA的 7B、13B、30B模型上进行了反复迭代和调优,研发出了OpenBuddy-LLaMA系列开源模型。这些模型在中文、日语、韩语等多种语言上具备优秀的问题理解和回答能力,可以利用英文论文、代码等资料学习到的知识,为中文问题提供专业的回答和见解。

作为跨语言模型,OpenBuddy-LLaMA系列在中文、日语、韩语等多种语言上具备优秀的问题理解和回答能力,也吸引了全世界众多开放模型爱好者的关注,llama.cpp、Langport、FastChat等开源项目均实现了OpenBuddy-LLaMA系列模型的集成,并在社区中获得了广泛的应用。

十方融海技术团队负责人表示,OpenBuddy-Falcon-7B的发布,标志着一个崭新的时代的到来。在这个时代里,跨语言的大模型不再是科技巨头的专利,而是开放、可商用的资源,能为全球的开发者、企业和研究者提供强大的支持。相信 OpenBuddy-Falcon-7B的发布,将对跨语言 AI领域的发展产生深远的影响,未来也有望见证更多基于 OpenBuddy-Falcon-7B的创新应用和突破性技术问世,共同推动人工智能领域的繁荣发展。

值得一提的是,目前除了 7B(70亿)参数的模型以外,OpenBuddy团队还在训练以13B(130亿)、40B(400亿)为训练参数的OpenBuddy-LLaMA-13B、OpenBuddy-Falcon-40B等百亿规模的大语言模型。

在十方融海董事长黄冠的带领下,十方技术团队在AI大语言模型上将持续取得创新和突破,在更好满足大众平等使用AI技术需求的同时,也让十方在新的AI大浪潮下走在前列。未来,十方将始终保持求是创新、拥抱变化的态度,为社会、为用户创造出更大的价值。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-03 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

威科未来上榜量子位“2023人工智能年度创业公司TOP20”
...开启落下注脚。在2023人工智能年度创业公司TOP20榜单上,十方融海旗下威科未来紧跟趋势积极拓展AI落地新场景,凭借在AI大语言模型领域取得的重大技术创新和研发成果,受到市
2023-12-18 10:28:00
十方融海上榜“2023年度广东人工智能风云榜”
...数字化能力建设及大模型落地应用领域的突出实力,深圳十方融海科技有限公司上榜“2023年度广东人工智能风云榜科技企业风云榜”。大会表示,入选本次风云榜的企业、机构及应用项目均具
2023-12-22 11:40:00
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...k-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型
2023-10-30 15:35:00
中国最强AI研究院的大模型为何迟到了
...数据进行了全面优化升级,训练数据中使用了更新的悟道中文数据,包括2021年到现在的,并进行了更严格的质量清洗;另一方面,增加了大量的高质量中文,包括中文书籍、文献等;此外还增
2023-06-11 16:00:00
百度一下,国产ChatGPT就来了
...展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。图/百度不过根据李彦宏的说法,由于生成式需要输入较长的文本和时间,不适合在现场实机演示,
2023-03-17 10:00:00
ChatGPT席卷全球,内容产业最先被革命?
...的情况。在近日举办的第十二届中国数字出版博览会上,中文在线集团董事长兼总裁童之磊,澜舟科技创始人兼CEO、世界级AI科学家周明博士,清华大学新闻与传播学院教授、元宇宙文化实验
2023-02-20 17:00:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
...大模型的商业化时代。成立120天完成开源+闭源大模型,中文能力已远超Llama?时间倒回至120天前。今年4月10日,沉寂一年多的搜狗创始人王小川正式对外宣布再度创业,选择人
2023-08-09 15:00:00
百度文心一言发布会详细纪要
...个是商业文案的创作,第三个数理逻辑的推算,第四个是中文的理解,第五个是多模态的生成。第一个例子,是文学创作。我们看一个有关《三体》的例子,先问《三体》的作者是哪里人,它先要知
2023-03-17 12:00:00
百度Q2迎来强劲增长,大模型、自动驾驶等领跑行业
...者。近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。清华大学新闻
2023-08-23 10:05:00
更多关于科技的资讯: