• 我的订阅
  • 科技

微软研究院推出orca2llm

类别:科技 发布时间:2023-11-22 11:08:00 来源:浅语科技

11月22日消息,微软研究院(MicrosoftResearch)近日发布新闻稿,推出了相比较主流语言模型更小的Orca2LLM,不过依然可以回答一些复杂问题。

微软Orca2共有70亿和130亿两种尺寸,部分融合了Llama2LLM参数,通过融合定制的高质量合成数据,提供更准确、更优秀的合成数据。

微软研究院推出orca2llm

微软表示Orca2使用扩展的、高度定制的合成数据集进行训练。Orca2支持分步处理、回忆然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。

Orca2模型相比较Llama2和WizardLM等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解等方面更为优秀。

微软研究院推出orca2llm

微软表示:“我们的初步结果表明,Orca2的性能明显优于类似尺寸的模型。它还达到了与至少大10倍的模型相似或更好的性能水平,展示了为较小模型配备更好推理能力的潜力。”

微软研究院推出orca2llm

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-22 15:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...者简介本文第一作者陈三元是哈尔滨工业大学和微软亚洲研究院的联合培养博士,他从2020年开始担任MSRA自然语言计算组的实习研究员,研究兴趣主要是用于语音和音频处理的预训练语言
2024-07-25 09:34:00
微软发布phi-1.5全新预训语言模型
9月12日消息,微软研究院昨日发布了名为phi-1.5的全新预训练语言模型,共有13亿个参数,适用于QA问答、聊天格式和代码等等场景
2023-09-13 04:52:00
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...放创新生态。 值得一提的是,会上,北京通用人工智能研究院、中国信通院、北京大学、清华大学、中国人民大学、中国科学院自动化研究所、智源研究院、海天瑞声、智谱AI、腾讯、中国中
2024-04-28 11:00:00
微软:从“软件老大”到“AI帝国”
...这些模型,并将其部署到本地进行离线推理。此外,微软研究院还开发了Florence模型,允许用户分析和理解图像、视频和语言
2023-11-21 10:45:00
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
...至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??
2024-08-10 09:52:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...再比如,零一万物预训练负责人黄文灏来自智源人工智能研究院,曾担任健康计算研究中心技术负责人。加入智源前,他曾任微软亚洲研究院研究员,负责自然语言理解、实体抽取、对话理解以及人
2023-11-06 12:13:00
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...了香港中文大学多媒体实验室;2005年至2007年在微软亚洲研究院工作,担任视觉计算组主任;2008年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。汤晓鸥主
2023-12-18 22:02:00
微软加速AI变现:办公copilot 30美元/月,产品最高涨240%,接入Meta开源模型
...产业和生态发展的重要途径。国内也已是一大趋势,智源研究院的悟道3.0、百川智能的 Baichuan-7B和 Baichuan-13B
2023-07-20 01:00:00
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...」目标控制方法Moxin-7B:一个完全开源的大语言模型微软研究院:创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D
2024-12-13 09:19:00
更多关于科技的资讯: