我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
ZAKER科技7月24日消息,今日凌晨,Meta官方正式发布了Llama3.1模型。
本次Llama3.1模型共有三个版本,分别是8B、70B和405B。
从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。
在GSM8K任务中,Llama3.1405B得分96.8,高于GPT-4o的96.1和Claude3.5Sonnet的96.4。MATH任务成绩仅次于GPT-4o。这证明Llama3.1405B拥有很强的数学能力。
当然,Llama3.1模型的代码生成能力同样不俗。在评估Python生成的HumanEval和其它编程语言的MBPPEvalPlus测试中,8B和70B继续大幅领先同级别模型,但大参数模型上表现最佳的还是Claude3.5Sonnet。
从上述多项基准测试结果来看,Llama3.1模型的出现正在不断缩小开源大模型和闭源大模型之间的差距。
图源:网络
其中HumanEvaluation主要用于评估模型在理解和生成代码、解决抽象逻辑问题方面的能力。在与其他大型模型的竞争中,Llama3.1405B显得略胜一筹。
图源:网络
斯坦福大学计算机科学系和电子工程系副教授、人工智能实验室主任吴恩达(AndrewNg)在社交媒体上称赞"Meta和Llama团队对开源的巨大贡献"。他表示:"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。"
图源:网络
总的来说,Llama3.1模型有以下几个特点:
1.包含8B、70B和405B三个尺寸,最大上下文提升到了128K,支持多语言,代码生成性能优秀,具有复杂的推理能力;
2.从基准测试结果来看,Llama3.1超过了GPT-40125,与GPT-4o、Claude3.5互有胜负;
3.提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署;
4.提供LlamaStackAPI,便于集成使用,支持协调多个组件,包括调用外部工具。
图源:网络
最后,MetaCEO扎克伯格在今日长文中曾这样描述Llama3.1模型,"我相信Llama3.1版本将成为行业的一个转折点,大多数开发人员将开始转向主要使用开源技术,我期待这一趋势从现在开始持续发展……共同致力于将AI的福祉带给全球的每一个人。"
参考资料:
《赶超GPT-4o,最强大模型Llama3.1405B一夜封神,扎克伯格:开源引领新时代》
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-07-24 15:45:01
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: