刚刚,EMNLP 2024最佳论文奖新鲜出炉!5篇中榜论文中,华人学者参与三篇,分别来自CMU、上海交通大学、中国科学院大学等机构。其中,Pretraining Data Detection for Large Language Models: A Divergence-based Calibra……更多
...量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形式的存储,而BitNet b1.58将其统统变成了三进制,也就.……更多
..., Media」选项卡下,选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。二者打通之后有多方便呢?以直达「Hugging Face 论文」为例,在找到这篇论文后,点击「View on Hugging Face」,你就直接来到了 Hugging Face 的论文评论区..……更多