| QAT | SpinQuant | 量化模型 | Llama 3.2 1B | Llama 3.2 3B | Meta

Meta釋出Llama 3.2 1B/3B模型的量化版

Meta強調Llama 3.2 1B/3B在經過QAT與SpinQuant方法量化之後,除了大幅減少模型規模與記憶體使用量,同時提高速度、降低功耗,能夠在更多行動裝置上運作

2024-10-25