量化 (Quantization)

模型量化(Model Quantization)就是透過某種方法將浮點模型轉為定點模型。 比如說原來的模型裡面的權重(weight)都是float32,透過模型量化,將模型變成權重(weight)都是int8的定點模型 (依照量化方式的不同)。

最后更新于