quantization
IT
1 visualizzazioniCommunityGlobal
0—
#1·5d agoGlobalcasual
Ridurre i pesi di una rete neurale a precisione minore (float16 → int8 → int4) per farla girare su hardware più economico con perdita di qualità minima. Essenziale per LLM on-device.
Fonte: Slangora editorial — AI-translated from EN
È stato utile?