italiano/quantization

quantization

1 visualizzazioniCommunity

Global

0—

#1·5d agoGlobalcasual

Ridurre i pesi di una rete neurale a precisione minore (float16 → int8 → int4) per farla girare su hardware più economico con perdita di qualità minima. Essenziale per LLM on-device.

Fonte: Slangora editorial — AI-translated from EN

È stato utile?

protein everything

quiet firing

← Lingue