事前訓練済みモデルを、特定タスク・スタイル・ドメインのデータで追加訓練して挙動を調整すること。LoRA、QLoRA等の効率手法で2024〜2025年に民主化。
「Claude HaikuをサポートチケットデータでファインチューニングしたらBLEU+12。」