Slangora
日本語/ファインチューニング

ファインチューニング

JA
1 回閲覧Community
Global
0
#1·5d agoGlobalcasual

事前訓練済みモデルを、特定タスク・スタイル・ドメインのデータで追加訓練して挙動を調整すること。LoRA、QLoRA等の効率手法で2024〜2025年に民主化。

「Claude HaikuをサポートチケットデータでファインチューニングしたらBLEU+12。」
出典: Slangora editorial — AI-translated from EN
役に立ちましたか?