日本語/ファインチューニング

ファインチューニング

1 回閲覧Community

Global

0—

#1·5d agoGlobalcasual

事前訓練済みモデルを、特定タスク・スタイル・ドメインのデータで追加訓練して挙動を調整すること。LoRA、QLoRA等の効率手法で2024〜2025年に民主化。

「Claude HaikuをサポートチケットデータでファインチューニングしたらBLEU+12。」

出典: Slangora editorial — AI-translated from EN

役に立ちましたか？