目次

2022_0501



異なる課題で微調整を行うための入力変換。 すべての構造化された入力をトークン列に変換し,事前学習されたモデルで処理し,線形+ソフトマックス層が続く。 (Radford, 2018, GPT 論文 Fig.1 より)

テキスト2テキストの模式図。 翻訳,質問応答,分類など,考えられるすべての課題で,モデルにテキストを入力として与え,モデルを訓練して何らかの 目標テキストを生成するように設定されている。 これにより,様々な課題で同じモデル,損失関数,ハイパーパラメータなどを使用することができる。 また,実証実験に含まれる手法の標準的なテストベッドにもなっている。 **T5** とは提案モデルを指し **T**ext-**t**o-**T**ext **T**ransfer **T**ransformer である。 Rafffel, 2019, Fig.1 より

2022_0410

… To Iwashita-sensei and Yoshihara-sensei with my respect