【ディープラーニング自由研究】LSTM+Transformer モデルによるテキスト生成｜tanikawa

テクノロジーカテゴリーの変更を依頼記事元:

note.com/diatonic_codes

7 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

misshiki “筆者は、上記の弱点に対処するため、Transformer の Positional Encoding を LSTM に置き換えた LSTM+Transformer モデルを考案しました。...モデルの実装と実験を行ってみました。”

2020/11/13 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【ディープラーニング自由研究】LSTM+Transformer モデルによるテキスト生成｜tanikawa

Abstract• Transf ormer モデルをテキスト生成タスクで使用する場合、計算コストに難がある • 計算コスト... Abstract• Transf ormer モデルをテキスト生成タスクで使用する場合、計算コストに難がある • 計算コストを抑えつつ Transf ormer の予測性能を活かすために、Positional Encoding を LSTM に置き換えた LSTM+Transf ormer モデルを考案 • 生成にかかる時間を Transf ormer の約 1/3（CPU 実行時）に抑えることができたはじめにTransf ormer は現在の自然言語処理分野における代表的な深層学習モデルの1つです。さまざまなベンチマークを総なめにした Google の BERT とその派生系 (XLNet, ALBERT, etc.) や、OpenAI の GPT-2 など、最近の研究のベースにあるのが Transf ormer です。 Transf ormer の特徴として、LSTM などの従来の RNN にあっ

LSTM

ブックマークしたユーザー

jp-myk2020/12/27
chuhagle262020/11/13
misshiki2020/11/13
incep2020/11/12
gengohouse2020/11/12
boxheadroom2020/11/12

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx