Blog
西鳥羽です。こんにちは。
本日セミナーで「Deep Learningと音声認識」という内容で(ustreamで公開されているけども)社内セミナーで紹介させて頂きました。タイトルは前回の「Deep Learningと自然言語処理」に被せてます。
Broadcast live streaming video on Ustream
こちらがその資料になります。尚、セミナーでは「話し言葉コーパス」とすべきところを「書き言葉コーパス」としてしまっていました。資料では訂正してあります。
- ちなみにサーベイとしては以下のものを参考にしました。
Li Deng and Dong Yu, DEEP LEARNING: Methods and Applications - 岡谷貴之, 機械学習プロフェッショナルシリーズ 深層学習
また、個々の参照は以下の通りです。
- Hannun, et. al, 2014, Deep Speech: Scaling up end-to-end speech recognition
- Saon, et al., 2015, The IBM 2015 English Conversational Telephone Speech Recognition System
- Tachioka, et al., 2015, A Discriminative Method for Recurrent Neural Network Language Models
- Glaves, et al., 2006, Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks
CTC関数に関しては以下が詳しいです。Chainerで実装してますがちゃんと動くようになったら公開したいですね。