Blog
海野です。
2011/09/21-09/22まで開催された、NLP若手の会第6回シンポジウム(YANS2011)で発表してきました。私の発表は、奨励賞に選んで頂きました。推薦してくださった皆様、ありがとうございます。
弊社からの発表は以下の2つです。後者の主著は東大佐藤さんです。
- 海野裕也, 岡野原大輔. N-gram統計量からの係り受け情報の復元.
- 佐藤一誠, 岡野原大輔. 簡潔なLatent Dirichlet Allocationの学習.
当日の私のポスターはこちらです。
N-gram統計量からの係り受け情報の復元 (YANS2011)
View more presentations from Yuya Unno
単語N-gramの統計量、つまりN単語の連接がどれくらいの頻度で出現しているかという情報のみから、特に複合名詞の(係り受け)構造を復元することができるのではないかと思って試してみた、という内容です。係り受け構造というのは、例えば「大規模分散処理」が「大規模処理」と「分散処理」から成り立っている、という構造のことです。内容以上に、当日のディスカッションが盛り上がりました。一口に文の「構造」と言っても、係り受け構造なのか、句構造なのか、あるいは文節単位、単語単位、文字単位。構文解析をやっていらっしゃる他の研究者の方々がどういうことを考えながら文の「構造」を考えているのかについて議論できたのが、個人的には大変意義がありました。
また、会議の前に開催された奈良先端未来開拓コロキウム: 自然言語処理の最前線では、弊社岡野原がパネリストとして登壇致しました。こちらはビジネス上の実問題に自然言語処理を適用する上で、どのような課題があるのかといった内容を話しました。