3-065
時系列データのキーワード抽出とその評価手法の提案
◎小林寛史・佐賀亮介(大阪府立大学)
コーパスの特徴を知るためにはキーワード抽出が有効である.しかし,コーパスの中に時系列情報が含まれる場合,従来手法では局所的な情報を持つ特徴的なキーワードが抽出されない可能性がある.一方,キーワードの抽出結果の評価にはテストセットが必要となるが,大規模なコーパスの場合,テストセットを作るのが難しい.そこで,本論文ではコーパス分割による局所的なキーワード抽出法を提案し,またテストセット作りを要しない評価指標により提案法を評価する.NIPSコーパスを用いた実験から,提案法は従来手法よりも特徴的なキーワードが抜き出せることができ,また,従来手法より有用であることが評価指標より確認できた.