グローバル・ドキュメント・アノテーションに基づくテキスト自動要約

PDF
長尾 確
名古屋大学 情報メディア教育センター
橋田 浩一
サイバーアシスト研究センター

概要

グローバル・ドキュメント・アノテーション(GDA)は、機械が文書の意味を推論するためのタグセットを提供する。それによって多用途で知的なコンテンツの作成を支援する。ここでは、そのようなタグ付きの文書の応用例の一つとして、文書の自動要約について述べる。この要約は、読者の興味や好みを反映することができ、従来の要約のように単に表層的な手がかりに基づいて計算されたスコアの高い文を抽出するのではなく、文の構成素ごとの重要度を活性拡散によって計算し、照応や省略を考慮した文生成によって、要約文書を生成する。この手法は、オンデマンドに要約を生成することができ、読者にとって最も適した分量に文書を調整することができる。この機能を組み込んだ要約ブラウザも紹介する。