A Support System for Writing Technical Documents Based on Reference and Quotation of Internal Elements of Digital Contents

Tatsuo TANASE
Graduate School of Information Science, Nagoya University
Shigeki OHIRA
Information Technology Center, Nagoya University
Katashi NAGAO
Graduate School of Information Science, Nagoya University

abstract

1 はじめに

研究成果を論文執筆により社会に公表することは、研究者にとって重要なタスクであり、執筆を行うまでに長期にわたる研究活動を行っている。しかし、研究活動において蓄積された情報は膨大であり、それらの蓄積された情報すべてが執筆の際に必要な情報とは限らない。そのため、特に論文執筆の経験が浅い学生などの場合、それらの膨大な情報から必要な情報を頭の中だけで整理することが困難であり、論文を執筆するハードルは非常に高いと考えられる。

そこで、本研究では、論文執筆に必要な情報は、研究活動において記録される論文・研究ノート・発表資料などのデジタルコンテンツ(以下コンテンツ)に含まれると仮定し、論文執筆時にコンテンツの中から執筆に必要な部分を容易に検索・参照・引用する仕組みを著者に提供することで、論文執筆に必要な情報の可視化を行い、執筆作業の効率化を実現することを目指す。

2 研究活動におけるコンテンツの記録とアノテーションの獲得

初めに、論文執筆時のコンテンツの検索・参照・引用を実現するために、我々の研究室で研究・開発されている仕組みについて説明する。

2.1 コンテンツの記録・蓄積

我々の研究室では、日々の研究活動の中で、作成・閲覧されるコンテンツを記録・蓄積する仕組みを実現している。具体的には、文献調査のために閲覧された論文、自身の研究内容をまとめたノート、発表資料として作成されたプレゼンテーションスライド、説明のために作成された画像や映像のすべての情報を研究室のサーバに保存する仕組みであり、保存されたコンテンツは、様々なデバイスからアクセス可能となる。

2.2 コンテンツアノテーションの獲得

我々の研究室では、研究活動の中でコンテンツに対するアノテーションを獲得する研究も行ってきた。アノテーションとは、コンテンツの全体あるいはその部分に対して関連付けられるメタ情報であり、 アノテーションを獲得することで、コンテンツの管理・検索などの応用を実現する研究が盛んに行われている[?][1]。

まず、適切なアノテーションの記述を実現するために、コンテンツの部分要素を定義する。部分要素とは、論文や研究ノートなどのテキスト文書であれば、章や段落、文章といったレベルの要素を指し、画像や映像であれば特定の矩形範囲や時間区間を指す。我々は、コンテンツの部分要素に対し、固有のURI(Uniform Resource Identifier)を割り当てることにより、それらの要素に対するアノテーションの付与を可能にしている。具体的に開発されたアノテーションを行う仕組みとして、論文の部分要素に対して、コメントやタグなどの付与が行える仕組みや、映像の特定の区間に対してコメントを付ける仕組みなどがある。

さらに、我々は、コンテンツの部分要素の参照・引用をしながら新たにコンテンツ作成が行える仕組みを実現することで、コンテンツの部分要素間のリンク情報を獲得してきた[2]。

部分参照・引用の実現によるリンク情報の獲得

Fugure1: 部分参照・引用の実現によるリンク情報の獲得

コンテンツ(の部分要素)の参照・引用とは、閲覧した論文や自身の過去の発表資料の一部の文章や画像を参照・引用して新しいノートやプ レゼンテーション資料を作成することのような日常的に行われている行為である。部分参照・引用の情報を収集・蓄積することで、図1のような、コンテンツの部分要素をノード、部分要素の参照・引用時に得られるリンク情報をエッジとするグラフ構造データを獲得することができる。このようなグラフ構造は、どのようにしてそのコンテンツが作成されたのか容易に知ることができるため、コンテンツを検索する際に非常に有用な情報となると考えられる。

本研究では、これらのタグ・コメント情報とリンク情報を論文執筆時のコンテンツの検索に活用する。

.

3 論文作成支援システムTDEditor

研究活動の中で記録されたコンテンツの検索とそれらのコンテンツの参照・引用の機能を持つ論文作成支援システムTDEditorを開発した。

システム全体図

Fugure2: システム全体図

TDEditorのシステム全体図を図2に示す。本論文では、論文、プレゼンテーションスライド、研究ノート、画像、映像の5種のコンテンツを検索する仕組みを実現している。TDEditorはWebアプリケーションとして動作し、コンテンツを検索する際は、各コンテンツのサーバにリクエストを送り、コンテンツの情報をアノテーションの情報と共に取得する。ユーザは検索したコンテンツを参照・引用しながら論文を執筆する。TDEditor上で作成された論文は、そこで蓄積された部分参照・引用の情報とともにデータベースに送信される。

3.1 参照・引用するコンテンツの検索

図3に、論文に参照・引用するコンテンツを検索するためのインタフェースを示す。図3の画面には研究活動の中で、閲覧・作成してきたコンテンツのタイトルが、著者や閲覧・作成日時と共に一覧で表示されている。コンテンツの種類ごとによる分類やキーワードによる検索も可能である。また、コンテンツのタイトルにマウスカーソルを当てるとインタフェース下部の領域に、ユーザが研究活動時に行ったアノテーションを付与した部分およびその前後の一部の情報が表示される。論文の場合は、ユーザがタグ・コメントを付与した部分のテキスト及びその近くにある画像(ない場合は省略)が表示され、スライドや映像などの場合は、アノテーションが付与された部分要素のサムネイル画像が表示される。これにより、ユーザは、コンテンツの内容を大まかに把握することができる。

コンテンツ検索インタフェース

Fugure3: コンテンツ検索インタフェース

論文構成へのコンテンツの関係付け(左)とコンテンツの詳細表示(右)

Fugure4: 論文構成へのコンテンツの関係付け(左)とコンテンツの詳細表示(右)

コンテンツのタイトルをクリックすると、タグ・コメントが付与されているコンテンツの部分要素の一覧が表示される。図4(右)は論文の場合であり、付与されたタグやコメントとともに文章や図が表示されている。ユーザは、それらの部分の前後を見ながら、参照・引用する部分を選択することができる。

3.2 論文構成に対するコンテンツの関係付け

一般的に、論文は論文構成(目次案)を作成するところから始められる。そこで、TDEditorでは、作成した論文構成に対して検索したコンテンツの部分要素の関係付けが行える仕組みを提供している。関係付けを行うことで、論文の各章や節ごとに、参照・引用可能なコンテンツを整理することができ、大まかに論文に必要な情報の量を把握することができる。図4(左)に関係付けが行われた論文構成の例を示す。関係付けは、検索したコンテンツの部分要素を論文構成に対してドラックアンドドロップすることで行える。関係付けを行うと、関係付けられた論文構成の横にコンテンツの種類を示すアイコンが付与される。アイコンの横の数字はコンテンツの数を表している。

また、本システムでは研究活動におけるコンテンツの部分要素間のリンク情報も記録しているため、ここで検索されたコンテンツを起点として、そのコンテンツのリンク情報をたどることで、過去のコンテンツを横断的に検索することも実現できる。

3.3 コンテンツの参照・引用

論文の編集中では、3.2節での関係付けの情報を元に、編集している章や節に応じて検索インタフェースに表示されるコンテンツが動的に切り替わり、関係付けたコンテンツに容易にアクセスすることが可能となる。

ユーザは、3.2節で大まかに関係付けたコンテンツ一覧から、実際に参照・引用する部分を探し出す(もちろん、関係付けを行わずに直接参照・引用する部分を探してもよい)。参照・引用したい部分を発見したら、テキストの場合は、コピーアンドペースト、画像や映像の場合は、ドラックアンドドロップにより参照・引用が行える。実際に参照・引用されて書かれた文章は論文の中で強調されて表示されるため、その強調された部分から容易にその参照・引用元のコンテンツにアクセスできる。

このように、関係付け、または参照・引用されたコンテンツを常にユーザに提示することで、論文執筆に必要な情報を把握させる。そして、コンテンツの参照・引用を促進することで執筆作業の効率化が実現できると思われる。

4 おわりに

本研究では、研究活動中に蓄積されたアノテーションを用いたコンテンツの検索と、それらのコンテンツの論文への参照・引用を支援する仕組みを実現した。我々の研究室では、実際に、このTDEditorの運用を行い、部分参照・引用が行われた論文を収集した。TDEditorで作成された論文は研究室のWebサイト(http://www.nagao.nuie.nagoya-u.ac.jp/paper/list)で公開する予定である。今後は、論文執筆の効率に関する定量的な評価、継続的な運用による部分参照・引用関係の記録・蓄積、およびその部分参照・引用関係に基づいたコンテンツの検索・推薦の実現を行っていく予定である。