研究活動における音声ログの整理と利用

PDF
川西 康介
名古屋大学 工学部 電気電子・情報工学科
大平 茂輝
名古屋大学 情報基盤センター
松原 茂樹
名古屋大学 大学院情報科学研究科
長尾 確
名古屋大学 大学院情報科学研究科

1 はじめに

研究者が研究活動において記録をとることは重要である.音声ログは,備忘録のような些細な記録から議論などの長時間に及ぶ記録まで,多様なシーンで容易に記録できる.しかし,記録が容易である反面,探すことが容易でなく,記録をしても利用されないことが多い.

そこで本論文では,録音された音声ログに,タイトルとタグを簡単に付与し整理する手法を提案する.本研究では,研究者が日頃から作成している研究ノートに着目し,そこから抽出したタイトルとタグを音声に関連付ける仕組みを実現した.

2 研究活動における音声ログ

2.1 音声ログの整理に関する従来手法

音声ログの整理法としては,音声認識を用いて音声を文字化することで検索を容易にする手法が一般的である.例えば,音素表記によるマッチングを行う検索手法や,認識誤りに強い検索手法などがある.しかし,音声認識により音声ログが正確に文字化されるだけでは,必ずしも音声ログの整理として十分ではない.例えば「?の目的で」や「?のツールを使って」のように,話者にとって当然の条件が省略されて話された音声ログの場合,利用シーン毎に整理しようとしても,整理先が必ずしも一意に定まらない.

また,音声ログにタイトルやタグを手動で付与し整理する手法は一般的な録音アプリケーション1でも採用されている.しかし,全て手動で入力するのはコストが高く,記録が簡単という音声記録の利点は損なわれる.

2.2 研究ノートを利用した整理手法

研究者は一般に,研究活動の記録をテキストメモとして日常的に作成している.本論文では研究活動において作成されるテキストメモを研究ノートと呼ぶ.

研究ノートと音声ログは,どちらも研究活動の支援・補助を目的として記録される.つまり,音声ログのタイトルやタグとして適切なものが,研究ノートに書かれている可能性が高い.

そこで本研究では,音声ログに付与するタグを研究ノートから抽出することにより,音声ログを簡単に整理する手法を実現した.

3 音声ログの記録・整理手法

3.1 システムの概要

に示すように,ノートサーバー,録音アプリiRec,ボイスサーバーから構成される.

システムの構成図

図1: システムの構成図

研究ノートのデータはノートサーバーで蓄積・管理する.ノートサーバーは研究ノートからタグを抽出し,メタデータとしてデータベースに保存する.録音アプリiRecは,音声記録のためのアプリケーションであり,ノートサーバーが研究ノートから抽出したタイトルとタグをダウンロードして,録音時に音声に付与できる.ボイスサーバーには,iRecから音声ログとそのメタデータがアップロードされ保管される.

3.2 研究ノートからのタグ抽出

研究ノートを記録し,ノートサーバーにアップロードするツールとして,著者らの研究グループで開発したiStickyを利用する

ノートサーバーは,研究ノートの更新時に本文を形態素解析してタグを抽出し,データベースに保存する.抽出対象は,名詞-一般,名詞-サ変接続,名詞-未知語の3種類であり,連続して出現する名詞は複合名詞として連結する.

3.3 録音アプリiRec

iRecとは,iPhone用に開発した録音アプリケーションである.iRecの録音画面および,タグの選択画面を図に示す.

iRecの録音画面(左)とタグ選択画面(右)

図2: iRecの録音画面(左)とタグ選択画面(右)

音声を録音すると,事前にノートサーバーからダウンロードしたノートタイトル一覧が,更新日時順に表示される.一つのノートタイトルを選択すると,それが音声のタイトルとして保存され,選択されたノートから抽出されたタグの一覧が表示される.また,ユーザーによって追加されたタグも合わせて表示される.タグは複数選択して音声に付与できる.

iRecでは,記録された音声ログのタイトルやタグ,録音日時などのメタ情報の確認や再生が可能であり,ボイスサーバーにメタ情報とともにアップロードすることができる.

3.4 システムの利用

本システムの利用例を図に示す.ここでは仮に,研究者が日頃から「実験について」というタイトルの研究ノートを書いているとする.

研究者がiRecで「今週末に被験者にアンケートをとる」と録音すると,ノートタイトル一覧が表示される.その中から「実験について」というタイトルを選択すると,ノートの本文から抽出されたものを含むタグ一覧が表示される.そこから「TODO」「音声記録」「実験」「アンケート」をタグとして選択し,保存する.このように,音声には含まれない情報をタグとして,簡単に付与できる仕組みになっている.

音声ログはボイスサーバーにアップロードして管理する.これにより,他のアプリケーションから音声ログを容易に利用することができる.

タイトルとタグの入力例

図3: タイトルとタグの入力例

4 音声ログの利用

本システムを利用すると,さらに以下のようなことが実現可能であると考えられる.

・音声ログの研究ノートへの自動関連付け

本手法では,研究ノートを利用してタイトルやタグを付与しているため,これを利用して研究ノートに音声ログを関連付けることも容易に行える.音声ログの利用が促進されるとともに,音声が関連付いたテキストを他のコンテンツに利用することも可能になる.

・適切なシーンでの音声ログのリマインダー

例えば,PCを用いた研究活動に関するTODOを音声で記録した後,研究者がPCを利用する際に,その音声ログを自動再生してTODOをリマインドする仕組みである.研究者が音声ログの利用を意識することなく,研究活動を支援できると考えられる.

5 まとめと今後の課題

本論文では,研究ノートを利用することにより,音声ログのタイトルとタグを簡単に付与し整理する仕組みについて述べた.今後の課題として,本システムの継続的な利用を通して収集された音声ログの分析及び,タグの有効性の評価が挙げられる.