同時通訳データベースとは
What's SIDB?
プロの同時通訳者の音声を収録した世界随一のデータベースです。音声・言語
処理技術の開発の他、言語学、心理学、認知科学、通訳学、語学教育など、
言語に関する多様な研究目的に利用することができます。
- データベースの特徴
- 講演と会話を大量に収録
通訳対象として、日常的トピックを題材とした講演(独話データ)と旅行での会話(対話データ)を大量に収集しています。いずれも10GBを超える大規模データとなっています。 - 英日・日英通訳音声を収録
独話データには英語講演の英日通訳、日本語講演の日英通訳を、また、 対話データには英語話者と日本語話者による異言語間会話を収録しています。 - 同一講演に複数の通訳者
一つの講演に対して、経験年数の異なる複数の通訳者を設定しています。通訳者による振る舞いの比較分析に利用できます。 - 発話時間情報を付与
発話をポーズで分割し、開始時刻・終了時刻を付与しています。発話を対応付けることにより、訳出タイミングを取り出せます。