11

前号 | 次号 | NICTホームページ


NICTで活躍する女性研究者 vol.4

NICTでは約80名の女性研究者や女性職員が活躍しています。 NICTニュースでは、シリーズで女性研究者にスポットを当て、お話を伺います。

神崎 享子(かんざき きょうこ)さん - 情報通信部門自然言語グループ

1998年、早稲田大学大学院文学研究科博士課程満期退学。早稲田大学では言語学、日本語学を学ぶ。1998年4月、郵政省通信 総合研究所(現NICT)特別研究員。2001年、博士号取得(神戸大学大学院自然科学研究科)。専攻研究員(長期)を経て、 2005年4月から常勤職員として勤務。主に、自然言語処理技術を用いた語彙研究に従事。


コトバを研究する方法とは

自然言語の研究とはどういうものですか。また、自然言語処理の研究のきっかけは何だったのでしょうか。

神崎 自然言語とは、人間が日常的に使う言語のことで、その研究対象は、音声、音韻、文字、単語、語彙、文法、文章、談話などに 及びます。言語研究は、端的に言えば、人間の言語理解、発話、そして会話などの背後にあるルール、あるいは事象を、 実証的、理論的に説明するものです。一方、自然言語処理研究とは、人間が自然に発話し、また利用している言語や知識、 情報などを計算機にうまく処理させ、われわれが利用できるようにする研究です。たとえば「お魚をくわえたどら猫」と いう文を、言語学では、くわえている動作主が誰で、くわえられている対象物が何か、なぜそのような解釈ができるのかを、 統語的に説明します。一方、自然言語処理では、言葉を理解するためのルールを計算機に教えて、計算機にとって文字列に すぎない「お魚をくわえたどら猫」から、動作主が名詞「どら猫」で、動作が動詞「くわえる」で、対象物が名詞「お魚」で、 「お魚をくわえる」が「どら猫」に係っているなどという情報を取り出します。言語処理研究では、結局、大量の文書をどう 処理して必要な情報や知識をとってくるかを考えることになりますので、言語学的知見をとりいれたり、統計的手法を 使ったりするわけです。

私が言語学を学んだ早稲田大学は、伝統的な国語学の研究方法をとっていて、チョムスキーのような理論言語学ではなく、 大量の実データを観察することで、理論的な説明を導く研究方法でした。そのため、昔の国語学者は、言語データをカードに して分析していました。私の在学当時は、計算機で大量の言語データを処理することによって、新しい分析ができるのでは ないかという流れが出てきて、研究方法が大きく変わった時期でした。またこの頃は、自然言語処理と言語学の研究者が お互いに共同して、自然言語処理のための計算機用電子化辞書を作成しているような時期でした。私はこのような状況の中で、 "語彙"(単語の総体をこう呼びます)を研究していたので、自然言語処理にもだんだん興味を持つようになったのです。

自然言語や自然言語処理は、情報通信の研究とは、どのような関係があるのでしょうか。

神崎 情報通信の発達によって、言葉を使った、人と機械のコミュニケーションが増えてくることが考えられます。人間同士の 対話では抽象的な概念が分かっているので、類義語などを使ってもその曖昧さを理解することができます。ところが、 計算機に類義語の抽象的な概念を理解させたり、生成させる場合、その概念を前もって言語知識として教えないといけません。 そのため、情報通信の分野でも自然言語の研究が重要になってくるのです。自然言語処理の研究が進むと、インターネット などで精度の高い情報検索、さらには機械翻訳が実現できるようになると考えられます。

研究の内容から、文系と工学系の融合性が感じられますが、それはどうでしょうか。

神崎 自然言語と自然言語処理の研究は、文系と工学系が融合して共同研究ができる、数少ない分野だと思います。それは言葉を 材料にしているため、言語学の文系知識と自然言語処理の工学系知識を用いて、作業を進めなければならないからです。 私は語彙を研究していますが、どのような言語知識や背景知識を計算機に与えれば、人間の言葉を理解できるのか、 人間のように文を生成できるのかということで、自然言語処理の分野とリンクしています。このような研究内容なので、 自然言語グループには、私以外にも文系出身者が在籍しています。

夢は言語学と言語処理の活性化

特別研究員、専攻研究員を経て、常勤職員になられましたが、このような採用過程には、どのような感想がありますか。

神崎 ちょうど大学院3年の時に、現在の井佐原グループリーダーにCRL(現NICT)を紹介していただき、採用枠が初めてできた1998年に、 特別研究員として採用されました。大学に残ることも考えましたが、研究環境が良く、語彙を計算機で処理する研究を行って いたので、自然言語処理について研究できる期待もあって、こちらを選びました。 大学でも、ポストドクターや助手は"任期制"になっているので、任期制の特別研究員や専攻研究員を経て、正規の研究職員と して採用されるという過程については、私個人としては、あまり違和感はありませんでした。

研究を通しての夢には、どのようなものがありますか。

神崎 言語学と自然言語処理の両方に関わっている研究者として、双方のさらなる活性化を進めたいですね。大きな夢としては、 自然言語処理の技術を使って言語学上の新しい発見をして、それを計算機に取り込んで、精度の高い人工知能やロボットの ようなものを作り、自然な対話ができたらいいですね。それよりは近い夢としては、コーパスという膨大なテキストデータ から、概念を体系化して自動的に構築するシステムを考えているので、これを実現したいです。