MSR Intern Beijing(滞在中)のご紹介(第32回)

Microsoft Research滞在者のご紹介。テンポを上げて続けていきます。第32回は、北京のラボに滞在中、奈良先端科学技術大学院大学の坂口慶祐さんです。坂口さんは松本研究室で英語学習者のための英文自動誤り検出・訂正に取りくまれています。須賀さんと同じくCOREプロジェクトの関係でインターンに来ることになりました。

MSR_UR_keisuke_sa

 

・所属、学年、研究室

奈良先端科学技術大学院大学 情報科学研究科

修士課程2年 自然言語処理学研究室(松本研)

 

・博士(修士)論文のテーマ

英語学習者作文に対する自動誤り訂正について研究しています。

現在は、英語学習者作文に対するスペリング訂正と品詞タグ付けの同時解析手法について取り組んでいます。

自分が英語の作文(や論文)を書いたときに自動でネイティブチェックができるようになるのが将来的なゴールですが、まだまだ課題も多くやりがいがあるトピックだと思っています。

 

・インターンに来たきっかけ、目的

松本研助教の小町先生がCoreProjectに採択され、そのメンバーとして声をかけていただいたことが最初のきっかけです。その後はコーディング試験とMSRAでメンターとなる荒瀬さんを始め2回の電話面接を経て、無事にofferをいただくことができました。このような機会を提供してくれた小町先生、そしてMSRAには感謝してもしきれません。また、自分が所属する松本研からは、2007年に小町先生がMSRへ、2011年には木曽さん吉田さんがそれぞれMSRとMSRAに行って活躍されているのを見聞きしていたこともあり、MSR(A)が身近な存在に感じられたのも大きな要因の一つだと思います。

 

・インターンでの研究テーマ、目標としている会議など

MSRAでのテーマは「英語学習者向けの多肢選択問題の自動生成」です。日本でも有名なNIIの「人工頭脳プロジェクト ロボットは東大に入れるか」では問題を「解く」ことに焦点を当てていますが、自分が取り組んでいるのは問題を「作る」側になります。

トピックの大枠はMSRAに来る前にある程度決まっていたのですが、細かい部分はメンターの荒瀬さんと週2回ディスカッションをしながら進めています。荒瀬さんはインターン生の意見をとても尊重してくれます。裁量が大きい分、自分からもどんどんアイディアを出すことが求められているので、最初の1ヶ月は関連研究を読み込むだけで手一杯でした。目標としている会議はACLですが、そのためには内容をさらに深めていく必要があると考えています。

 

・MSRと大学の研究室と異なるところ

自分が感じた違いは大きく2つあります。

1つ目は規模です。松本研も研究室としては大きい方なのですが、こちらでは自然言語処理の基礎技術に加え、機械翻訳、情報抽出、情報検索、自動要約、機械学習、HCIなどの応用・関連分野の研究者やインターン生も多く、たくさんの勉強会やセミナーが開かれています。

2つ目はユーザーに対する意識の高さです。論文以外にも製品というアウトプットがあるため、ユーザーの立場で考える研究者が多い印象を受けました。

 

・MSRに来てよかったこと、刺激をうけたこと

MSRAでは研究者、インターンともにとても積極的です。ミーティングや勉強会では細かいところまで徹底的に議論します。

論文紹介などでも、「自分はこう思う」とか「自分だったらこうする」等々、積極的にアイディアを出してきます。細かすぎるんじゃないか、と思うくらい議論が白熱することもしばしばです。学部生や修士課程の学生が多いことも大変刺激になっています。学部生のうちからこのような環境で第一線の研究者と一緒に仕事ができるのはとても恵まれていると思います。個人的にはNLPの大御所の1人である辻井先生と勉強会等で直接お話しする機会があるのも刺激の一つです。また今回はプロダクト開発チームの方とも一緒に仕事をさせていただいていることもあり、プロジェクト管理やディスカッションの進め方などもとても勉強になっています。

 

・MSRのここはちょっといただけないというところ

開発環境がWindows一択というのは人によっては不便を感じるかもしれません。(MSRに来ているのに、それを言ってしまっては元も子もない気がしますが…)

自然言語処理の特性上、文字コード等に関して柔軟な開発環境が必要になるのですが、Windowsという(自然言語処理的に)特殊な環境では、少し手間がかかったり戸惑ったりすることがあります。プログラミング(C#)に関しては特に不便は感じていませんが、他の人が作ったコードを有効に活用(検索)できる仕組みがあるといいのではないかなと思います。それと開発環境用のディスプレイは2枚提供してくれると自分はとても嬉しいです(笑)。

 

・北京での生活について

日常生活については他の方がすでに書いてくれているので割愛することにして、今回自分は(たまたま)デモの時期に北京にいたということで、その辺りについて書いてみたいと思います。尖閣諸島の問題については中国国内でも大きなニュースになっていました。日本ではデモ(むしろ暴動?)の様子がたくさん報道されたこともあり、家族や知り合いから安否確認のメールを沢山もらいました。社内でも安全を最優先させるために在宅勤務の許可やオフィスへの送迎サービスの提案が出ました。「安全第一」という点についてMSRAのサポートは本当に徹底していたと思います。ですので、今後MSRAにインターンに来ようと思っている人は、その点については心配しなくてよいと思います。

自分はというと、住んでいるアパートやオフィスがあるエリアが(セブンイレブンが休業した以外)普段と変わらず平穏だったので、結局いつものようにバスで毎日オフィスに通っていました。本当に同じ北京でデモが起きているのか信じられなかったくらいです。もちろん大使館付近に住んでいた日本人研究者は大変だったようですし一概には言えないところもあるかもしれませんが、少なくとも自分にとってMSRAのオフィスが一番安全で快適な環境でした。

自分はこれまで3人の中国人ルームメイトと過ごしましたが、皆とてもフレンドリーで親切でした。さらに言えば、コンビニやレストランの店員さんもほとんどは(基本的に無愛想ですが)親切です。サービス業関係の店員さんは基本的にツンデレ(?)だと思えば少しは親近感がわくのではと思います。

 

・インターンに行こうか迷っている人に対して一言

行こうかどうか、応募しようかどうかなど迷うことは当然あるかと思いますが、行きたいという気持ちや興味が少しでもあるのなら、まずは手を挙げてみて実際に行けることになった時に改めて迷えばいいのではないかなと思っています。

 

・その他なんでも

学部時代に中国語を学んでいたのですがほとんど忘れてしまっていたので、ブラッシュアップのために週末は中国語学校に通い始めました。中国語は言語学的にもとても面白いですし、研究にも実用にも役立つので一石二鳥です(笑)。帰国までにナチュラルスピードの中国語を(自分の頭で)言語処理できるようになりたいですが、まずは頭の辞書を再構築するところから始めたいと思います・・・。

 

坂口さん、ありがとうございました!

  1. トラックバックはまだありません。

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中