MSR Intern Beijing(滞在中)のご紹介(第29回)

Microsoft Research滞在者のご紹介。第29回は、北京のラボに滞在中、奈良先端科学技術大学院大学の吉田 康久さんです。吉田さんは松本研究室で自然言語処理と機械学習の研究に励む、NLP界期待の星です。

yasuhisa_y

 

・所属、学年、研究室

奈良先端科学技術大学院大学 (NAIST) 情報科学研究科 自然言語処理学研究室 博士前期課程 2年

 

・博士(修士)論文のテーマ

自然言語処理と機械学習の研究をしています。特に商品レビューの極性(肯定的か否定的か)を判定する評判分析というタスクに取り組んでいました。例えば"long"という単語について考えてみましょう。カメラの分野の"the battery life of Camera X is long"という文脈では"long"は肯定的な意味になりますし、ソフトウェアの分野の"Program X takes a long time to complete"という文脈では"long"は否定的な意味になります。一方で、"good"や"worse"のような単語は分野が変わってもその極性は変化しません。このような単語の極性が分野によって変わる(もしくは変わらない)という性質を機械学習によってモデル化し、より高精度に商品レビューの極性判定を行うという研究を行っていました。

 

・インターンに来たきっかけ、目的

インターンに来る前から自動要約に興味を持っていたのですが、現在メンターのChin-Yew Linがその分野で非常に有名な人で、かつMSRAでのインターンに行くチャンスがあるというのを研究室で知ったのがきっかけでした。また、自然言語処理の分野で現在活躍されている小町さん萩原さんが以前にMSRにインターンに行っておられたときの話を聞いて、非常にレベルの高い研究を行っているところであると聞いておりMSRでのインターン自体にも興味を持っていました。

 

・インターンでの研究テーマ、目標としている会議など

Yahoo! AnswersなどのQAサイトにおけるスレッドのクラスタリングと、それを利用した自動要約について研究しています。年末から始まる投稿シーズンのACL系の学会を目標においています。

 

・MSRと大学の研究室と異なるところ

MSRAは学生の数が非常に多いこともあり研究室の雰囲気とそれほど変わらないところが多いように思いますが、異なると思うところを2点挙げてみようと思います。

一点目はリソースについてです。大学の研究室では、リソース管理がそれほどきちんとされていないことが多いと思います。それゆえ自分で必要なデータをクロールしたり加工したりといった作業が必要になり、本題の研究に入るまで一苦労…ということがよくあると思うのですが、私の場合、実験に必要なデータはチームのほうで管理されており、スムーズに本題の研究のほうに入っていくことができました(もちろんチームや研究テーマにもよると思います)。

二点目は他分野の研究者との交流の機会の多さです。私が所属している研究室(松本研究室)は現在学生の数が非常に多くなっており、研究テーマも多岐にわたりますが、ある程度扱う範囲は限られてきます(自然言語処理全般)。しかし、MSRAではそのような研究室というような(物理的、心理的な)壁はなく、情報検索、computer vision、ネットワーク、HCIなどなど様々な分野の研究者、学生が同じ部屋にいます。ご飯に一緒に行ったり、休憩でおやつを食べたり(3時には果物が出ます)、リフレッシュで卓球に行ったりなど他分野の方と話すきっかけになる機会は多く、ちょっとした雑談のつもりがホワイトボードを使ってディスカッションになっていた、ということもあります。そうしたものがすぐに研究に役立つかは分かりませんが、特定の分野に閉じていては見えないような新鮮な発想をもらうこともあり、MSRAのこうした他分野の研究者との交流の機会があるところが私は好きです。

 

・MSRに来てよかったこと、刺激をうけたこと

去年までにも他社で研究系インターンに参加したことがあるのですが、MSRAが一番違っている点は非常に多くの、レベルの高い学生がいるということでしょうか。トップカンファレンスへの投稿を目指して研究している学生が多いですし、各自のロッカーになんとなく置いてある鞄が今年のトップカンファレンスのものであったり…。優秀なResearcherの方から受ける刺激も多いですが、やはり同世代でバリバリ活躍している姿に一番刺激を受けています。

 

・MSRのここはちょっといただけないというところ

他の方も書かれていますが、社内で開かれるTalkの半数(?)ほどが中国語で行われるというところです。レベルの高いTalkが聞けるというのはインターンの中でもかなり期待していたところがあったので、ここは残念でした(とはいっても英語でのTalkも多数開かれています)。

また、普段はLinux上で開発を行っていることが多いので、visual studioの使い方やwindowsの設定に慣れるのに割と時間がかかってしまいました。企業の研究所なので仕方ないとは思いますが、普段使い慣れた道具だともう少し早く開発できたかなという気もします。

 

・北京での生活について

海外で1週間以上生活をするのは今回が初めてだったので不安も大きかったですが、割とすぐに慣れることができました。北京の街中では英語はほとんど通じませんが、簡単な中国語とボディランゲージでほとんどどうにかなりますし、どうにもできなさそうなことはMSRAのスタッフの方やルームメイト(中国人)に助けてもらえば大丈夫です。特にルームメイトにはすごく助けてもらっています(中国の文化的な習慣を教えてもらったりなど)。

食事についてですが、北京ではおいしい中華料理を安く食べることができるのでとても満足しています。私は辛い食べ物が得意ではないですが、数人で行って何品か頼むという形が多いので多少辛くて食べれないものがあっても大丈夫です。こちらにきてからは茄子がおいしく特に気に入っています。

一点気になることを上げるとすればときどき空気がすごく悪くなるということでしょうか。慣れると気にならなくなるという声もありますが、私はまだまだ気になります…。

 

・インターンに行こうか迷っている人に対して一言

インターンに行こうか迷う理由は色々あると思いますが、その中の一つに「自分が出しても通らないんじゃないか」という不安のために躊躇している人もいるのではないかと思います(というのも自分がそうだったからです)。先に言いますと「出して通らなかったとしても、それはそれでいいじゃないか」が私の結論です。インターンに行くためにはCVを書くことになると思いますが、CVを出した時点で私は国際会議に通った論文がまだ1本もない状態で、他の項目で盛り返さなくてはならない状況でした。いざ他の項目を書こうと思っても、なかなか筆が進まず1週間くらいはかかってしまったように思います。ただ、実際に書いてみると「自分の武器は何なのか」や「それを分かりやすく伝えるにはどうすればよいか」などを考え直すよいきっかけになったと思っています。もしインタビューで落ちたとしても、自分の足りなかったところ、アピール仕切れなかったところが分かるのは自分の成長にとってよい糧となりますし、ダメだったCVも来年また受けるときのよい材料となります(1回くらいダメでも諦めない)。修士でインタビューを受ける人は博士の人に比べるとどうしても実績の面では劣ってしまうところがありますが、それでもCVを書いたりインタビューを受けたりすることは自分に取ってプラスになると思うので、迷うくらいなら一度応募してみることをお勧めします。

 

・その他なんでも

できなくてもそれほど困りませんが、北京に来る前に中国語を少し勉強しておくとより楽しい北京生活が過ごせるのではないかと思います。

  1. トラックバックはまだありません。

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中