言語処理学会第19回年次大会(NLP2013)
チュートリアル
飯田 龍 氏(東京工業大学)
題目
「テキストアノテーション:現状と今後の方向性」
概要
近年の自然言語処理では,出力したい情報(タグ)をテキストに付与(アノテーション)することでタグ付きコーパスを作成し,そのコーパスをもとに自動的にタグを付与するモデルを構築するという方法論が広く利用されている.
この方法論は形態素解析のような自然言語処理の基礎技術から評判情報抽出などの応用処理にいたるまで,さまざまな問題設定において採用されている.本チュートリアルでは,さまざまなアノテーションの問題設定のうち,発表者がこれまでに関係した照応解析や談話構造解析などの談話解析におけるアノテーションを例題に,人手でアノテーションを行う際の問題設計の方針や,実際にアノテーションを行っていく過程で起こった問題について紹介する.さらにこれまでのアノテーションの経験を通じて見えてきた今後の方向性についても議論する.
梅谷 俊治 氏(大阪大学)
題目
「組合せ最適化入門:線形計画から整数計画まで」
概要
線形計画問題において変数が整数値を取るという制約を持つ整数計画問題は,産業や学術の幅広い分野における現実問題を定式化できる汎用的な最適化問題の1つであり,近年では分枝限定法に様々なアイデアを盛り込んだ高性能な整数計画ソルバーがいくつか公開されている.しかし,整数計画問題では与えられた現実問題を線形式のみを用いて記述する必要があるため,最適化の専門家でない利用者にとって現実問題を整数計画問題に定式化することは決して容易な作業ではない.そこで,本講演では,最適化の専門家ではない利用者が現実問題を整数計画問題に定式化できるようになることを目指して,線形計画法と整数計画法の基本から始めて,定式化のテクニック,整数計画ソルバーの利用法までを解説する.
岡崎 直観 氏(東北大学),吉永 直樹 氏(東京大学), 工藤 拓 氏(グーグル株式会社)
題目
「言語処理研究におけるソフトウェアの開発と公開」
概要
近年,言語処理分野では ACL/EMNLP/COLING など主要会議を中心に,実験に用いたプログラムやデータの公開を学会として評価・促進する動きが生まれています.本チュートリアルでは,このような流れをさらに促進すべく,言語処理研究に必要となる開発スキルとその養成方法,また研究成果(実験コード)を公開する意義やノウハウを,講演者が実際に研究室で行なっている取り組みや,開発したソフトウェアなどを例にとって説明します.さらに,実装上の工夫,モデルの選択,テスト,評価,開発プロセス等の観点から,自然言語処理の実アプリケーションの開発を概観します.
齋藤 洋典 氏(名古屋大学)
題目
「言語処理の後先(あとさき):意味はどこから来てどこへ行くのか.」
概要
認知心理学や心理言語学の分野では,発話の聞き取りや産出において,発話意図に沿った適切な語が迅速かつ正確に選択される処理過程が語彙接近(lexical access)の名の下に研究されている.
多くの語彙接近モデルは,3種類の制約の下に提案されている.第1に,アルファベット表記文字,特に綴り字と発音に例外を多く含む英語を中心に提起されている.第2に,話し手(書き手)か聴き手(読み手)の個人内の脳に閉じて構築されている.第3に,人の言語処理活動が言語処理に閉じて遂行されることを仮定している.
ところが,現実には周知のように,人の言語処理活動は,複数の異なる言語と表記によって行われ,話し手と聞き手の両者の意味処理活動は社会的文脈の中で展開され,そして,そうした言語行動は,単独ではなく,身体運動などとともに生起することが多い.
人の言語処理活動の後先に生起する諸活動を含めて,言語処理活動を支える意味がどこから来てどこへ行くのかを,近赤外分光法(NIRS)を用いた研究を手がかりとして再考する.