言語処理学会論文誌LaTeXコーパス (ver. 2020-3-16) * 本データは言語処理学会論文誌「自然言語処理」に掲載された論文のLaTeX のソースファイルを収集したコーパスです。 * Vol.1 No.1 から Vol.26 No.4 までに掲載された700件の論文のうち、 629件の論文が収録されています。 * LaTeXソースファイルの名称は V[xx]N[yy]-[zz].tex となっています。 - xx は巻(Volume)の番号を表わします。 - yy は号(Number)の番号を表わします。 - zz はその巻号における論文の掲載順序を表わします。 * Vol.1 No.1 から Vol.13 No.2 までの論文は、原則として最終稿のLaTeXソー スファイルを収録していますが、一部の論文については編集途中のファイル が収録されている可能性があります。編集途中のファイルとは、ページ番号 や巻号の番号など些細な点が最終稿と異なるだけで、論文の本文は同一と考 えられるファイルです。 * Vol.13 No.3 以降の論文は、印刷所が作成した中間生成ファイルを収録して います。 * 図や表は収録されておりません。 * LaTeXソースファイルにおけるコメントは全て除去されています。 * \newcommand や \def などでユーザが定義したマクロの定義部は除去されて います。 (例) \newcommand{\mymacro}[2]{#1 (#2)} ⇒ \newcommand{\mymacro}[2]{} * ファイルの文字コードはUTF-8です。 * file_DB.xls は本コーパスの収録ファイルの一覧です。 * 以下の71件の論文については、ソースファイルが学会に残されていなかった ために収録されておりません。 V05N03-{03,04,06}.tex V06N03-{02,05,07,08,09}.tex V11N01-{02,03}.tex V11N02-{01,02}.tex V11N03-{02,03,05,06,07,08}.tex V11N04-{01,02,03,05,06,07}.tex V11N05-{01,04}.tex V12N01-{02,03,05,06}.tex V12N02-{02,03,04,06,07,08,09}.tex V12N03-{01,02,06,08,10}.tex V12N04-{01,02,04,05,07,08,09,10,11,12}.tex V12N05-{01,06,09}.tex V12N06-{01,03,04,05,06}.tex V13N01-{02,04,07}.tex V13N02-{01,02,03,04,06,07,08,09}.tex * 本データの利用条件は以下の通りです。 1.(著作権の帰属) 「言語処理学会論文誌LaTeXコーパス」の著作権は言語処理学会に帰属し ます。 2.(免責) 「言語処理学会論文誌LaTeXコーパス」を利用することによって生じる一 切の損害について、言語処理学会は保証の責を負いません。 ===== 言語処理学会