◆ 「刊行のことば」より『太陽コーパス』は、国立国語研究所が構築を目指している日本語コーパス (大規模言語データベース)の一環として、現代語の書き言葉が確立する20 世紀初期にもっともよく読まれた総合雑誌『太陽』(博文館刊)を対象とし て作成したものである。 本書が、日本語に関心をもつ広い範囲に読まれることを期待するものである。
・明治大正期によく読まれた雑誌『太陽』(博文館刊)を資料とした、本
*コーパスとは、書かれたり話されたりした生の言葉を多量に集めてコン
格的な日本語コーパス。
・『太陽』の1895・1901・1909・1917・1925年の約
1400万字の全文をXMLテキストで収録。
・ジャンル・文体・引用個所・振り仮名・外字など、豊富な言語情報をテ
キスト内に表現。
・検索や変換のための便利なソフトエェア『ひまわり』『たんぽぽ』『プ
リズム』を同梱。
・コーパスの操作方法や活用例をわかりやすく説明した解説書付き。
・『太陽コーパス』を利用した研究論文も博文館新社から同時刊行。
ピュータで扱える形にした言葉のデータベースをさします。