青空文庫FAQ

青空文庫編




はじめに


 ここには、青空文庫に寄せられるよくある質問を、一問一答形式でまとめてあります。わからないことは、青空文庫に直接問い合わせる前に、こちらから確認して頂けますと幸いです。


青空文庫について


Q:青空文庫って、何ですか?

A:1997年に始まったボランティア活動で、誰にでもアクセスできる自由な電子本を、共有可能なものとして図書館のようにインターネット上に集めようとしております。現在は、日本国内で著作権保護期間の満了した作品を中心に、ボランティアのみなさんの力によって電子化作業を進めています。青空文庫はそういった電子化活動のための、またその成果物をアーカイヴしておくための場でもあり、そこからコピーされた本の集成や活用事例もまた〈青空文庫〉と呼ばれることがあります。詳しくは「青空文庫のしくみ」(http://www.aozora.gr.jp/aozora_bunkono_shikumi.html)をご一読ください。

Q:青空文庫の歴史を知りたいのですが……

A:青空文庫の創設メンバーのひとりが書いた「青空文庫ものがたり」(http://www.aozora.gr.jp/cards/001739/card55745.html)が、公開されています。そのほか、青空文庫のことがわかる関係書籍・資料として、以下のものがあります。
富田倫生(1997)『本の未来』アスキー出版局/青空文庫版
 :設立に至る背景が記されている
富田倫生(1998)『インターネット快適読書術』ひつじ書房
 :第五章で設立初期の青空文庫が触れられている
青空文庫編(1999)『青空文庫へようこそ インターネット公共図書館の試み』トランスアート
 :実験的なオンデマンド出版によって刊行された、青空文庫の自己紹介本
野口英司編著(2005)『インターネット図書館 青空文庫』はる書房
 :青空文庫の成り立ちや関係者のインタビュー、著作権問題などがまとめられている
青空文庫編(2007)『青空文庫10歳記念版「蔵書6300」』青空文庫
 :10周年記念のイベントで配布された DVD-ROM、過去のアーカイヴや青空文庫の活用事例も収録
青空文庫編著(2007)『青空文庫 全――もう一つの読む自由』青空文庫
 :全国の公共図書館に寄贈された青空文庫 DVD-ROM
大久保ゆう(2010)『Think C×C』ALZ
 :著作権保護期間延長問題に関係した青空文庫の活動がレポートされている
 また、青空文庫の呼びかけ人である故・富田倫生さんの講演動画や関係記事については、ボイジャーさんが「【追悼】青空文庫_富田倫生さんの足跡」(http://voyager.co.jp/tomita/)にまとめてくださっています。ご参照ください。

Q:青空文庫(http://www.aozora.gr.jp/)にアクセスできません! どうしたらいいでしょうか?

A:中味はまったく同じで、更新も同時に行っているミラーサイト(http://mirror.aozora.gr.jp/)を用意しています。片方がうまく繋がらない場合は、もう一方を試してみてください。

Q:青空文庫にはどんな作品が収録されているのですか? 全作品のリストがほしいです!

A:「総合インデックス」(http://www.aozora.gr.jp/index_pages/index_top.html)の目次ページから「作家別」欄の「全てを表示」をクリックすると、「公開中の作品」または「作業中の作品」を網羅した、下の図のような書誌データ付きの一覧表を入手できます。
全作品一覧表の図
 ここからは、著者名、翻訳者名、底本名、底本の出版社名、新字旧字・新仮名旧仮名のいずれを用いた表記か、いつから公開されているか等のデータを CSV 形式(zip 圧縮)で得ることができます。一覧表は、新しく作品が公開されるごとに更新されます。
 なお、これらの CSV ファイルについては、「クリエイティブ・コモンズ 表示 2.1 日本 ライセンス」(http://creativecommons.org/licenses/by/2.1/jp/)で公開するものとします。

Q:青空文庫の図書カードのアドレスに、規則性はありますか?

A:図書カードの URL は、以下のように決めています。

 http://www.aozora.gr.jp/cards/xxxxxx/cardyyyyy.html
  xxxxxxは人物 ID、先頭ゼロの6桁固定。
  yyyyyは作品 ID、先頭ゼロなし、桁数は不定。

 例えば、愛知敬一(人物 ID:1234)「ファラデーの伝」(作品 ID:46340)の図書カードの URL は、以下のように決まります。
 http://www.aozora.gr.jp/cards/001234/card46340.html

 その他、書誌データを作る際の方針は、「青空文庫における書誌データのとりかた」(http://www.aozora.gr.jp/metadata_collection/index.html)に記してあります。

Q:青空文庫にリンクを貼ってもいいでしょうか?

A:青空文庫のページやファイルにリンクする際は、「青空文庫へのリンク規準」(http://www.aozora.gr.jp/guide/linkkijyunn.html)に従ってください。リンク先が示すとおり、「作家別作品リスト」、「図書カード」に直接リンクしてもらってもかまいません。
(「作家別作品リスト」、「図書カード」の URL は、人物 ID、作品 ID によって決まります。原則として、人物 ID、作品 ID は変更しません。)
 長谷川集平さん制作のリンク用バナーも、どうぞご利用ください。
リンクバナーの図
 相互リンクについては、ただいま受け付けておりません。あらかじめご了承ください。

Q:青空文庫の新着を自動的にお知らせしてくれる機能はありませんか?

A:うにさんが、毎日の新着情報を RSS で書き出したものをこちら(http://eunheui.sakura.ne.jp/aozora/whatsnew.rdf)に用意してくださっています。
 また、twitterには、上の RSS を利用した青空文庫の新着情報を教えてくれるアカウント(https://twitter.com/aozoranow)もあります。
 さらにまた、潮流工房さんによる OPDS フィード(http://aozora.textlive.net/catalog.opds)もあります。

Q:過去(1年以上前)の「新着情報」は見られないのですか?

A:前年・以前に公開された作品は、その年の「新着情報」の最終ページ、1月1日公開作品の下に、各年の「新着情報」へのリンクを貼ってあります。そちらからご確認ください。
 なお、2000年以前の新着情報は、この方法では参照することができません。過去の「そらもよう」で確認してください。(「そらもよう」のいちばん下に、過去の「そらもよう」へのリンクがあります。)

Q:青空文庫の収録作品を、一括してダウンロードすることはできないのですか?

A:青空文庫のデータ一式は github にも置かれ、毎日更新されています。公開サーバーで削除したものを消してないという難もありますが、あるがままの状態でかまわなければご利用ください。(https://github.com/aozorabunko/aozorabunko)

Q:青空文庫と本の未来基金とはどんな関係にあるのですか?

A:外部サイト「基金について|本の未来基金」(http://honnomirai.net/about.html)の「青空文庫と「本の未来基金」の関係」をご参照ください。

Q:青空文庫は図書館なのですか?

A:青空文庫は、図書館法における「図書館」に当たりません。ただしマスコミ等の「インターネット公共図書館」という報道を受けて、当文庫の活動をイメージしやすい言葉として「図書館」というフレーズを用いることがあります。また「図書館の自由に関する宣言」についても、現在のところ掲げてはおりません。

Q:青空文庫形式って、何ですか?

A:青空文庫では、電子化の基本となるテキストファイルを制作する際、ファイル形式上そのままでは表現できない底本の日本語組版要素を、書式を定めて注記という形で一部簡易的にマークアップしており、その形式が俗称として「青空文庫形式」と呼ばれてきました。記法・タグの一覧は、「注記一覧」(http://www.aozora.gr.jp/annotation/)にまとめてあります。この形式に対応した作品閲覧ソフトウェアも様々作られ、また青空文庫の提供するテキストの普及から、青空文庫外での利用も増えてきました。その点に鑑みて、外部利用を前提としたサイト「組版案内」(http://kumihan.aozora.gr.jp/)も用意しています。今後の活用・構造化について広く話し合う場も求められていますが、ボランティアの常として、有志による自発的な構築を待ちたいと思います。

Q:『青空文庫 全』って、何ですか?

A:2007(平成19)年7月7日に開設10周年を迎えたのを記念して青空文庫が制作した、DVD-ROM付き冊子の名称です。当時公開されていた407名の著作権保護期間が切れた作家・翻訳家の作品、約6500点を収録しました。社団法人日本図書館協会、ライブラリー・アド・サービス、国際交流基金情報センターライブラリーといった関係各所のお力添えもあって、公共図書館、大学・短大・高専付属図書館、高校図書館、そして盲学校、聾学校、点字図書館、海外の図書館などに寄贈することができました。 詳しくは、「青空文庫を図書館の書架に!_『青空文庫 全』寄贈計画のお知らせ」(http://www.aozora.gr.jp/kizokeikaku/)をご覧ください。


青空文庫の活動参加について


Q:青空文庫のボランティア活動に参加したいのですが……

A:青空文庫は、ボランティアの力で成り立っています。入力、校正、ファイル作成などに力をふるってくれる皆さんを、青空文庫では「青空耕作員」もしくは「青空工作員」と呼んでいます。「自分も耕作員・工作員として動いてみよう」と思われた方は、まず、「工作員を志願される皆さんへ」(http://www.aozora.gr.jp/guide/kousakuin.html)を参照してください。
 青空文庫耕作員・工作員になる流れについては、以下の図のようになります。
耕作員になる流れの図
(野口英司[編著]『インターネット図書館 青空文庫』はる書房、p74-75より)

Q:青空文庫に自分の作品を登録してほしいのですが……

A:青空文庫では、開始当初、著作者本人の希望による作品のリンク登録を行っていました。しかし、当時の担当者たちが次第に登録のための手続きに困難を感じるようになったため、しばらくのあいだ、登録は実質的な休止状態にありました。現在は、対象を書き下ろしを除いた「すでに書籍になっているもの」に限定し、著作者を含めた自発的なプロジェクトによって進められた作品を、実験的に登録しております。

Q:青空文庫に自分の訳した作品を登録してほしいのですが……

A:青空文庫では、著作権切れの外国語作品で、独自に翻訳されたものも、図書カードからリンクを貼ることで登録しています。登録を希望される翻訳者の方は、aozorablog の以下の記事をご参考の上、ご連絡ください。
 「自分の PD 翻訳を青空文庫に登録してもらうには」(http://www.aozora.gr.jp/aozorablog/?p=663)
 登録された作品は、「青空文庫収録ファイルの取り扱い規準」(http://www.aozora.gr.jp/guide/kijyunn.html)「青空文庫へのリンク規準」(http://www.aozora.gr.jp/guide/linkkijyunn.html)に従って、扱われます。申請前に、それぞれご一読ください。
 ただし、申請された作品が、基本的人権を損なうような作品や著作権法上問題のある作品である場合は、お断りすることがあります。あらかじめご了承ください。

Q:グループで青空文庫に参加してもいいですか?

A:はい、グループでのご参加も歓迎します。分担作業をなさる場合は、代表者をひとり決めて、グループ名と代表者のメールアドレスをご登録ください。企業のボランティア参加も、同様の形で受け入れています。
 グループのメンバーが個々の耕作員・工作員として活動なさる場合は、個別にご登録いただいても構いません。

Q:青空文庫のボランティアは、ずっと続けなければいけませんか?

A:そんなことはありません。一作品に限って作業された方もいらっしゃれば、長くボランティアをしていらっしゃる方でも、あいだ数年お休みしている時期があったりしますし、作業可能な時期だけ集中して取り組む方もおられます。あくまでボランティアですので、自分にできることを、できる範囲で無理なくやっていただければ結構です。


入力・校正について


Q:入力・校正作業をする際に用いる便利ツールはどこにありますか?

A:各種マニュアル、各種ツールともに基本的なものは以下のページにまとめてあります。
 「工作員手帳」(http://eunheui.sakura.ne.jp/aozora/)
 これらのツールは、有志・関係者の手によって作られました。ありがとうございます。

Q:青空文庫形式の注記を入力するための専用ソフトウェアはありますか?

A:専用ソフトウェアはありませんが、ウィンドウズ用の Mery というフリーテキストエディタに対応した、青空文庫注記マクロが公開されています。詳しくは、「MeryWiki」(http://www.haijin-boys.com/wiki/)をご参照ください。
 ほかにも、「WZsoft」(http://www.wzsoft.jp/)の有償ソフトウェア「テキストエディタ WZ EDITOR 8」および「ライティングエディタ WZ Writing Editor」では、青空文庫組版を実装していることが公表されています。
 また Mac 用では、mi というフリーテキストエディタにも対応したモードが公開されています。詳しくは、「mi - テキストエディタ」(http://www.mimikaki.net/)「mi 用 青空文庫モード - Fairfield.」(http://fairfield.minibird.jp/other_resources/mi-%E7%94%A8-%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB%E3%83%A2%E3%83%BC%E3%83%89)をご参照ください。
 さらに、蒋龍さんによる「無名作家の青空」(http://show_ryu.nce.buttobi.net/)には、「青空文庫形式入力エディタ(β版)」(http://showryu.web.fc2.com/aozora/aozoraeditor.html)も用意されています。

Q:入力・校正するための古い底本はどうやって見つければいいでしょうか?

A:校正者の場合は、使用する底本が決まっていますので、書誌データを参考にして古書店(ネット古書店含む)もしくはお近くの公共図書館をまずは探してみてください。また当該の書籍が国立国会図書館の「近代デジタルライブラリー」(http://kindai.ndl.go.jp/)「うわづら文庫」(http://www.let.osaka-u.ac.jp/~okajima/uwazura.html)に収録されていることもありますので、一度検索してみてください。
 入力する底本も、取り組みたい本や作品が決まっていれば、おおむね同様の方法で探すことができます。まずは国立国会図書館サーチ(http://iss.ndl.go.jp/)等で、作品の収録された本にはどのようなものがあるのか当たりをつけておくと、探しやすくなります。また、公共図書館のレファレンス(参考図書)コーナーには、作家やジャンルごとにまとめられた書誌が開架されていることもあります。また、インターネット上では作家のファンが書誌を公開している場合があります。そちらも参考にしてみてください。
 底本の探索については、蒋龍さんによる「無名作家の青空」(http://show_ryu.nce.buttobi.net/)「著作権切れ作家の作品(底本)の探しかた」(http://show_ryu.nce.buttobi.net/teihon.html)もご参照ください。

Q:データベースに登録されていない作家の生没年はどうやって調べたらいいでしょうか?

A:底本に生没年が記載されている場合は、その情報を申請時に書き添えてください。
 またインターネット上で検索可能なものとして、国立国会図書館の典拠データ検索・提供サービス「Web NDL Authorities」(http://id.ndl.go.jp/auth/ndla)があります。できればこちらも検索して、確認してください。著名な人物であれば、Wikipedia 等の項目に記載があることもあります。また公共図書館の参考図書コーナーにある人名録・事典類や、著作者の地元図書館の郷土資料などにも、情報のある可能性があります。
 そのほか、「無名作家の青空」(http://show_ryu.nce.buttobi.net/)「著作権が消滅した作家の一覧」(http://show_ryu.nce.buttobi.net/sakka2.html)でも、情報を五十音順のリストで参照することができます。(なお、青空文庫サーバ内の「著作権の消滅した作家名一覧」(http://www.aozora.gr.jp/siryo1.html)は、現在更新が停止しています、あしからず。)
 青空文庫で作業を進めるためには、作品に関係する著作者の生没年情報が不可欠です。著作権状態の不明ないわゆる「孤児作品」については、現在青空文庫では取り扱うことができません。あしからず。

Q:詩集のなかから詩をひとつだけ取り出して入力したいのですが、いいでしょうか?

A:青空文庫では、詩集として本になっているものは、一詩集として電子化することを目指しています。
 例えば、中原中也の詩集「在りし日の歌」には、多くの詩と後記が含まれていますが、この場合は、あくまで「在りし日の歌」という一つのまとまりとして登録し、個別の詩を切り離して収録する、あるいは中の何篇かのみを収めることは避けたいと考えています。
 詩集の場合は、この原則を適用して、底本のまますべての詩を完全な形で収めることを、まず第一の選択肢として検討していただけると助かります。
 ただし、生前に自身の手によって詩集が編まれていない等の個別の事情がある場合は、この限りではありません。

Q:入力者と校正者を同じ人がやってはいけないのですか?

A:現在のところ、原則として入力者と校正者が別の方になるようお願いしています。青空文庫では、作品の入力完了後、ファイル送付前の入力者校正を推奨しておりますが、それでも間違いが残りますので、ファイル作成時の誤りをできるだけ減らすためにも、ご理解いただけると助かります。
 ただし、古いファイルや、著作権の存続している登録作品については、データベースの表示上、入力者と校正者が同一人物になっていることもあります。

Q:ある作家について、作業プロジェクトを立ち上げたいのですが、青空文庫の承認は必要ですか?

A:著作権保護期間の満了した著作者の作業プロジェクトについては、自由に立てて実行してください(その代わり、進行管理広報についても、可能な限り個々人でお願い致します)。ただし、プロジェクトの成果が最初に公開されるタイミング等で、「そらもよう」などでのプロジェクトのご報告を依頼することがあります。その際は、ご協力いただけると助かります。また各プロジェクトで国会図書館の NDL ラボから提供されている「翻デジ」(http://lab.kn.ndl.go.jp/dhii/)をご活用頂いても構いません。

Q:ある作品がずっと入力中(校正中)なのですが、わたしが代わりに(続きを)やってもいいでしょうか?

A:青空文庫では、作業開始から2年以上経過している作品の場合、現在の担当者と、引き継ぎたい耕作員・工作員の意思をそれぞれ確認した上で、作業を引き継いでいただくことがあります。まずは reception@aozora.gr.jp までご相談ください。
 その過程で元々の担当者への連絡が不達であった場合は、そらもようで告知して1ヶ月の連絡を待ったのち、便りがなければ同意のないまま引き継いでもらうこともあります。
 あるいは変則的ですが、異なる底本で作業するという手立ても残されています。

Q:入力・校正受付システムには、「使用する版を入力せよ」と書かれていますが、何をどこまで入れればいいでしょうか?

A:まずは底本の奥付を見てください。底本名のところには、奥付に書かれている書名を、記号・数字・空白・旧字があっても順序含めそのまま入力してください。出版社名のところも、同様にしてください。(このとき、本の「扉」からではなく必ず「奥付」を参照するようにしてください。また確認のために奥付写真の添付をお願いすることがありますが、ご協力いただけると助かります。)
 そして初版発行年には「年月日」のみ半角数字で、入力に使用する版の項目には「発行」というフレーズを除いた「年月日+版刷」を入れてください。「青空文庫収録ファイルへの記載事項」の決まりとは少々異なっておりますので、ご注意ください。
(例)
 底本名(必須) カープの世界
 出版社名(必須) 鯉城文庫、鯉城出版
 初版発行年(必須) 1972(昭和47)年4月1日
 入力に使用する版(必須) 1975(昭和50)年3月3日第3刷
 なお作成するファイル末には、「発行」というフレーズが奥付にあれば入れてください。なければ不要です。「發行」と旧字で書かれていても「発行」と記述してください。
(例)
 底本:「カープの世界」鯉城文庫、鯉城出版
    1972(昭和47)年4月1日初版第1刷発行
    1975(昭和50)年3月3日第3刷発行

Q:作業する作品の初出や底本の親本などは、自分で調べた方がよいでしょうか?

A:底本の扉や解題などに記述されているときのみ、受付システムや作成ファイルに入力・記載してください。他の文献やインターネットでの調査は不要です。
 受付システムでは、「底本の親本」については底本と同じ要領で入力してください。全集などを底本にした場合作品毎に異なる場合がありますが、入力・校正受付システムでの「底本の親本名」は、「底本データ」にしかありません。そのようなときは「底本データ」の「備考」にメモしてください。
「初出」については、「作品データ」に「初出」という項目がありますので、「雑誌名」と初版発行年を「年月日」のみ半角数字で記述して下さい。
(例)「月刊カープファン」1963(昭和38)年5月15日
 作成ファイルには、「底本:」「底本の親本:」「初出:」の順に記述して下さい。底本は初出の誌に拠ったなどの記述があれば「底本の親本:」と「初出:」は同じになります。詳しくは、「青空文庫収録ファイルへの記載事項」(http://www.aozora.gr.jp/guide/kisai.html)をご一読ください。
(例)
 底本:「カープの世界」鯉城文庫、鯉城出版
    1972(昭和47)年4月1日初版第1刷発行
    1975(昭和50)年3月3日第3刷発行
 底本の親本:「ジョン・ホプキンズ選集 第二巻」書肆厳島
    1965(昭和40)年5月5日初版発行
 初出:「月刊カープファン」中本印刷出版部
    1963(昭和38)年5月15日号

Q:入力者と校正者で協力してもいいですか?

A:はい、(入力者自身が校正者を見つけてくること含め)耕作員・工作員同士の連携は、ご自由に。ただし、入力から校正のあいだに、点検作業が入ることもありますので、校正作業するファイルについては、必ず青空文庫点検チームから送付されたものを用いるようにしてください。また作業の際には、協力について一言添えていただけると助かります。

Q:入力(あるいは校正)を他の耕作員・工作員と協力してやりたいのですが……

A:複数人で入力(もしくは校正)作業するときは、グループワークとして共同名義を作ってから申し込んでください(データベースの管理上こちらを推奨します)。ただし、代表者を決めて、その方から申し込んでいただいたのち、あとから協力した耕作員・工作員のお名前をご報告いただく形でも、構いません。

Q:入力用の底本を探しても、新字新仮名のものが見つかりません。旧字旧仮名の底本から自分で新字新仮名版のテキストを用意してもいいでしょうか?

A:青空文庫としての方針は、「本という財産にどう向き合うか」の「3.底本」(http://www.aozora.gr.jp/KOSAKU/MESSAGE.html#ANK9)の項目に示してあります。入力者として、あくまで元の形に近いものを優先したいと考えるのなら、底本には旧漢字・旧かなづかい(または正字正かな)のものを選んだ方がいいでしょう。ただし、その作品をもっと多くの人に読んでもらいたいと思うのなら、戦後に改められた漢字・仮名表記による底本を用いるのがいいでしょう。ある作品を旧字旧仮名・新字新仮名のどちら(あるいは両方)でアーカイヴするかは、作業者個々人のご意志・ご判断にお任せしています。とはいえ、現代表記の底本がすべての作品に見つかるわけではありません。その際、やむをえず自分から新字新仮名のテキストを用意しようと思われた方は、「旧字、旧仮名で書かれた作品を、現代表記にあらためる際の作業指針」(http://www.aozora.gr.jp/KOSAKU/genndaihyouki.html)を読んだ上で、日本エディタースクール編『標準 校正必携』等を参考に、作業を進めてください。

Q:自分が入力・校正した作品を、作家ゆかりの日に公開してほしいのですが……

A:必ずしもご希望に添えるとは限りませんが、作業ファイルの送付時等に文学忌など一言リクエストしていただければ、公開スケジュールを設定する際、前向きに考慮したいと思います。

Q:作業しようと思っている作品の著作権保護期間がもうすぐ満了するのですが、今から作業申請をしてもいいですか?

A:青空文庫では、まだ著作権の保護期間の満了していない作品の作業については、著作権法に抵触しないよう慎重を期するようにしています。ただし、テキストの入力作業申請自体は、保護期間の満了する年の2年前の元旦から受け付けております。

Q:作業時、青空文庫テキストで使用できる文字かどうかは、どうやって確認すればいいのでしょうか?

A:作業途中のテキストを「チェッカー君 3.60b」(http://www.aozora.jp/tools/checker.cgi)にコピー&ペーストして確認してください。時々接続できないことがありますが、その際は「青空文庫の応援ページ」(http://www.hyuki.com/aozora/)「文字チェッカー 3.60」(http://www.hyuki.com/aozora/checker.cgi)をご使用ください。
 たとえば赤字で「[gaiji]【C】」等と表示されていれば【C】の字は使えない、ということなります。
 また赤字で「楣」等と表示されている際は、使用不可の文字を用いているということなので、その前後の語句でテキストを検索し、該当の字(たとえば「※(「木+眉」、第3水準1-85-86)」)を見つけてください。
「工作員マニュアル」の「入力−1」(http://www.aozora.gr.jp/KOSAKU/MANUAL_2.html)の「■入力の実際」の「(1)使う文字」、また「入力−2」(http://www.aozora.gr.jp/KOSAKU/MANUAL_3.html)の「■文字を探す」も参照してください。
(※使えない文字に気づかないまま保存しようとすると、たとえば「このファイルは、ANSI テキストファイルとして保存すると失われてしまう Unicode 形式の文字を含んでいます。」と表示され、そのまま強行すると当該の文字が「?」として保存されてしまうことがあります。このようなエラーメッセージが出たときにも、チェックしてください。またファイル送付前に「?」となっている文字がないかどうか、どうか再度ご確認をお願い申し上げます。)

Q:青空文庫テキストで使用できない文字は、どのようにして入力すればいいですか?

A:使えない文字については、「青空文庫・外字注記辞書(改訂第八版)」(http://www.aozora.gr.jp/gaiji_chuki/)で確認してください。
 たとえば【C】の字の場合、検索機能を使うと、赤字で「C※[#「さんずい+睛のつくり」]→[包摂適用 清]」と記述されているのが見つかります。「清」で入力してください。
 前項で「楣」と表示された字について検索すると、黒字で「※ [#「木+眉」、第3水準1-85-86]」と記述されているのが見つかります。ここでは「※ [#「木+眉」、第3水準1-85-86]」と入力してください。
(※コピー&ペーストすると簡単ですが、環境によっては半角空白が混じることや、本来全角の「#」や「[]」が半角になってしまうこともありますので、その場合は修正を忘れないようにしてください。)

Q:入力に使用できない文字が「青空文庫・外字注記辞書(改訂第八版)」にもないときは、どうしたらよいでしょうか?

A:「CHISE IDS 漢字検索」(http://chise.zinbun.kyoto-u.ac.jp/ids-find)で探してください。漢字の部品から検索できますので、見つかった漢字のユニコード(U+で始まる4〜6桁の半角英数字)を注記に加えてください。
 たとえば「㪶(百+斗)」という字の場合、「百斗」で検索すると「U+3AB6」という記述が出てきますので、その場合注記に「※[#「百+斗」、U+3AB6、352-5]」と入力してください。352-5というのは、底本の「ページ数-行数」です。「ページ数-行数」は、底本確認の作業を迅速化するために必ず入力をお願いします(なお行数のカウント時に空行は数えません)。また、テキスト送付時に「青空文庫・外字注記辞書(改訂第八版)」にない漢字である旨を伝えていただけると助かります。
 もし、よく似ているけれども少し違う、というような字に出会ったときは、外字注記の説明部分に底本通りの字形で記述した上で、そのよく似た漢字のユニコードを念のため記述しておいてください。その場合は、テキスト送付時に「青空文庫・外字注記辞書(改訂第八版)」にない漢字で「CHISE IDS 漢字検索」の字形とも少し異なる旨と、底本の問題の漢字画像を添えていただけると助かります。
 さらに、文字が「CHISE IDS 漢字検索」にもない場合は、「※[#「斗+林」、352-5]」のように文字の組合せと底本のページ数-行数のみを注記に入れ、テキスト送付時に「青空文庫・外字注記辞書(改訂第八版)」と「CHISE IDS 漢字検索」にない漢字である旨と、底本の問題の漢字画像を添えていただけると助かります。

Q:著者名が、ある作者の別名となっているときは、どうすればいいですか?

A:入力申請の際、受付システムに「人物 ID 一覧」に「別名」があれば、その「別名」の人物 ID を入れてください。ない場合、明らかに「ある作者」の別名とわかっている場合は、「ある作者」の人物 ID を入力し、「備考」に「底本の著者名は「別名」」と記述してください。そして作成するファイルの冒頭には、その「別名」を記入してください。
 ただし解題に初出時の署名は「別名」とあるだけで、底本の奥付や本文の著者名が「ある作者」になっている場合は、「ある作者」の人物 ID を入力するだけで結構です。そして作成するファイルの著者名は「ある作者」とし、ファイル末に「※初出時の署名は「別名」です。」と記述してください。

Q:変体仮名(万葉仮名)が底本で使われていました。どうしたらよいでしょうか?

A:「ゑ」や「ゐ」以外の変体仮名には、今の所JIS文字コードが割り当てられていません。

・入力を担当されている場合
 三つの対処法があります。
 まず、原則として、「ゑ」や「ゐ」以外の変体仮名は、現在の平仮名もしくは片仮名に書き換えて入力してください。一つの変体仮名には、それに対応する現在の平仮名が一つあります。変体仮名の実際と、対応する現在の平仮名については、しだひろしさんによる「ヘンタイがいっぱい(原題、変体仮名の注記・改定案)」(http://www33.atwiki.jp/asterisk99/pages/91.html)、そして同頁の「参考資料」が大変参考になります。

1.現在の平仮名に書き換える際は、ファイル末に以下の例のように注記を追加してください。
  例1-1:※変体仮名は、通常の仮名で入力しました。
  例1-2:※「変体仮名え」「変体仮名い」は、仮名にあらためました。

2.変体仮名を現在の平仮名に書き換えず、外字注記の規則に沿って本文中に注記する方法もあります。
  例2-1:※[#変体仮名え、ページ数-行数]
 本文中に注記をした際には、ファイル末にも以下の例のように注記を追加してください。
  例2-2:※「変体仮名え」は、「江」をくずした形です。

3.文意を伝える上で必要な場合は、変体仮名の字形を本文中に画像として組み込むという方法もあります。その際は「注記一覧」の「画像」の注記に従ってください。
  例3:[#変体仮名あ(fig作品ID_通し番号.png、横20×縦20)入る]
 どの方法を取れば良いのか迷われたときは reception@aozora.gr.jp までご相談下さい。その際、できれば変体仮名が使われている箇所の画像データも送っていただけると助かります。

・校正を担当されている場合
 まず、ファイル末の注記(※から始まる文)を見て、変体仮名について入力者がどういう方針を取っているのかを確認してください。
その後、テキスト本文中にある変体仮名に関する記述、または画像が底本と対応しているのかを確かめる必要があります。
 しだひろしさんによる「ヘンタイがいっぱい(原題、変体仮名の注記・改定案)」(http://www33.atwiki.jp/asterisk99/pages/91.html)には、変体仮名の字形画像とそれに対応する現代の平仮名が多く掲載されています。底本と見比べていただき、判断の参考にしてください。当てはまる画像がなかった場合でも、同頁の「参考資料」にあるリンク集が大変参考になります。(「入力を担当されている場合」もご参照ください。)

Q:作業中一覧にある「入力取り消し」ってステータスは、何ですか?

A:「入力取り消し」は、先に申請しておられた方が何らかの事情で(本人の断念または連絡不達等)、入力までに至らなかった作品について、そのステータスがついています。その場合、別底本による申請はもちろんのこと、同底本による入力も、新たに開始することができます。なお同底本の場合は、受付システムからの申請以外にも、reception 宛てに作品 ID を付記した上で、作業を引き継ぎたい旨を送っていただく形でも、申請を受け付けております。

Q:OCR を用いて作業する際の注意点はありますか?

A:スキャナから OCR(光学文字認識)を利用して生成したテキストファイルには、特有の間違いが多く見受けられます。スキャナを用いて OCR 入力する際、および OCR 入力したテキストを校正する際には、「校正部屋」(http://www.planaria.org/prr/)にある「デジタル校正の覚え書き【旧版】」(http://www.planaria.org/prr/#toc)および「誤認識されやすい文字リスト」(http://www.planaria.org/prr/ver1/charlist.html)がたいへん参考になります。
 また、OCR を活用して校正を効率的に進める手立てもあります。「校正をやりやすくする為に - aozorablog」(http://www.aozora.gr.jp/aozorablog/?p=565)もご参照ください。

Q:反対に、手入力作業をした際の注意点はありますか?

A:手作業による入力にも、また特有の間違いがあります。sogoさんによる「SOGO_etext_library」(http://e-freetext.net/)内の「手入力したテキストファイルに対する覚え書き」(http://e-freetext.net/tenyuryoku.html)には、手入力した際に多い誤りがまとめられています。ぜひ参考にしてください。

Q:入力・校正作業の際、漢字の字体の「包摂」をよく間違ってしまうのですが……

A:工作員マニュアルからは、判断の基準となる「JIS X 0208と0213規格票の包摂関連項目」(http://www.aozora.gr.jp/hosetsu_kijyun/)にリンクされていますが、実際の作業では正しく判別するのがなかなか難しいのも事実です。その場合は、以下の判定フローチャートも試してみてください。
包摂基準の判定フローチャート

Q:Mac で作業したファイルがうまく保存できません! どうすればいいですか?

A:Mac 付属の「テキストエディット」では、初期状態で保存できるのが「リッチテキストフォーマット(rtf)」になっています。青空文庫で採用しているのは、「Shift JIS」の「標準テキスト(txt)」ですので、以下の手順に従ってください。
 1:「テキストエディット」の「環境設定」→「新規書類」で、フォーマットを「標準テキスト」にしてください。
 2:「テキストエディット」の「環境設定」→「開く/保存」で、「標準テキストのエンコーディング」の「ファイルを保存するとき」を「日本語(Shift JIS)」にしてください。これで新規書類は「標準テキスト」で作成され、保存するときには「日本語(Shift JIS)」になります。
(※なお、作業済のファイルに関しては、「フォーマット」の項目で「標準テキストにする」を選ぶと、標準テキストに変更できます。あとから文字コードを変更することはできませんが、標準テキストにしてあれば、文字コードの変換は他のソフトで容易にできますので、文字コードだけ変換できなかった旨、ファイル送付の際に申し送りください。)


読書について


Q:青空文庫は縦書きでは読めないのですか?

A:青空文庫のテキストに対応したテキストビューワが、多くの会社・個人から各 OS・端末向けに様々開発されていますので、そちらを用いると縦書き含め、快適な読書環境が整えられます。
 「青空文庫の XHTML, TEXT の読み方」(http://www.aozora.gr.jp/readingTEXT/index.html)のページもご参照ください。

Q:本をジャンル別に探したいのですが……

A:「総合インデックス」にリンクで組み込まれた「青空文庫 分野別リスト」(http://yozora.kazumi386.org/)では、日本十進分類法(NDC)にのっとって内容別に分類された一覧から、公開中の作品を探せます。また、児童書に限定したリストも用意してあります。

Q:読みたい作品があるのですが、正確なタイトルがわかりません……

A:スクリプツ・ラボさんによって、「青空文庫 うろ覚えタイトル検索」(http://aozora.pinpointfinder.jp/search.cgi)という無料サービスが提供されています。一度、お試しを。

Q:読んでいるときに「誤植かな?」と思えるところがありました。どうすればいいでしょうか?

A:青空文庫は、通りすがりの読者からの誤植の指摘を歓迎しています。作品ファイルや図書カードにおかしいと思うところがあったら、reception@aozora.gr.jp に連絡してください。
 連絡に先立って、できれば、ファイル末に記載してある底本に図書館等で当たってください。「間違い」と思った表記が、作者特有の書き方だったり、かつては当たり前のものだったりすることが、しばしばあります。「やはり入力時のミスである」と確認できたものだけを、底本の該当箇所のキャプチャ画像とともにご報告いただけると、助かります。

Q:XHTML 版を読んでいると、時々文字が画像になっていたりします。これは何なのですか?

A:青空文庫の XHTML 版では、くの字点を除く JIS X 0213 の文字を画像で表示することにしています。
 この画像ファイルは、有償・無償を問わず自由に利用できます。zip 形式で圧縮した gaiji フォルダは、こちら(http://www.sumomo.sakura.ne.jp/~aozora/gaiji/gaiji.zip)からダウンロードできます。

Q:青空文庫に○○の「××」という作品がないのですが……

A:ある作品がないことについて、何種類かの理由が考えられます。

 1.その作品の著作権は、現在も保護期間中にある。
 2.「××」は作品集のタイトルのため、各作品ごとに収録されている。
 3.その作品を入力(校正)しようと思い立ち行動に移したボランティアがいないため、青空文庫ではアーカイヴされていない。

 文学作品などの著作物は、著作権法でさまざまに保護されています。つまり、他人が創りだした作品を第三者が勝手にコピーして配布することなどは許されません。しかし著作権法では、その保護期間に制限を設けています。日本では、著者が亡くなってから50年です。この保護期間が過ぎれば、誰もが自由にコピーが出来るようになります。青空文庫には、この保護期間の過ぎた作品が登録されています(「Q:著作権って、何ですか?」もご参照ください)。
 さらに翻訳作品・古典作品の場合は、原著者に加えて翻訳者または校訂者の権利が切れていなければいけません。翻訳作品については、戦勝国から政治的ペナルティとして与えられた「戦時加算」(http://www.aozora.gr.jp/KOSAKU/MESSAGE.html#ANK3)という問題もあります。なお校訂者の権利については「校訂者の権利に関する報告」(http://www.aozora.gr.jp/houkokusyo/koteisha/koteisha.html)もご一読ください。
 また2について、たとえば太宰治の『晩年』は作品集の題名であるため、青空文庫では作品個別で収録をしています。詳しくは収録各作品の「作品について:」をご覧ください。以下は、巻頭作品「葉」の図書カードです。
 http://www.aozora.gr.jp/cards/000035/card2288.html
 またその他、特定の作品集を構成する要素が複数に分割されている際、同様の記述が図書カードにある場合もありますので、どうかご確認ください。
 3については、青空文庫以外のどこかでアーカイヴされている可能性があります。それでも見つからない場合は、誰も電子化に取り組んでいないのかもしれません。そういった作品は、気づいた方の自発的な行動に期待したいと思います。(青空文庫ではリクエストの仕組みを設けてはおりませんが、実作業以外にも情報共有を試みるなど色々な道があります。)

Q:青空文庫収録作品の感想を共有したいです!

A:Web サービスの「ブクログ」(http://booklog.jp/)は、青空文庫収録作品に対応しています。また青空文庫の図書カードの各ページからも、当該作品に対応したブクログのページにリンクしています。どうぞご活用ください。

Q:作者別リストでは、芥川龍之介が竜之介になっているのですが、どうしてですか?

A:青空文庫の「総合インデックス」では、人物名は新字で表記しています。著者名を新字でとることは図書館 OPAC(Online Public Access Catalog)等でも広く行われており、青空文庫でもそれに習って、「芥川」は「龍之介」でなく「竜之介」、「みだれ髪」の歌人は「與謝野晶子」ではなく「与謝野晶子」としています。ただし、作品ファイルの冒頭に記載する著者の名前については、底本通りを旨としているため旧字にすることもあります。「芥川」は大半の書籍で「龍之介」としているため、ファイル冒頭の表記もほとんどがこの形となります。


ファイルの利用について


Q:青空文庫にあるコンテンツは自由に使ってもいいのでしょうか?

A:著作権の切れている作品については、原則として自由にご活用いただけます。詳しくは「青空文庫収録ファイルの取り扱い規準」(http://www.aozora.gr.jp/guide/kijyunn.html)をご参照ください。

Q:青空文庫で公開されている作品で著作権が残っているものは、すべてクリエイティブコモンズライセンス(CCL)つきと考えていいですか?

A:著作権保護期間中の作品には、三種類あります。
 1.青空文庫の本体サーバにファイルがあるもの。(必ず CCL つきです。)
 2.本体サーバにないが、CCL(またはそれに準ずるライセンス)がついているもの。
 3.本体サーバになく、CCL もないもの。(ただし、「読んでもらってかまわない」との“あいまいな”表明がある場合も。)

Q:青空文庫にある作品を朗読したいのですが……

A:「青空文庫収録ファイルの取り扱い規準」(http://www.aozora.gr.jp/guide/kijyunn.html)に従って、どうぞご活用ください。
 aozorablogには、「青空文庫/朗読・音声化入門ガイド」(http://www.aozora.gr.jp/aozorablog/?p=163)という記事もあります。ご参考まで。

Q:研究のために青空文庫で用例を検索したいのですが……

A:「全文検索システム ひまわり」に対応したパッケージが、有志によって提供されています。(http://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9%2F%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%2F%A1%D8%C0%C4%B6%F5%CA%B8%B8%CB%A1%D9%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8)
 また、「青空 WING」という作家・作品情報と全作品テキストを一つにまとめた EPWING データも、有志によって制作されています。(http://aozorawing.sourceforge.jp/)
 さらにまた、次のページでも、用例検索ができるようです。「日本語用例検索」(http://www.let.osaka-u.ac.jp/~tanomura/kwic/aozora/)
 ほかにも、「青空文庫 形態素解析データ集」(http://aozora-word.digiweb.jp/)というものが、あるようです。

Q:青空文庫形式のテキストを他形式に変換するにはどうすればいいですか?

A:変換ソフトが、様々な方々の手によって用意されています。
 「AozoraEpub3」(http://www18.atwiki.jp/hmdev/pages/21.html)
 「青空キンドル」(http://a2k.aill.org/)
 その他、検索サイト等で「青空文庫 変換 (ファイル拡張子)」と入力すれば、求めるものが見つかるかもしれません。

Q:青空文庫ロゴは自由に利用してもいいのでしょうか?

A:トップページ(http://www.aozora.gr.jp/)等で用いられている「青空文庫」の四角いロゴですが、「クリエイティブ・コモンズ 表示-改変禁止 2.1 日本 ライセンス」(http://creativecommons.org/licenses/by-nd/2.1/jp/)にて公開しております。
 ただし、ロゴの使用がたとえば「公認」「青空文庫の運営」を意味するようなことは、ありません。くれぐれも誤解のなきようお願い申し上げます。

Q:青空文庫に登録されている作品の、おおよその長さを知りたいのですが……

A:公開中の作品であれば、図書カードの「ファイルのダウンロード」の「サイズ」欄を参照すると、作品のだいたいの長さを確認することができます。いずれも、サイズは「バイト」単位です。「キロバイト」に換算するには、(不正確ですが)1000で割ってください。圧縮ファイルの解凍後のサイズは、圧縮した状態の、ほぼ2倍となります。1キロバイトは、全角文字に換算すると、500文字です。図書カードに記載されている数字が10000であれば、解凍後は20キロバイトとなり、400字詰め原稿用紙で約25枚分の長さです。ただし、画像が別に添付されている場合には、圧縮後のファイル容量が実際の長さより大きくなる場合があります。
 また、未公開の作品のうち、入力済となっているものに関しては、以下の手順でサイズが確認できます。
「作業着手連絡システム」→「校正受付システム」→「作家インデックス」→「作家一覧」から作家をクリック→「作品選択」の一覧でサイズを確認

Q:ダウンロードしたテキストファイルに、今の注記形式とは異なるものが挿入されているのですが……

A:青空文庫は、電子化作業を進めつつ注記の仕様を固めてきました。折々古いものを改めようとはしておりますが、いまだ修正が追いついていないものもあります。どうかご容赦ください。

Q:企業が青空文庫のファイルを使って商売をしているようなのですが、いいのですか?

A:利用が「青空文庫収録ファイルの取り扱い規準」(http://www.aozora.gr.jp/guide/kijyunn.html)に則った形であれば、まったく問題ありません。また、ボランティアに参加される際には、そのように用いられることもあると、あらかじめご承知ください。

Q:作品ファイル内で注記や画像で表されている文字を、コード化したいのですが……

A:H.Nakanoさんが、青空文庫のテキストファイルを JIS 第三・第四水準に対応した UTF-8 テキストに変換する「青空文庫データ変換ツール」(http://www.king.zaq.jp/nakano/projects/misc/aozora_tool.html)を用意してくださっています。

Q:青空文庫のテキストファイルに入っているたくさんのルビをどうにかしたいのですが……

A:お答えは「どうにかしたい」の内容によりますが、たとえば以下のページを参考にしてみてください。
 「青空文庫テキストの傍点やルビ記号を変換「RubyMate」」(http://www.forest.impress.co.jp/article/2008/10/20/okiniiri.html)
 「青空文庫のテキストからルビを削除するには」(http://www.aokids.jp/others/delruby.html)
 「ルビつきの字を読みのみに変換するプログラム」(http://homepage3.nifty.com/01117/rubytr.htm)
 「青空文庫のテキストデータからルビを削除」(http://refirio.org/view/213)
 「正規表現で青空文庫のルビを削除 - 空想Whisper」(http://d.hatena.ne.jp/Narukami/20090815/p1)
 「青空文庫のテキストファイルを整形する」(http://members.jcom.home.ne.jp/xhp/aozora_pl.html)
 むしろもっとルビ(ふりがな)が欲しい! という方は、以下のページもご参照ください。
 「ひらひらのひらがなめがね」(http://www.hiragana.jp/)


その他


Q:著作権って、何ですか?

A:青空文庫の著作権に対する姿勢は、「本という財産とどう向き合うか」(http://www.aozora.gr.jp/KOSAKU/MESSAGE.html)にまとめられています。
 また著作権について詳しく知りたい場合は、文化庁/著作権のホームページ(http://www.bunka.go.jp/chosakuken/)から、わかりやすく学べるページへ多数リンクされてありますので、ぜひそちらをご参照ください。
 公益社団法人著作権情報センター(http://www.cric.or.jp/)にある情報も、たいへん役に立ちます。困ったときは、まずはこれらのサイトに解決策が書かれていないか確かめるのも、ひとつの方法です。

Q:パブリック・ドメイン・デイって、何ですか?

A:パブリック・ドメイン・デイというのは、簡単に言えば1月1日のことです。国の境をこえて著作物を保護する枠組みに、ベルヌ条約というものがありますが、その条約には保護期間算定の区切りを1月1日とする規定があり、加盟国の国内法でも境目はこの日に置かれています。そのため、著作者の創作を支援し報いるための一定の保護期間が過ぎた作品は、その日を境に元の文化に帰するものとして、誰でも自由に利用できるようになります。そのことを祝う人々がいることを知り、青空文庫でも1月1日を「ハッピー・パブリック・ドメイン・デイ!」と毎年言祝ぐようにしています。

Q:青空文庫のアプリの使い方がわかりません。

A:青空文庫は公式にアプリ開発を行ってはおりません。青空文庫のコンテンツを利用できる「青空文庫」の名前を冠した各種アプリやサービスにつきましては、申し訳ありませんが、各開発元・サービス元へお問い合わせください。

Q:わたしがどの作品を読んだか、青空文庫にはわかるのでしょうか?

A:青空文庫では、各作品のアクセス数について、毎月の「アクセスランキング」(http://www.aozora.gr.jp/access_ranking/)が公表されておりますが、それ以上の特定の個人の読書履歴については関知しておりません。

Q:電脳倶楽部って、何ですか?

A:電脳倶楽部というのは、1988年から12年間にわたり、満開製作所からフロッピーディスクで発行されていた電子雑誌です。その第3号からはパブリックドメインになった文書を電子化するコーナーがあり、青空文庫では関係者の了承のもと、10年も先だって取り組まれていた運動に敬意を表して、宮沢賢治「銀河鉄道の夜」や芥川龍之介「羅生門」等、一部のデータを引き継いで公開しております。そのほか青空文庫では、岡島昭浩さんの「日本文学等テキストファイル」、京都大学電子図書館の「電子化テキスト」などの先行活動、さらに「牧野信一電子文庫」「物語倶楽部」「古典総合研究所」等の青空文庫外の電子化活動の成果を引き継いだものも収録しています。

Q:青空文庫に関係する様々なことについて、情報交換する場は用意されていないのでしょうか?

A:これまで幾度か、有志の方々のご厚意によって提供された掲示板等を、活用してきました。しかし諸般の事情からやむなく閉じることも少なくありません。機能する時期もあれば、そうでないときもあり、試行錯誤を繰り返しています。今後そういった場が構築されるかどうかは、きっと、個々のボランティアの意思と努力にかかっているのでしょう。

Q:青空文庫にお願い(不満)があるのですが……

A:青空文庫は、個々人の自発的な意志と行動が集まって成り立っているボランティア活動です。何か依頼があっても、参加している誰かが自発的に「やる」と思わなければ、あるいは既存の活動以外の「余裕がない」という場合には、何も動かないことがあります。青空文庫に何かお願いしたいとき、不満を抱いたときは、まずひとりのボランティアとして、自分から何かすることで解決できないかを考えていただけると助かります。




更新履歴:「青空文庫」
   2014(平成26)年1月1日
   2014(平成26)年4月1日修正
2014年4月1日作成
青空文庫作成ファイル:
このファイルは、インターネットの図書館、青空文庫(http://www.aozora.gr.jp/)で作られました。制作にあたったのは、ボランティアの皆さんです。




トップページへ戻る