国立情報学研究所 - ディジタル・シルクロード・プロジェクト
『東洋文庫所蔵』貴重書デジタルアーカイブ

> >
  日本語 English

:: 本サイトの内容についてのおことわり ::

本サイト(「東洋文庫所蔵」図像史料マルチメディアデータベース)の内容は、次の2種類に大別されます。

  1. 画像データ 原典のカラー中精度画像、グレースケール高精度画像、サムネイル画像など。
  2. 付加テキストデータ 画像データを自動文字認識(OCR)ソフトで処理した結果であるOCRテキスト、原典の解説、画像データ中の目次や図説明を抜き出して写したもの、これに日本語および英語の翻訳をつけたもの、あるいはOCRテキストをそのまま、又はこれを自動翻訳ソフトにかけた結果を、自動索引生成プログラムで処理し、テキスト検索の対象としたものなど。本プロジェクトで付加したデータ。

原典と本サイトの内容の信頼性に関する現在の状況は、次の通りです。

  1. 原典の記述の内容の信頼性については、原著者と話題によりますが、「学説はつねに進歩しうる」こと、すなわち「ある時点の記述は、後に誤りとされることがありうる」ことを前提としてお読み下さい。
  2. 画像データは、原典をできるだけ忠実に再現しようとしていますが、ページの配列ミスなどの可能性を否定することはできません。グレースケール画像は原典の調査を助けるために文字部分を強調した画像であり、原典の明暗を正確に再現しているわけではありません。
  3. 加工テキストデータは、現在データチェック前のものも含めて、最新作業状況を直ちに公開しています。これにより、不完全な状態のデータでも、すぐに検索に利用できるようになります。専門家の助力も得つつ、誤りは逐次修正していきますが、現在はまだ誤りの多い状態です。付加テキストデータを「正しいもの」として、たとえば試験などに使うこと等は避けて下さい。正確を期するには、画像データをごらん下さい。

原典の内容は、アジア各地の歴史・地理・社会などに関連したもので、その多くは19世紀から20世紀初頭の、欧州各国の研究者による歴史的に重要な文献、蒐集物、および中国の史書です。原典には、他文化に対する偏見を示す表現や、現在では使われていない国名や地域の呼び方など、現代の感性からすれば読者に不快感を抱かせうる部分も含まれておりますが、研究者の役に立つよう原典の十分な情報を公開することを目的としているため、これらを含めて全頁の画像データを公開していることをご承知下さい。また、歴史的な正確さと画像データへのアクセス可能性を保つために、付加テキストデータの一部にも(原典に由来する)そのような表現が含まれますが、これらの表現はわれわれ(ディジタル・シルクロード開発グループ、国立情報学研究所、ないし東洋文庫)の意見あるいは態度を示すものではなく、またわれわれが、現代における、原典から離れた所でのそのような表現の使用を是認することを意味するものでもないことを、特にお断りしておきます。

このディジタル・アーカイブを改善してゆくため、付加テキストデータ中の問題点など、お気づきの点がありましたら、dsr-toyobunko [at] nii.ac.jp までメールでお知らせください(なお、頂いたメールは、その全文または一部をオンライン又は印刷で公開する場合があります。公開時にメールアドレス又は/およびシグネチャー[メール末尾の署名]の秘匿を希望される方は、そのむねメール中にご記入下さい。)