文書・書籍アーカイブDOCUMENTS&PUBLICATION ARCHIVE
紙でしか残っていない古い書籍や資料をデジタル化する「文書・書籍アーカイブ」
書籍、社史、図面——。紙でしか残っていない古い書籍や資料をデジタル化し、保存します。
OCRによるテキスト付与でWeb上での全文検索も可能にし、有効活用できる資料としてアップデートします。
研究・教育機関、企業のDXご担当者様でこのようなお悩みはございませんか?
-
会社の移転にあわせ、資料収納スペースをスマート化したい
-
過去の書類や文書をデジタル化して管理や検索を楽にしたい
-
過去の刊行物・出版物をWeb上で見返せるようにしたい
そのお悩み、光村印刷の「文書・書籍アーカイブ」で解決します!
光村印刷の強み
AI-OCRによるテキスト付与
当社では、画像から文字を抽出し、テキスト検索や編集を可能にする技術であるOCRにAI技術を融合したAI-OCRを採用しています。非定型のレイアウト等も優れた精度で読み取ることができます。
▼画像をクリックすると、拡大画像が見られます
Point1 多段組・複雑なレイアウトも読み取り
Point2 記号や英数字・縦書きも読み取り
Point3 旧字・異体字対応+新字変換
Point4 図表内テキストも読み取り
※AI-OCR機能は、株式会社モルフォのサービスを利用しています。
アーカイブ対象物の例
書籍や雑誌、カタログや社内報、また古い文化史料など、さまざまな文書系資料を取り扱います。現物資料の劣化状況に応じて最適なデータ化の方法をご提案します。
デジタル化までの流れ
お客様の大切な資料をお預かりし、原稿のスキャンからデータ化後のテキスト抽出処理、データ利活用までを一貫して行います。
1. スキャン
アーカイブ対象物の状態や解体可否、点数、納期、予算などお客様のご要望にあわせて最適な方法をご提案し、データ化します。
2. OCRテキスト化
PDFやWeb上で文書内のテキストをワード検索したいなど、お客様のご要望に応じてOCRによるテキスト抽出を行います。
3. データ納品・利活用
検品したデータを納品し、お客様の要望とデータの使用目的に応じて、その後の利活用支援を行います。
アーカイブ実例サンプル・トライアル
社史のデジタルアーカイブ + デジタルブック化(全文テキスト検索可)
AI-OCR無料トライアルのご案内
導入前のご参考として、お客様がお手持ちのPDFを用いて、AI-OCRの性能を無料でご体感いただけます。文字認識精度や活用イメージをご確認いただけますので、お気軽にお試しください。
アーカイブ実績例
| 刊行物アーカイブ 【某独立行政法人様】 |
50年以上前の月報を所蔵。冊数やページ数も多いため、その内容をデータ分析に活用できるよう、検索性を向上させたいとご希望されました。全35冊、計10,000ページをスキャンし、AI-OCRでテキスト情報を付与。透明テキスト付きPDFや各種テキストデータを納品いたしました。 |
|---|---|
| 社内報アーカイブ 【某自動車メーカー様】 |
社史編纂にあたり、社内報の記事の検索性を向上させ、業務効率化を図りたいとのご希望でした。OCRによってテキスト化した後、校正によって誤字等を修正した、透明テキスト付きPDFを納品いたしました。 |
デジタルアーカイブ後のコンテンツ活用支援コース
お客様のご要望に応じてデータ利活用支援を行うため、目的別コースをご用意しています。
▶社史・周年史作成コース
写真や画像のデータ、抽出したテキストデータを使用し、新たに社史や周年史の企画・デザインに活かします。
写真や画像のデータ、抽出したテキストデータを使用し、新たに社史や周年史の企画・デザインに活かします。
▶デジタルブック作成コース
書籍、雑誌、カタログ、社内報などの文書データにAI-OCRを施し、検索性の高いデジタルブックに仕上げます。
書籍、雑誌、カタログ、社内報などの文書データにAI-OCRを施し、検索性の高いデジタルブックに仕上げます。
その他のコンテンツ活用例
Q&A
- 古い資料や傷んだ書籍でもスキャンできますか?
- はい。ただし、破れ・劣化・変色・ホチキス留めなど、状態によっては通常スキャンではなく、スキャン前の断裁や手作業での前処理が必要になる場合があります。現物確認とヒアリングのうえ、最適なスキャン方法をご案内します。
- 貴重な資料で1冊しかないのですが、断裁せずスキャンできますか?
- 資料の状態にもよりますが、断裁せずにスキャン(or撮影)することも可能です。ページの見開き具合や製本仕様によっては、仕上がりを優先して一度解体し、スキャン後に再製本して復元する方法もございます。資料の状態や、データの活用目的に合わせて最適な手順をご提案しますので、まずはお気軽にご相談ください。
- 納品時のデータ形式はなんですか?
- AI-OCR後の納品可能なファイルは、透明テキストつきPDF(新字/旧字)、TEXT(新字/旧字)、Word、JSON、描画結果JPEGとなります。その他、スキャンしたままの状態の画像データ(TIFF等)も納品可能ですので、ご要望に合わせて対応いたします。
- 費用はどのくらいかかりますか?
- ページ数やサイズ、保存状態、納期、その他OCRなどオプションの付帯によって変動します。まずはお気軽にご相談ください。
資料ダウンロード