Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
PDF OCR スタート ガイド
1
スタートガイド
エクセルソフト株式会社
PDF OCR スタート ガイド
2
© Copyright 2013-2017 ORPALIS. All rights reserved.
Version 1.1.18 (2018.5.10)
Written by XLsoft Corporation
PDF OCR スタート ガイド
3
目次
はじめに ......................................................................................... 4
概要 ..................................................................................................................................... 4
ダウンロード ................................................................................. 5
評価版のインストールとアクティベート ............................................... 6
ライセンス登録 ................................................................................. 8
評価ライセンス ....................................................................................................................... 8
商用ライセンスのアクティベート .................................................................................................. 8
PDF OCR 製品の実行 ..................................................................... 9
検索可能な PDF ファイルを生成 ............................................................................................. 9
サポートするファイル形式 .................................................................... 13
サポートするドキュメント形式 .................................................................................................. 13
サポートする圧縮形式 .......................................................................................................... 15
サポートする言語 ............................................................................ 16
テクニカル サポート .......................................................................... 17
FAQ ................................................................................................................................... 17
お問合せ ............................................................................................................................. 17
PDF OCR スタート ガイド
4
はじめに
概要
ドキュメントを即座に PDF に変換、OCR 変換ツール
ORPALIS PDF OCR は、OCR およびレイアウト解析を使用し、とてもシンプルかつ生産性の高い方法
でどのようなドキュメントも検索可能な PDF へ変換します。
PDF OCR スタート ガイド
5
ダウンロード
最新の PDF OCR のインストールファイルは、下記のサイトからお申し込みできます:
https://www.xlsoft.com/jp/products/orpalis/download.html
1. PDF OCR には、クラウド版とオンプレミス版(デスクトップまたはサーバー)がありますので、ダウンロードする
際に、エディションを選択します。
オンプレミス版(デスクトップまたサーバー)を使用する場合は、Web のダウンロード ページで、エディションの
選択項目から、[PDF OCR On-Premises] を選択します。
インストール ファイルは、zip ファイルまたは実行可能インストーラーとして提供されます。
PDF OCR スタート ガイド
6
評価版のインストールとアクティベート
1. インストール ファイルを実行します。
2. インストールウィザードに従ってインストールを進めてください。
3. [Finish] ボタンをクリックして、インストールを完了します。
PDF OCR スタート ガイド
7
4. [ORPALIS PDF OCR Pro. Registration] ダイアログが表示されます。
評価版として、利用する場合は、[License KEY] を空欄のままにして、[Evaluate] ボタンをクリックし
ます。
製品を購入して、License KEY を受け取っている場合は、この画面で License KEY を入力して、
[Register!] ボタンをクリックすることで、ユーザーの登録ができます。
評価版の場合、次のようなダイアログが表示されます。
お名前(英語表記)と Email アドレスを入力して、[Submit] ボタンをクリックします。
注意:
登録には、インターネット接続が必要です。
インターネット接続ができない場合は、弊社までご連絡いただければ、オフラインでのアクティベートするための評
価用ライセンスキーを開発元に申請します。下記の弊社 Web のお問合せフォームからご連絡ください。
http://www.xlsoft.com/jp/services/xlsoft_form.html
会社名、氏名(英語表記)、email アドレスを必ずご記入ください。
5. 評価版であることが表示されます。
OK をクリックして、評価版の登録を完了します。
PDF OCR スタート ガイド
8
ライセンス登録
評価ライセンス 前述の評価版のインストールの章をご参照ください。
商用ライセンスのアクティベート
製品を購入すると、正規のライセンスキーを受け取ります。
最新の PDF OCR をインストールして、Registration ダイアログで License KEY を入力して、
[Register!] ボタンをクリックすることで、ユーザーの登録ができます。
PDF OCR スタート ガイド
9
PDF OCR 製品の実行
検索可能な PDF ファイルを生成
PDF OCR を使用すると、スキャナーで生成された画像ファイルを OCR 認識して、テキストが検索可能
な PDF ファイルを生成することができます。
画像ファイルを PDF OCR に変換するには:
1. PDF OCR を起動します。
PDF OCR スタート ガイド
10
2. [Source] に OCR 認識する画像ファイルを指定します。 [Destination] に出力先のフォルダを
指定します。 この例では、英語のテキストをスキャンした画像 (.PNG ファイル)を読み込みます。
3. 変換処理で同時に実行したいスレッド数を [Threads] ドロップダウンで選択します。
4. ソースファイルに対する OCR 言語を [OCR Language] ドロップダウンで選択します。
5. [Start] ボタンをクリックすると、OCR 認識および PDF への変換処理が開始されます。
6. 変換が完了すると、結果がダイアログの下部に表示されます。
PDF OCR スタート ガイド
11
変換された PDF ファイルを Acrobat Reader などの PDF ビューアで表示して、テキストが検索できる
ことを確認してください。
この例では、”desktop” という単語を PDF から検索すると、その場所がハイライト表示されています。
評価版の場合、PDF OCR の透かし(ウォーターマーク)が生成された PDF に追加されます。
PDF OCR スタート ガイド
12
次の日本語のテキストのサンプルでは、”記録方法” という単語を PDF から検索すると、その場所がハイ
ライト表示されています。
PDF OCR スタート ガイド
13
サポートするファイル形式
サポートするドキュメント形式 SVG SVG – Scalable Vector Graphics
PDF PDF – Portable Document Format
PDF/A – Document Format for long term preservation
PDF Multi-page – Portable Document Format
Metafile EMF – Enhanced Windows Metaformat
WMF – Standard Windows Metaformat
ラスター画像
WSQ – Wavelet scalar quantization
ANIMATED GIF – Graphics
Interchange Format
BMP – Standard Windows Bitmap
Format
CUT – Dr. Halo/Dr.Genius
Clipboard Format
DDS – Microsoft DirectDraw
Surface Format
DIB – Standard Windows Bitmap
Format
DICOM – Digital Imaging and
Communications in Medicine
EXIF – Exchangeable Image
Format
EXR – OpenEXR Format
FAX, G3 – Group 3 Raw Fax
Format
GIF, Interlaced GIF – Graphics
Interchange Format
PBM – Portable Bitmap File
PBM RAW – Portable Bitmap
BINARY
PCD – Kodak Photo-CD file
PCT, PICT, PIC – Macintosh PICT
Format
PCX – PC Paintbrush Format
PFM – Portable Float Map
PGM – Portable Graymap File
PGM RAW – Portable Graymap
BINARY
PSD – Photoshop File
PNG – Portable Network Graphics
Format
PNM – Portable Any Map
PPM – Portable Pixmap File
PPM RAW – Portable Pixmap
BINARY
RAS – Sun Raster Format
RAW camera image
PDF OCR スタート ガイド
14
HDR – High Dynamic Range
Format
IFF – Interchange Format
ICO (single page and multi page)
– Icone Format
J2K, J2C – JPEG-2000 Codestream
JB2, JBIG2 – Joint Bi-level Image
Experts Group
JIF, JFIF – JPEG File Interchange
Format
JNG – JPEG Network Graphics
JP2 – JPEG-2000 Format
JPEG, JPG, JPE – Joint
Photographic Expert Group
JPEG progressive
KOA – KOALA Format
LBM – Interchange File Format-
Interleaved Bitmap
MNG – Multiple-image Network
Graphics *
RAW memory bits – RAW bitmap
RLE – Standard Windows Bitmap
format
SGI – Silicon Graphics Image
Format
TGA, TARGA – TARGA Image
Format
TIFF, TIF – Tagged Image Format
TIFF Multi-page – Multi-page
Tagged Image Format
WBMP, WAP, WBM – Wireless
Bitmap
XBM – X-Bitmap Format
XPM – X Pixmap Format
PDF OCR スタート ガイド
15
サポートする圧縮形式
JPEG – Joint Photographic Experts Group.
OJPEG (Old JPEG 6.0 compression).
JPEG 2000 – JPEG wavelet-based image compression.
JBIG2 – Joint Bi-level Image Experts Group.
Packbits – lossless compression scheme for run-length encoding of data.
CCITT Group 3 Fax coding.
CCITT Group 4 Fax coding.
Modified Huffman coding.
RLE – Run-length encoding.
LZW – Lempel-Ziv-Welch
LogLuv – for high dynamic range imaging data.
Deflate
Huffman
Arithmetic coding
WebP
PDF OCR スタート ガイド
16
サポートする言語
Arabic
Bulgarian
Catalan
Czech
Chinese (Simplified)
Chinese (Traditional)
Cherokee
Danish
Danish (Fraktur)
German
Old German (Fraktur)
Greek
English
Finnish
French
Hebrew
Hindi
Hungarian
Indonesian
Italian
Japanese (日本語)
Korean
Latvian
Lithuanian
Dutch
Norwegian
Polish
Portuguese
Romanian
Russian
Slovakian
Slovakian (Fraktur)
Slovenian
Spanish
Serbian (Latin)
Swedish
Swedish (Fraktur)
Tagalog
Thai
Turkish
Ukrainian
Vietnamese
無料のクラウド版は、English, French, Spanish, German および Italian をサポート
します。
PDF OCR スタート ガイド
17
テクニカル サポート
FAQ FAQ については、弊社のサポート ページおよび開発元のサポート ページを参照してください。
エクセルソフト株式会社の Web
https://www.xlsoft.com/jp/products/orpalis/pdfocr.html
開発元 (ORPALIS) の Web
http://pdfocr.orpalis.com/faq/
お問合せ エクセルソフト株式会社ではテクニカル サポートを下記のお問い合わせ窓口より承っております。
https://www.xlsoft.com/jp/services/xlsoft_form.html
エクセルソフト株式会社
〒108-0073 東京都港区三田 3-9-9 森伝ビル 6F
https://www.xlsoft.com
E-Mail : [email protected]