会社情報 お問い合わせ 購入ガイド 製品ダウンロードセンター 製品活用の小技

Wondershare PDFから簡単変換!プロ(Windows版)

PDFから簡単変換!プロ(Windows版) OCRについて

Part 1: OCR とは Part 2: OCRの利点

Part 1. OCR とは

 

 OCR とは、Optical Character Recognition の略記で、光学文字認識のこと。PDF 変換シリーズ最新作『PDFから簡単変換!プロ』は、日本語対応の OCR 機能を搭載。 本機能を利用すると、文字が画像化されているPDFファイルに対しても、画像 からテキスト情報を抽出して、PDFを各形式ファイルへの高精度変換も可能。

 

OCR機能で画像形式のPDFを変換

 

Part 2. OCRの利点

 

 OCRは、スキャンされた紙ドキュメント、PDFファイル、またはデジカメにより撮影されたイメージ画像のような、タイプが異なるドキュメントを編集可能または検索可能なデータへの変換に、広く利用されています。 ある特定な場合(例えば、図書館、オフィスなど)で、何千冊もの本や書類はバックアップおよびアーカイブのために定期的にスキャンします。

スキャナーはオリジナルな紙ドキュメントに対して写真を撮るだけで、イメージ画像に基づいてのPDF形式のドキュメントという結果になります。 大量のスキャンされたドキュメントの処理・保存についての主な問題として、ファイル内の特定の語句や名前を検索することができないことがあげられます。

また、テキスト文字ではなく、このようなドキュメントには、一つの大きな画像ファイルが含まれているため、テキストは、強調表示、コピー、あるいは変更されることはできないようになっています。

 

OCRサンプル

 

OCRを実行する前に、ページ上の領域全体が選択され、強調表示されて、テキストが検索されることも編集されることもできません。

OCRを実行した後、ページ上のテキストが選択ツールで選択できるようになり、文字、単語、そして段落を検索し、編集することが手軽にできるようになっています。

さらにOCRについて読むには、こちらのページをご参照ください。

 

OCRを使用した変換について

※OCRを使用した変換では、PDF内の画質によって文字が正しく認識できない場合があります。文字を正しく認識させるためには次のような画像がお勧めです。

● ビットマップ形式の画像

● 歪みやノイズの少ない画像

● 解像度の高い画像

● 定ピッチに印刷、印字された文書

については100%に近い精度で認識することができます。

しかし、

不定ピッチに印刷、印字された文書

● 低画質文書(FAX、コピーした原稿)

● フォントの識別

● 文字と非文字の区別

● 確実なリジェクト

● 背景下の文字

● 見出しなどの飾り文字

● 縦書きのPDF形式

などになると認識率が低下する場合があります。

 

週間売れ筋ランキング(週ごとに更新)

PDF変換・編集・作成(Windows版) お勧め関連製品

Wondershare データリカバリー (Windows版)

Wondershare データリカバリー (Windows版)

PCのHDD、sdカード、ゴミ箱、USBドライブなどから削除されてしまった写真、音楽、動画、ドキュメント、電子メールなどを高品質で復元します。

4980円(税込)

詳細を見る

Wondershare スーパーPDF変換・編集・作成+OCR(Windows版)

Wondershare スーパーPDF変換・編集・作成+OCR(Windows版)

「スーパーPDF」から進化した新製品「PDFelement Ver.7」がリリース!今すぐ「PDFelement」を無料体験→

7960円(税込)

詳細を見る

Wondershare Filmora(Windows版)

Wondershare Filmora(Windows版)

動画・画像編集ソフトで、オリジナル作品をYouTubeやFacebookに数クリックで公開!DVD作成もこれ一本!初心者でも動画編集を楽しめます!

7980円(税込)

詳細を見る

ホーム > オフィス > PDF変換・編集・作成(Windows版) > PDFから簡単変換!プロ(Windows版)