モノクロ文字原稿からノイズを除去する方法

Webに印刷物のスキャニングしたものを掲載したいという要望は、ちょくちょくあります。
そのときに困るのが、色のついた紙に印刷されたものや、かなり色あせた新聞です。

現物が入手できるなら、フルカラーでスキャンしてブラック版以外を捨てる とかやり方はあるわけですが、モノクロコピーしかないということもけっこうあります。

地色がついたものをモノクロコピーすると、背景がグレーになってしまいます。
文字が読めないわけではないのですが地色が濃いと読みづらいですし、このまま画像にするとファイル容量がもの凄く大きくなります。
ノイズ部分に圧縮がかからないからです。
ファイルサイズが大きいというのは、Webではかなりの問題になります。

解像度を下げるわけには行きません。
通常のノイズ除去を行うと、ノイズが消えるまで行うと文字まで読みづらくなってしまいます。

そこで、多少手間はかかりますが、文字以外のノイズは消して、文字の品質は損なわれない方法をご紹介します。

画像処理には、Photoshopを使います。

  1. まずPhotoshopでスキャニングした画像を開きます。 RGBだったらグレースケールにしてください)
    多分、このように、文字の間にぎっしりノイズが入った画像になっていると思います。
    noise_reduction0.gif
  2. チャンネルを複製します。
    noise_reduction1.gif
  3. 複製したチャンネルに、ぼかし(ガウス)をかけます。半径は1ピクセルでokです。
    noise_reduction2.gif
  4. ぼかしたチャンネルにレベル補正をかけます。
    地色が消えて、文字部分が最も太るように調整してください。文字部分は潰れてしまってかまいません。
    noise_reduction3.gif
  5. 元のチャンネルに切り替えます。
  6. 選択範囲を読み込みます。
    反転にチェックし、先ほどレベル補正したチャンネルを読み込みます。
    noise_reduction4.gif
  7. 選択範囲を消去すれば、きれいに文字だけが残ります。
    noise_reduction5.gif

レベル補正で文字が太るように調整すると、画像部分がいい感じで残りますので、見た目にかなり良いと思います。
原稿によって違うと思いますが、私が今回作業したA4サイズのものでは、GIFでファイルサイズが3分の1になりました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です