モノクロ文字原稿からノイズを除去する方法

Webに印刷物のスキャニングしたものを掲載したいという要望は、ちょくちょくあります。
そのときに困るのが、色のついた紙に印刷されたものや、かなり色あせた新聞です。

現物が入手できるなら、フルカラーでスキャンしてブラック版以外を捨てる とかやり方はあるわけですが、モノクロコピーしかないということもけっこうあります。

地色がついたものをモノクロコピーすると、背景がグレーになってしまいます。
文字が読めないわけではないのですが地色が濃いと読みづらいですし、このまま画像にするとファイル容量がもの凄く大きくなります。
ノイズ部分に圧縮がかからないからです。
ファイルサイズが大きいというのは、Webではかなりの問題になります。

解像度を下げるわけには行きません。
通常のノイズ除去を行うと、ノイズが消えるまで行うと文字まで読みづらくなってしまいます。

そこで、多少手間はかかりますが、文字以外のノイズは消して、文字の品質は損なわれない方法をご紹介します。

画像処理には、Photoshopを使います。

  1. まずPhotoshopでスキャニングした画像を開きます。 RGBだったらグレースケールにしてください)
    多分、このように、文字の間にぎっしりノイズが入った画像になっていると思います。
    noise_reduction0.gif
  2. チャンネルを複製します。
    noise_reduction1.gif
  3. 複製したチャンネルに、ぼかし(ガウス)をかけます。半径は1ピクセルでokです。
    noise_reduction2.gif
  4. ぼかしたチャンネルにレベル補正をかけます。
    地色が消えて、文字部分が最も太るように調整してください。文字部分は潰れてしまってかまいません。
    noise_reduction3.gif
  5. 元のチャンネルに切り替えます。
  6. 選択範囲を読み込みます。
    反転にチェックし、先ほどレベル補正したチャンネルを読み込みます。
    noise_reduction4.gif
  7. 選択範囲を消去すれば、きれいに文字だけが残ります。
    noise_reduction5.gif

レベル補正で文字が太るように調整すると、画像部分がいい感じで残りますので、見た目にかなり良いと思います。
原稿によって違うと思いますが、私が今回作業したA4サイズのものでは、GIFでファイルサイズが3分の1になりました。

モノクロ文字原稿からノイズを除去する方法” に対して2件のコメントがあります。

  1. カラスの白昼夢 より:

    大量の斑点が生じた画像を何とかしたかったのですが、ノイズとともに文字も線もすべて消えてしまいます。
    一体どうやっているのでしょうか。
    6.選択範囲を読み込みます。
    反転にチェックし、先ほどレベル補正したチャンネルを読み込みます。
    この段階で、ノイズだけでなく文字も範囲選択されてしまうため、その状態で消去を行うと当然全て消えてしまうのですが・・・。

    1. 川井 昌彦 より:

      コメントありがとうございます。
      このテクニックのポイントは、3. のぼかしと4.のレベル補正でノイズを消した選択範囲をつくるというところです。
      4.の段階で投稿の画像のような、ノイズが消えて文字がつぶれた状態で残っている状態になっていますでしょうか?

      こうなるためには、ノイズと文字の大きさの差が必要です。
      ノイズが文字くらい大きい場合は、このテクニックは使えないと思います。

川井 昌彦 へ返信する コメントをキャンセル