モノクロ文字原稿からノイズを除去する方法

Webに印刷物のスキャニングしたものを掲載したいという要望は、ちょくちょくあります。
そのときに困るのが、色のついた紙に印刷されたものや、かなり色あせた新聞です。

現物が入手できるなら、フルカラーでスキャンしてブラック版以外を捨てる とかやり方はあるわけですが、モノクロコピーしかないということもけっこうあります。

地色がついたものをモノクロコピーすると、背景がグレーになってしまいます。
文字が読めないわけではないのですが地色が濃いと読みづらいですし、このまま画像にするとファイル容量がもの凄く大きくなります。
ノイズ部分に圧縮がかからないからです。
ファイルサイズが大きいというのは、Webではかなりの問題になります。

解像度を下げるわけには行きません。
通常のノイズ除去を行うと、ノイズが消えるまで行うと文字まで読みづらくなってしまいます。

そこで、多少手間はかかりますが、文字以外のノイズは消して、文字の品質は損なわれない方法をご紹介します。

画像処理には、Photoshopを使います。

  1. まずPhotoshopでスキャニングした画像を開きます。 RGBだったらグレースケールにしてください)
    多分、このように、文字の間にぎっしりノイズが入った画像になっていると思います。
    noise_reduction0.gif
  2. チャンネルを複製します。
    noise_reduction1.gif
  3. 複製したチャンネルに、ぼかし(ガウス)をかけます。半径は1ピクセルでokです。
    noise_reduction2.gif
  4. ぼかしたチャンネルにレベル補正をかけます。
    地色が消えて、文字部分が最も太るように調整してください。文字部分は潰れてしまってかまいません。
    noise_reduction3.gif
  5. 元のチャンネルに切り替えます。
  6. 選択範囲を読み込みます。
    反転にチェックし、先ほどレベル補正したチャンネルを読み込みます。
    noise_reduction4.gif
  7. 選択範囲を消去すれば、きれいに文字だけが残ります。
    noise_reduction5.gif

レベル補正で文字が太るように調整すると、画像部分がいい感じで残りますので、見た目にかなり良いと思います。
原稿によって違うと思いますが、私が今回作業したA4サイズのものでは、GIFでファイルサイズが3分の1になりました。

この記事を書いた人

川井 昌彦
川井 昌彦
FAシステムメーカー、国内最大手印刷会社製版部、印刷・ウェブ制作会社を経て、家庭の事情で実家に帰省して独立
現在はフリーランスと制作会社シニアディレクターのマルチワーク
ウェブ制作のほぼ全般を見渡せるディレクター業務が主だが、デザイン・コーディングも好き

1997年ブログ開設
WordPressコミュニティには2011年から参加
WordCamp Kansai 2016 セッションスピーカー
WordCamp Tokyo 2023 パネルディスカッションパネラー
WordBench京都、WordBench神戸、WordPress Meetup八王子など登壇多数

“モノクロ文字原稿からノイズを除去する方法” への2件のフィードバック

  1. カラスの白昼夢のアバター
    カラスの白昼夢

    大量の斑点が生じた画像を何とかしたかったのですが、ノイズとともに文字も線もすべて消えてしまいます。
    一体どうやっているのでしょうか。
    6.選択範囲を読み込みます。
    反転にチェックし、先ほどレベル補正したチャンネルを読み込みます。
    この段階で、ノイズだけでなく文字も範囲選択されてしまうため、その状態で消去を行うと当然全て消えてしまうのですが・・・。

    1. 川井 昌彦のアバター
      川井 昌彦

      コメントありがとうございます。
      このテクニックのポイントは、3. のぼかしと4.のレベル補正でノイズを消した選択範囲をつくるというところです。
      4.の段階で投稿の画像のような、ノイズが消えて文字がつぶれた状態で残っている状態になっていますでしょうか?

      こうなるためには、ノイズと文字の大きさの差が必要です。
      ノイズが文字くらい大きい場合は、このテクニックは使えないと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Vektor Passport(ライセンス期間1年)
VK Filter Search Pro
Vektor WordPress Solutions
PAGE TOP