解像度はいくつにするべきか

 〔約2100文字|読了の目安:4.2分〕

 書物をスキャンする際、解像度はいくつにするべきか。

 自炊技術Wiki には「自分が現在使っているディスプレイ及び将来使いそうなディスプレイの解像度よりも小さくしない」とあるが、これは良くない。ディスプレイの解像度なんて、時と状況によっていくらでも変わるからだ。Retinaディスプレイによってスマホタブレットの解像度が一気に上がるなんて誰が予想しただろう。

 印刷物の情報をなるべく減らさず、ファイルサイズがなるべく増えない辺りを探る。

印刷物の解像度

モノクロ二値 1200dpi
カラー/グレースケール 300~350dpi
新聞の画像 170~250dpi(モノクロ~カラー)

 ネットなどの情報を総合すると、こうなっているようだ。

 モノクロ二値というのは、小説などの文字や白黒の漫画スクリーントーンも含む)。「二値」というのは、中間色(グレーなど)がないということ。

 カラー/グレースケールは、中間色を扱うためにアミ点を使用している。これがモアレの原因になる。

 グレースケール* が使われるのは、白黒写真やライトノベルの挿し絵のような微妙な陰影のあるモノクロ画像。モアレ除去を使用しないといけないので、文字のみのページとは別にスキャンする必要がある。

 雑誌などで文字に色がついていることがある。これはモノクロ二値とカラーのどちらかというと、モノクロ二値だ。「モノクロ」とは白黒ではなく、単色(mono)という意味だ。
 複数の色を混ぜて使う場合はアミ点を使うことになり、そうするとカラーになる。

*: ネット上にはグレースケールは600dpiという記述があるが、これは意味がわからない。グレースケールのアミ点の間隔はカラーとほぼ同じか、むしろ広い。だから300dpi前後の筈だ。実際に600dpiでスキャンしても、300~350dpiに比べて情報量が増えている様子はない。

文字は300dpiを基準にする

 文字をそれぞれの解像度でスキャンするとこうなる。

 最大でも600dpiあれば十分。拡大画像だと300dpiでガタつきが見えるが、実サイズだと150dpiでも読むことはできる。150dpiの文字は18pixelくらいだが、パソコンのフォントは大体16pixel前後だから、足りないということはない。
 150dpi程度でも良さそうだが、解像度があまり低いとOCR(文字認識)の認識率が落ちる。大体300dpiを超えると認識率に変化がなくなる*1 。また、文字がガタガタしていると目に負担がかかりそうな気もする*2
 なので300dpiで良いと思う。

*1: 「読取革命」は400dpi推奨だが、400dpiだとかえって認識率が落ちることがあった。
*2: 文字を読み取るのに余計な労力がかかりそうな気がする。

漫画は300dpiくらいは欲しい

 漫画の解像度を比較する。


『しらぬい奇譚録』白泉社 ©稲井カオル

 拡大画像だと解像度が落ちると共に情報量が減っているのがわかるが、実寸画像だと300dpiでも十分に見える。

 市販の電子書籍の漫画の解像度はいくつになっているのかというと、少年ジャンプ(112×176mm)などは、844×1200~1125×1600pixelくらいらしい。これは約173~231dpiだ。300dpiだと1323×2079pixelになる。

 市販の電子書籍が300dpiよりも低いことを踏まえると、やはり300dpiあれば十分に思える。
 あとはその漫画の絵の緻密さ、自分にとっての重要度で300~600dpiの間で自由に決めればいいだろう(ドキュメントスキャナーは大抵、600dpiが上限)
 ちなみに600dpiは300dpiの4倍のファイルサイズになる。また解像度を上げるとスキャンに時間がかかる。

■本の大きさによっても変える

 少年ジャンプのような小さい単行本は縮小率が高いから、その分高解像度でスキャンする必要があるし、大判の単行本は縮小率が低いのであまり解像度を上げる必要はない。
 特に文庫サイズで出ている漫画はそのままスキャンすると低解像度になってしまう。

 要は、何dpiでスキャンするかというよりも、スキャン後の画像が何×何pixelになるかが重要だということだ。

■原稿のサイズでも変える

 大判で印刷されることを前提に大きな原稿で描かれた漫画と、小さいサイズで印刷されることを前提に小さな原稿で描かれた漫画もある。前者は漫画のコマが5段あったり、後者は2段だったりする。
 そういう場合は、前者は高解像度で、後者は低解像度にする。

カラー印刷も300dpiを基準にする

 カラー印刷は300dpiと350dpiで大した違いは出ない。拡大してよく見ると、350dpiの方が細部のディティールが残っているかなあという程度。当然だが、元の印刷物が300dpi以下だと350dpiでスキャンしても意味はない。

 本の表紙などは300dpiで、重要な画集などは350dpiにすればいいと思う。
 もちろんモアレ除去を使用する。

小さい文字は400~450dpiにする

 一般の書籍の文字の大きさは3mm程度だが、例外的に2mm程度の印刷物がある。CDのライナーノートなど。
 それを300dpiでスキャンすると文字が粗くなってしまうので、解像度を上げる。450dpiで文字のピクセル数が3mm×300dpiと同じになるが、文字があまり重要でないOCRをかけない)場合はファイルサイズを考慮して400dpiでいいと思う。

 ちなみに小説の文庫は、ハードカバーに比べると文字の大きさは変わらないが、文字の間隔を狭く詰めることで文字をたくさん入れている。