大量の電子書籍を管理する方法


私は自分でスキャンした大量の電子書籍をpdfで持っている。同じようなことをしている人の参考になればと思い、私がどうやってこのpdfを管理しているか紹介してみる。




■ フォルダに入れて出版社別に整理する


ジャンル別にするか出版社別にするかは迷うところだが、ジャンル別のフォルダも作って、そこにはショートカットを配置しておく。


■ FileSeekerでキーワードで検索して使う


FileSeeker
http://www.vector.co.jp/soft/win95/util/se327185.html


このソフト、1万ファイルの中からのファイル名検索でも1秒未満で見つけ出してくれる。(検索1回目は10秒ぐらい時間がかかることがある)


当初、Vistaのファイル検索を使っていたのだが、(Vistaファイルシステムの)インデックスがされていないと遅いし、私はフォルダやファイルを整理のためにしょっちゅう移動させるので、Vistaのファイル検索は使い物にならなかった。


■ SyncToy v2.0で同期させる


整理のためファイルを頻繁に追加したり、フォルダを移動させたりするので、BD-Rに焼いておくというわけにもいかない。


そこでHDDを二つ用意して、SyncToy v2.0で同期させる。


SyncToy v2.0
http://www.microsoft.com/downloads/details.aspx?familyid=c26efa36-98e0-4ee9-a7c5-98d0592d8c52&displaylang=en#Requirements


SyncToyは大変素晴らしいソフトで、同期対象フォルダ内でファイルのリネームをしたりファイルを移動させたりした場合、それを正しく認識して、もう片方の同期対象フォルダにそれを反映させるので最小の時間で同期が完了する。


10万ファイル、300GBに対して、SyncToyで同期させてある二つのフォルダがあり、いくつかのファイルとフォルダを移動させたあとにSyncToyで「同期」を実行した場合、1分程度で完了した。十分高速だと言えると思う。


どういう仕組みになっているのかは知らないが、なかなか凄いソフトだ。


■ なるべくファイル数は減らす


検索するときにファイル数が多いと検索に時間がかかるのでなるべくファイル数を減らす。


本に付属しているCD-ROMをそのままHDDに入れているとファイル数が増えるのでzipなどで圧縮して入れておく。


■ 検索用のインデックスを必ず作成する


ファイル名で検索する以上、ファイルとして存在している必要がある。
これは、ダミーの0バイトのファイルで構わない。このファイルが存在しますよ、というのがわかればそれで良い。


例えば、次のようなキーワードファイルがあるとして、各行をファイル名とする0バイトのファイルを作ることを考えてみよう。

Cocoa Programming MacOSX Aaron Hillegass
Brief history of the Mac platform (from NeXTSTEP to Mac OS X)
basic Cocoa development in Objective-C
using Project Builder and Interface Builder tools tutorial to Objective-C

私がやったのは、秀丸正規表現置換を用いて、次のように置換して、拡張子を.batに変更したあとバッチファイルとして実行してしまう方法だ。

 置換元 : ^(.*)
 置換後 : type a > "\1\.lnk\"

この結果、以下のようなバッチファイルができあがる。私はMS-DOSコマンドで0バイトのファイルを作る方法がわからなかったので、typeで存在しないファイルをリダイレクトで書き出すことによって0バイトのファイルを作っている。

type a > "Cocoa Programming MacOSX Aaron Hillegass.lnk"
type a > "Brief history of the Mac platform (from NeXTSTEP to Mac OS X).lnk"
type a > "basic Cocoa development in Objective-C.lnk"
type a > "using Project Builder and Interface Builder tools tutorial to Objective-C.lnk"

■ まとめ


私がやっていることは以上ですべて。


私のしたかったことは、
・1万ファイルが1秒以内に検索できること
・プレビューがpdf,chmに対応していること
・検索の時に正規表現で検索できること
である。


最初、Vistaの検索を使って管理しようと思ったが、速度的にも辛いものがあった。検索したときに大アイコンにしておくと検索結果で出てきたpdfの一ページ目(本の表紙)が表示されるのはなかなか良いのだが…。(しかしchmファイルのほうは一ページ目が出ない)


Google Desktop Searchは、pdfの中身も検索できていい感じだ。(中身が画像ではなくテキストならば) しかしインデックスを事前に作成するので頻繁にファイルやフォルダを移動させる用途には向いていない。そうでないなら結構良いソリューションだ。


そのあと、富士ゼロックスDocuWorksを使って管理しようかと思ったが、どうもこちらは方向性が違うような気がしてやめた。OCRでテキスト化しておけば文字列で検索できるようので悪くはないかも。


何かもっといいアイデアがあればコメント欄で教えてもらえるとありがたい。