2009-08-02

CAPTCHAとは、スパムコメントなどを防止するための認証画像のことである。

それにしても、はてなのCAPTCHAはひどい。無いよりマシという考え方もあるのでそれについてはあまり議論する気は無いのだが、それにしてもこれを破るプログラムは30分あれば十分書ける。

具体的には、はてなのCAPTCHAには8つの好ましくない特徴と、2つの脆弱性がある。

■　8つの好ましくない特徴

・画像自体のサイズが小さすぎる。→　こんなに小さいと探索量(計算量)が小さくて済む。
・フォントにゆがみがない　→　フォントはある程度変形させたほうが良い。変形させてあるとテンプレートマッチングがしにくくなる。
・フォントが固定。→　フォントは毎回変えたほうが良い。
・フォントを回転させていない　→　フォントは文字ごとにある程度ランダムに回転させた方が良い。
・フォントサイズが一定　→　フォントサイズは文字ごとにある程度ランダムに変化させた方が良い。
・フォントの色がすべて同じ　→　文字は文字ごとに色をわずかに変えたほうが抽出しにくくなる
・背景画像が単調　→　これでは簡単に文字だけを抽出できてしまう。
・使われている文字の種類が少なすぎる。0〜9とa〜fまでの16種類しかない。

この8つの好ましくない特徴だけ見ても、これはCAPTCHAとしてはかなり出来が悪いと言わざるを得ない。何を思ってこんなひどいCAPTCHAを採用したんだろう。

しかしそれよりひどい決定的な脆弱性が二つある。

■　はてなのCAPTCHAに見られる2つの脆弱性

1) 文字の表示位置が毎回同じ

何とも信じられないことだが、文字の表示位置が毎回同じである。文字フォントの種類も同じ、文字のフォントサイズも同じなので、対象位置固定でテンプレートマッチングを行なえばほぼ確定する。

2) 画像を要求されるごとにスクラッチの位置が異なる