《ゼロから始めるIDA逆アセンブリ》学習ノート-12（プログラム登録の逆アナリシス）

12.1 コマンドライン引数による main 関数の特定#

本章のプログラム TEST_REVERSER.exe は、この演習から静的逆向きとデバッグの新しい知識を学ぶものです。

まずプログラムの構造を見て、IDE で確認します。

上の図から、このプログラムは 32 ビットアーキテクチャで、vc++ 2015 でコンパイルされています。

次に、プログラムを実行し、ユーザー名とパスワードの入力を促されます。適当にユーザー名とパスワードを入力すると、bad reverser と表示されます。

次に、IDA を開いてターゲットプログラムをロードします。

重要な部分を探す方法の一つは、文字列を検索することです。argc、argv などのコマンドライン引数を検索します。C++ で書かれたプログラムなので、関数のプロトタイプは以下の通りです：

int main(int argc, char *argv[])

name から arg などの引数を検索し、ctrl + F で呼び出し検索ボックスを開きます。

上の図の_p_argc_をダブルクリックすると、内容は以下の通りです：

X キーを押して参照を検索します。

上の図のプログラムは_p_argc_、_p_argv関数を呼び出し、値を main 関数に渡します。

ダブルクリックして main 関数に入ります。

main 関数の 3 つの引数

main 関数の参照（符号付き）

12.2 main 関数のスタック分析#

任意の関数の引数やローカル変数をダブルクリックして、静的スタックビューに移動します。

上の図から、最下部には関数の引数があり、常に戻りアドレス (return address (r)) の下にあります。関数を呼び出す前に、引数はまず push 命令を通じてスタックに渡され、その後戻りアドレスが渡されます。

その上には main 関数を呼び出す上位関数の ebp 値があります。

上の図で、main 関数が最初に実行する命令push ebpは、それをスタックに保存し、次に esp の値を ebp に渡し、ebp を下の関数引数と上のローカル変数参照の基準アドレスとして使用します。最後に sub esp,94h、0x94 で esp をローカル変数とバッファのためのスペースを作ります。このプログラムでは移動距離は 0x94 で、コンパイラはソースコードに基づいてローカル変数が占めるスペースを計算します。

esp の値はローカル変数の上に指し、ebp は基準アドレスを指し、基準アドレスの上はローカル変数、下は戻りアドレスと関数引数です。以下の図のようになります。

したがって、ebp を基準とする関数内では、前の関数の ebp 値がpush ebpを通じてスタックに保存された後、esp の値が ebp に渡されます。00000000 は基準線として、上のアドレスは負（-）、下のアドレスは正（+）です。

上の図で、var_4 の相対アドレスは - 00000004 で、ebp の値を基準にすると、var_4 の実際のアドレスは ebp-4 です。

逆アセンブルビューで、var_4 を使用している任意の場所を右クリックすると、上記の内容を確認できます。

var_4 の上には変数がない空白の領域があり、これはバッファである可能性があります。

ビューを上に移動すると、空白の領域の上に最初の変数 Buf が見えます。以下の図のようになります。

右クリックして ARRAY を選択すると、以下のウィンドウがポップアップし、配列は 120 個の 1 バイト要素で構成されていることがわかります。したがって、配列のサイズは 120 です。

関数スタックビュー

上の図は ebp 基準を示しており、mov ebp、esp 命令を指した後、esp が 0x94 減少し、最終的にローカル変数領域の上部を指します。以下の図のように、sub esp、0x94 を実行した後の esp の値です。

上の図で、左側の 00000094 は esp=ebp-0x94 を表しており、関数内部で他の関数を呼び出す際、esp はさらに上に移動します。main 関数内部では、main 関数を退出するまで - 0x94 以前のローカル変数に対して操作を行います。

12.3 main 関数のローカル変数#

次に、静的スタックビューからローカル変数を逆向きに分析します。main 関数の引数は既知です。

ローカル変数

上の図で、プログラムはある値を読み取り、ebp 上の値と排他的論理和を取り、演算後に var_4 に保存します。これはスタックオーバーフローを防ぐためのものです。

ダブルクリックしてsub_4011B0に入ると、sub_401040関数が見えます。

sub_401040 関数内部には printf 関数があり、これによりこの関数は文字を印刷するためのものであると判断できます。

その後、size 変数に 8 が代入され、参照から 2 つの参照があることがわかりますが、内容を読み取るだけで変更はされていません。

次に、gets_s 関数があり、gets_s 関数はユーザー入力を制限します。上の図では最大入力が 8 文字であることが示されており、push eax で引数を渡し、lea で変数 buf、つまりバッファのアドレスを取得します。

ユーザーが 8 文字未満を入力して Enter を押すと、関数は入力を中断して戻ります。したがって、Buf バッファには最大 8 文字が含まれます。

その後、プログラムはPUSH EDXを通じてバッファのアドレスをstrlen()という API 関数に引数として渡し、strlen()は Buf 内の文字列の長さを取得し、その結果を var_90 変数に保存します。

12.4 ループとコードブロックのグループ化#

上の図で、青い矢印が指す戻りジャンプはループである可能性があり、var_84変数がこのループのカウンタとして使用されます。0x4019f5で条件付きジャンプがあり、条件が満たされるとループが終了します。カウンタは 0 から始まり、var_90変数以上になるまで加算され、ループが終了します。

カウンタを 1 加算

カウンタ変数の値が EAX に渡され、EAX が 1 加算された後、再びカウンタ変数に戻されます。

上の図で、プログラムはEBP+EDX+BUFからBUFFERの最初のバイトを取得します。EBP+BUFとカウンタを加算し、カウンタは最初は 0 で、ループごとに 1 加算され、次のバイトを読み取ります。このようにして、ループはBUFFERの各バイトの 16 進数をvar_88（初期値0）変数に加算します。

このループの内容は文字の加算です。