テストと検証の違いについて考えてみた

はじめに

今回は定期的にやってくる駄文というかポエム回です。

ソフトウェア開発において「テスト(Test)」と言うものは非常に重要です。一方でLSI開発などを含めて、RTL界隈では「検証(Verification)」という言葉をよく聞きます。

業種や人によっても用語の定義が微妙に違ったりもするので一概に定義できない部分もある気がしますが、今日は 主観100% となりますが、私なりの考えでこの二つを考えてみようと思います。このあたりは一家言ある人が多い気がしているのでマサカリ飛んで来そうで怖いんですが、まあこんな考え方もあるよというレベルで私見として書いておきます。

私の理解として

テストはバグがあればそれを証明する試み
検証はバグが無いことを保証しようとする試み

という理解をしております。

もちろん検証が完了したからバグがゼロ個であることを保証できるわけではないのですが、目的として目指しているものが異なるという点は重要かと思います。

そしてこれは、ソフトウェアだからとかハードウェアだからという問題ではないと考えています。実際ソフトウェアでも検証は必要ですし、CPU/GPU/FPGA向けのソフトウェアで低レイヤーの部分では検証が必要になってくるケースは多い気がしています。

はじめて学ぶソフトウェアのテスト技法

作者:リーコープランド
日経BP

Amazon

機能の確認と、機能の保証の違い

例えば python で二次方程式を計算する関数を書いてテストして意図した値が得られたとしましょう。

def func(x):
  return 3 * x**2 + 2 * x + 1

この関数はおそらく下記のようなことは起こりません

何度も実行したら3回目で違う結果が返ってきた
Python と一緒に Excel を起動したら計算結果が変わった
CPUコア数の違うパソコンで実行したら結果が変わった
Windowsでは合うが、Linux では結果が変わった
その日の天気で結果が変わった

そのため、Excel と一緒に起動するテストや、晴れの日と雨の人雪の日でそれぞれテストするようなテスト項目を作ったりはしません。

一方で、OSを開発したりベアメタルで開発するなどの低レイヤーの開発の場合以下のようなバグはしばし発生します。

ある命令の区間で割り込みが来た場合に限り変数が壊れる
たまたまあるスレッドが先に終了したときだけ変数が壊れる
マルチコアへのスレッドの割り当て順が特定のケースで変数が壊れる
コンパイルオプションで最適化を指定すると結果が変わる
メモリバリアを書き忘れるなどして実行順序依存でキャッシュの状態次第で変数が壊れる

何が言いたいかと言うと、先の Python のコードが Python のコードに閉じて正しい機能かどうかだけをテストすれば済んでいるのは、プロセッサがメモリコヒーレンシを保証し、バグのないスピンロックの機構や、メモリ保護や、復帰可能な割り込みや、温度保証などの物理的な保証もしており、OS開発者がコンテキストの継続性を保証できるスレッドを用意し、安全なメモリ割り当てを行い、言語開発者がバグのないインタプリタやコンパイラを提供しているから成り立っているわけです。

ものすごく乱暴な言い方をすると、先の Python コードが正しいかを確認するのが「テスト」で、それを保証する環境をのものを担保しているのが「検証」ではないかと思う次第です。

まさに「プログラマをダメにするハードウェア」の上に成り立っているのがテストなんじゃないかとさえ思ってしまうわけです。