« 7秒で起動するGoogle Chrome OS | メイン | CodeZineの2009年記事PVランキング(暫定) »

開発者にも必要なデータ分析の知識

みなさん、普段データを分析する機会ってありますか。

例えば、ウェブページを運用していればアクセス解析しているでしょうし、システム開発では、品質を下げずにテスト負荷を下げたい、プロセス改善したい、といった局面で利用したくなることもあるでしょう。

しかし、データの平均・合計・標準偏差を求め、適切なグラフを書いて所感を述べるくらいならできるが、実際その分析が本当に確からしいのか、と言われると自信がない方も多いのではないでしょうか。

ならば本でも買って正しいスキルを身に着けようと思っても、専門書は数式や難解な表現だらけで読破しにくい。かといって初学者向けのハウツー本は一見理解した気にはなるが抽象的過ぎて、実際どう現実問題に適用したらよいか分からない。

担当編集も、統計手法の基本として、

 1.(求めたい結果と逆の)仮説を立てる
 2.検定統計量を算出する
 3.検定統計量が棄却域に入れば仮説を棄てる

がある程度は理解していますが、分析が本当に適切かと言われると少々不安の残るところ……。やはり身近なサンプルでお手本を見てみたい(ちょうど具体的なサンプルソースコードを読む感じに近いでしょうか)。

そこで、開発者にとって身近なテーマを題材に、理論と演習の形式で解き進める『SEのための統計入門(仮)』という連載を年内にスタートする予定です。執筆者はテスト仕様書の連載を続けている山村吉信氏。初回の課題は「エラー混入率が妥当な範囲に収まっているか」(検定)です。どうぞお楽しみに。

スポンサーサイト