正規化、クレンジング
■チェック用語
・正規化
データを一定のルールに従って変形し、利用しやすくすることです。
データを効率よく扱えるように整理することです。
・クレンジング
クレンジングとは洗浄という意味です。
正規化やデータの比較解析が可能なように、テーブルごとのバラツキなど、
データを補正します。
データ解析が可能な形にデータを修飾することです。
■データマイニングの全体プロセス
1)データ収集
2)選択
3)クレンジング 正規化、補正、データの変換
4)データマイニング
5)視覚化
6)解釈・意思決定
データの変換というのは、
変動比を出す場合なと、集団間のデータを比較する場合、データは統計的に
意味のある代表値に置き換える必要があります。
代表的なものに、平均値(mean)、中央値(median)、最頻値(mode)が
あります。
データマイニングの方法としては、
数理統計学的方法(統計的有意差検定、回帰分析)、決定木、多変量解析
(重回帰分析、判別分析、主成分分析、クラスター解析)、
ニューラルネットワーク、遺伝的アルゴリズムなどが用いられます。
[ Index ]
[ Home ]