マイニングメモ

たとえばAAAと言うキーワードが存在するとしたら、そのキーワードに対応するキーワードが同時に存在するはずである。
それは複数存在するかもしれないし、ユニークかもしれない。
ただ、そのキーワード同士の関連(これを重みと呼ぶとする)はドキュメントごとに異なることは自明であると考えられる。
ならば、少なくとも、各ドキュメントを精査し、そのドキュメントにランク付けをすることは可能ではないだろうか。
Googleページランクのような考えでしかないが、これをマイニングシステムに組み込めたら、多分、面白くなる気がする。
キーワードはトランザクションとして扱うか?これが肝かもしれない。
特化型のマイニングであれば、いけると思う。