LMSログとマイニングツール/概念あれこれ

前々から行いたかった、LMSに蓄積されているログを対象データとした研究について。

行いたいことはテキストマイニング(これはこれで「重要文抽出」「キーワード抽出」「トピック抽出」「テキストの一貫性評価」「複数文書要約」「テキストクラスタリング」などの面白いトピックがある)ではない。LMSで提供しているSCORMコンテンツの改善を目的とし、データベースなど構造化されたものから、ユーザに着目した分析となるであろう。データマイニングと言えるかもしれない。たとえば、BovoらEDM2013ICEEE2013でユーザそれぞれについてのログイン回数、最終ログイン、学習時間、レッスン読了数、ダウンロード数、小テスト、課題の評定と各種平均を正規化したデータをWekaでクラスタリングしている。

Wekaについては、恩師である渡邊裕司先生もお使いであると仰っていた、それなりに実績のあるツールのようだ(OERもある)。森幹彦先生には、orangeというビジュアライズされたワークフローを作成できるPythonベースのツールを紹介していただいた(活用している方のブログ記事)。また、これらのツールを比較した解説もある(これとかこっちとかスライドも)。

ただし、ツールは夢のようなものではなく、それが何を行っているのか理解できない者が使うべきではない。当たり前だが、ツールを使うことが目的になってはならない。最終目的はコンテンツの改善である。ただ、ログなんぞから、ユーザの「学習」状況など分かるはずがない。しかしながら、全てをきちんと受講している「可能性」のある閲覧状態というのはあるはずである(受講していてもタレ流しかもしれないから)。

  1. SCO単位の受講率(というのか?)
  2. 各SCOの所要時間以上で受講している割合(クエリがちょっと難しいかもしれないが分かれば面白い)

SCO単位の受講率と総合テストの成績の相関は容易に分かる。これに加えて上記2が分かれば、オンラインかつモチベーションがない、強制的にやらされる「○○○○についての学習」というシチュエーションで、ユーザの「飽き」と「作業ゲー状態」を検出することができるかもしれない。また、たとえば次のようにユーザを分類し、アダプティブなコンテンツとすることも考えられる。

  1. まじめに受講した結果成績が良い
  2. そもそもICTスキルが高く、受講せずとも成績が良い
  3. それ以外、また他の分類

決してバズワードの研究分野のつもりはありませんから!

投稿日:
カテゴリー: Moodle研究

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です