氏名: 内山 英俊 (089433076)

論文題目: 自己組織化とデータマイニングを用いた新しいテキスト分類モデルの研究


論文概要

近年インターネットが急速的に普及することに伴い、情報が爆発的に増加してきている が、こうした情報は時間とともに変化し、過去のデータを有意義に利用することが困難 になってきている。そこでインターネット上のテキストデータを分類・蓄積するデータ 管理システムの実現を考える。本研究ではデータをニュース記事の分野に特定し、デー タマイニングとコホーネンの自己組織化マップを用いた新しい分類モデルにより、ニュ ース記事を分類・蓄積するシステムを作成する。具体的にはHTMLファイルにHTML解析・ 形態素解析・ベクトル化・自己組織化・データマイニングという手順でデータ分類を行 ない、データベースに格納する。
目次に戻る