氏名: 内山 英俊 (089433076)
論文題目: 自己組織化とデータマイニングを用いた新しいテキスト分類モデルの研究
論文概要
近年インターネットが急速的に普及することに伴い、情報が爆発的に増加してきている
が、こうした情報は時間とともに変化し、過去のデータを有意義に利用することが困難
になってきている。そこでインターネット上のテキストデータを分類・蓄積するデータ
管理システムの実現を考える。本研究ではデータをニュース記事の分野に特定し、デー
タマイニングとコホーネンの自己組織化マップを用いた新しい分類モデルにより、ニュ
ース記事を分類・蓄積するシステムを作成する。具体的にはHTMLファイルにHTML解析・
形態素解析・ベクトル化・自己組織化・データマイニングという手順でデータ分類を行
ない、データベースに格納する。
目次に戻る