アプリの写真

プログラミング参考書推薦システムの試作

推薦システムの勉強をしようと思い,プログラミング参考書を推薦するシステムを自作してみた.
doc2vecの学習済みモデルを利用し,参考書のあらすじと検索ワードをベクトル化することでコサイン類似度を算出する. そして,コサイン類似度の高い,5つの本を推薦する.
課題はたくさんある.まず,推薦する参考書は技術評論社出版の参考書に限られている.技術評論社のサイトをスクレイピングする記事があり,参考書のあらすじが入手しやすかったためである. もう一つは,特徴的な単語に重み付けが出来ていないことである.例えば,Ruby 入門と検索しても,Ruby以外の参考書が推薦されることがありうる.これは,Ruby以外の参考書のあらすじに入門が多用されている ため,コサイン類似度が高くなってしまうためだと考えられる.そもそも特徴的な単語を重み付けることが実装可能なのか,勉強不足でわからない.また,検索ワードの表記があらすじの表記と 完全に一致していないとコサイン類似度は上がらないため,Ruby,rubyで検索結果が異なってしまうことも課題である.解決策を思いついたらバージョンアップしたいと思う.
作成した推薦システムは画像をクリックすると使うことができますので遊んでみてください!