vdslab website

日本大学文理学部情報科学科
尾上研究室

LDAを用いたQiita記事のトピック可視化

2020年度卒業生 荒木 創太郎 による卒業演習作品です。

概要:プログラミングに用いられる言語は非常に多くある。それに伴い技術を紹介するサイト等が多くある。初学者や技術者の間でプログラミング技術共有サイトの一つであるQiitaが使用されている。初学者がプログラミング言語を学習するにあたり、現在使われている言語がどのような技術や分野に使用されているか知ることは、学びたい言語を決めるうえで有効である。また、Qiitaを内のトピックを知ることで、技術者は知見を広げることができる。しかし、サイト閲覧者が従来の検索やタグを用いて記事を読む方法では、今どの言語がどのような分野や技術に使用されているかを知るには時間がかかる。

そのため本研究では、Qiitaに投稿された記事のデータを用いた可視化を行った。可視化には、Qiitaのに投稿された記事の本文を取得し、トピックモデルであるLDAを利用してトピックモデルの作成を行いブログ内のトピックの発見を行った。その後、トピックに使用される単語を用いてワードクラウドを作成し、タグを用いてツリーマップの作成を行うことで可視化を行った。可視化することで、Qiita内の複数あるトピックを全体を知ることができ、そのトピックに使用されている単語やタグを知ることができることを目指す。

可視化結果より、Qiitaに投稿された記事の複数トピックを発見し、頻繁に使用される単語を発見した。また、各トピックに使用されるタグを用いたツリーマップにより、用いいられるプログラミング言語や技術を発見し、Qiita内の記事全体のトピックに関して考察を行った。

https://arasou-0206.github.io/LDA_visualization/

LDAを用いたQiita記事のトピック可視化

文章類似度から見た行政事業の関係性

2019年度卒業生 田中 太樹 による卒業演習作品です。

概要:現在、我が国では年間5000近くの行政事業が行われている。これらの事業について国家財政健全化のために国家の制作として行政事業レビューを行っているが、現在それを比較参考にできるようまとめられているものは非常に少ない。そこで本研究では行政事業レビューシートにおける各事業の目的を用いて文章類似度を測定し各行政事業を可視化することで事業間、省庁間の関係について調査した。結果として各省庁、各主要政策・施策でそれぞれ違いがあることがわかった。

https://judgit.vdslab.jp/document-similarity

文章類似度から見た行政事業の関係性