vdslab website

日本大学文理学部情報科学科
尾上研究室

類似事業探索のための行政事業の俯瞰的可視化

2020年度卒業生 上野 瑞貴、野村 理紗 による卒業演習作品です。

概要:日本では1年間に約5000件の事業が中央省庁によって行われており、事業の目的やカテゴリは多岐にわたる。事業数は膨大で事業間の関係性は複雑になっており、行政事業全体を俯瞰する事や、事業と事業の類似などの関係性をチェックしていく事は難しいという問題がある。政府はこれらの問題に対して、行政事業レビューという取り組みを行い、全事業に対し、毎年無駄や改善点がないか点検を行っている。また、行政事業レビューという取り組みの中で、点検の透明性という観点から、行政事業レビューシートと呼ばれる統一した様式で事業の内容や執行実態、点検内容を誰もが閲覧可能な形で公開している。しかし、前述の通り約5000件という膨大な数ある事業全体、複雑な事業間の関係性を、行政事業レビューシートから俯瞰、把握する事はまだまだ難しいのが現状である。そこで本研究では、行政事業レビューシートの各項目を記載したデータを用いて、誰もが行政事業全体を俯瞰する事ができ、さらに、全体の俯瞰結果から事業を探索し、類似といった事業間の関係性を発見できるような可視化を行った。行政事業全体の俯瞰という目的に対しては、2019年度公開の行政事業レビューシートにおいて、実際に執行されている事業の事業概要から重要なキーワードを抽出し、事業の執行額を利用して、関連のあるキーワード同士を二次元空間上の近い位置に配置したキーワードバブルチャートを作成した。全体の俯瞰からさらに事業を探索し、類似といった事業間の関係性を見ていくという目的に対しては、キーワードバブルチャートでクリックしたキーワードが事業概要に含まれる事業を集め、事業概要の文書ベクトルを用いて階層的クラスタリングを行い、その結果をデンドログラムで表示した行政事業デンドログラムを作成した。また、それらの可視化結果を使用して、実際に行政事業全体や事業間の関係性について調査を行った。その結果、我々は事業概要が非常に類似した事業を発見し、それらの事業について考察を行った。

https://ueno10.github.io/test/

類似事業探索のための行政事業の俯瞰的可視化

LDAを用いたQiita記事のトピック可視化

2020年度卒業生 荒木 創太郎 による卒業演習作品です。

概要:プログラミングに用いられる言語は非常に多くある。それに伴い技術を紹介するサイト等が多くある。初学者や技術者の間でプログラミング技術共有サイトの一つであるQiitaが使用されている。初学者がプログラミング言語を学習するにあたり、現在使われている言語がどのような技術や分野に使用されているか知ることは、学びたい言語を決めるうえで有効である。また、Qiitaを内のトピックを知ることで、技術者は知見を広げることができる。しかし、サイト閲覧者が従来の検索やタグを用いて記事を読む方法では、今どの言語がどのような分野や技術に使用されているかを知るには時間がかかる。

そのため本研究では、Qiitaに投稿された記事のデータを用いた可視化を行った。可視化には、Qiitaのに投稿された記事の本文を取得し、トピックモデルであるLDAを利用してトピックモデルの作成を行いブログ内のトピックの発見を行った。その後、トピックに使用される単語を用いてワードクラウドを作成し、タグを用いてツリーマップの作成を行うことで可視化を行った。可視化することで、Qiita内の複数あるトピックを全体を知ることができ、そのトピックに使用されている単語やタグを知ることができることを目指す。

可視化結果より、Qiitaに投稿された記事の複数トピックを発見し、頻繁に使用される単語を発見した。また、各トピックに使用されるタグを用いたツリーマップにより、用いいられるプログラミング言語や技術を発見し、Qiita内の記事全体のトピックに関して考察を行った。

https://arasou-0206.github.io/LDA_visualization/

LDAを用いたQiita記事のトピック可視化

ネットワーク可視化 Jupyter Custom Widgetの開発

2019年度卒業生 森田 瑛仁 による卒業演習作品です。

概要:データ可視化・分析環境のトレンドをたどると、データサイエンティスト、アナリストを中心とした開発者らを取り巻く環境の進歩を垣間見ることができる。CUIで対話的実行可能なREPLをもつIPython、GUIチャートの描画に対応したQtConsole、WebベースのJupyter Notebook、クラウドベースのGoogle Colaboratoryと、たえず時代のニーズを満たすツールが開発されてきている。しかしPython言語の可視化・分析環境でよくつかわれるNetworkXに付随する可視化機能は、自由度が低いと感じた。そこで本稿では、Jupter Custom Widgetの実装から公開に至るまでの流れを把握して、そのポテンシャルを模索し、意味のある可視化ツールの実装方針を考察する。

ネットワーク可視化 Jupyter Custom Widgetの開発

Twitterにおける話題遷移ネットワーク可視化

2019年度卒業生 出口 拓也 による卒業演習作品です。

概要:近年、新聞やテレビよりもTwitterなどの情報発信ツールで情報収集がされることが多くなっている一方、不適切または不正確な情報が拡散されることも多い。実際に東日本大震災後に放射線や原発事故に関する科学的に不適切または不正確な情報が広がったり、根拠ない言説が流布された。しかしどのような過程で不適切または不正確な情報が拡散されるようになったのかは十分に調べられていない。そこで本研究では、話題の遷移をTwitterのハッシュタグを用いた話題遷移ネットワーク可視化で表すことで、拡散される過程を明らかにした。その結果から、話題が遷移していくうちに本筋とはかけ離れた話題に無理やりこじつけてツイートされていたり、差別的な意図がある造語を用いたハッシュタグを使用したツイートなどから、不適切または不正確な情報の拡散がなされていることが分かった。

https://codepen.io/EntranceExit/full/RXgQmr

Twitterにおける話題遷移ネットワーク可視化

福島第一原発事故に関するツイートの時間的地理的分布の可視化

2019年度卒業生 田中 大道 による卒業演習作品です。

概要:2011年3月に発生した福島第一原発事故では多くの被害が出ただけでなく、多くの情報が飛び交った。さらにテレビや新聞だけでなくTwitterをはじめとするSNSでの情報共有も多く見られた。そこで本研究では福島第一原発事故に関連するキーワードを基に6年6か月分のTwitterのデータを用いて情報の興味の流れを可視化した。可視化方法は2つの可視化図を2つのアプローチで作成し、最終的に見比べたことでわかったことを調べた。時間がたつにつれて人々の興味は薄れていくが、興味が再び強くなるタイミングが存在する。しかし興味の内容は異なっているものの、興味が強くなる時には理由が存在していた。

https://codepen.io/HRMC/full/QWWEKXr

福島第一原発事故に関するツイートの時間的地理的分布の可視化