2021年2月20日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki YouTube講座資料 YouTubeで学ぶPythonデータ分析・講座一覧【ファイルダウンロードあり】 YouTubeチャンネル「データサイエンス塾!!」にて公開しているPythonデータ分析講座の一覧です。 当ページにて、動画内で使用しているソースコードやファイルの共有も行っておりますので、ご自由にお使いください。 (ア […]
2020年3月8日 / 最終更新日 : 2024年6月28日 Takuma Nishimaki 学習用記事 Pythonによるテキストデータの表記揺れ対策あれこれ アンケートデータなどのテキスト情報を集計・分析する時、“表記揺れ”には非常に悩まされます。 例えば、同じ単語でも「Windows10」「Windows10」「WINDOWS10」「Windows- […]
2019年10月13日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonで同時に使われやすい単語ペアを調べる(共起分析) Pythonで共起分析を行います。 共起分析とは、文章の中で「同時に使われやすい言葉」を調べる分析手法です。 (ネットワークをグラフィカルに図示したものを「共起ネットワーク」と呼びます。) 以前、文章中の頻出単語を調べて […]
2019年10月5日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Python+Doc2Vecで似た意味を持つ文章を調べる 以前、単語をベクトル化できる技術「Word2Vec」を用いて似た意味を持つ単語を調べてみました。 今度は、文章をベクトル化できる技術「Doc2Vec」を用いて、似た意味を持つ文章を調べてみます。 Python+Word2 […]
2019年9月21日 / 最終更新日 : 2024年6月16日 Takuma Nishimaki 学習用記事 Pythonによるワードクラウドの作成方法 「ワードクラウド」とは、文章中に現れる出現頻度の高い単語を抽出し、1枚の絵にしたものです。 ある文章がどんな傾向なのか視覚的に”パッと見”で分かるので、手っ取り早く、かつ取っつきやすい方法のひとつ […]
2019年9月8日 / 最終更新日 : 2024年6月28日 Takuma Nishimaki 学習用記事 Python+Word2Vecで似た意味を持つ単語を調べる 文章中に含まれる「単語の使われ方」を見て、そこから単語同士の類似性を測ってみます。 そのためには単語を数字のベクトルで表現する必要があるのですが、今回はGoogleが2013年に発表した「Word2Vec」という技術を用 […]