Month: March 2019

Jupyterをインストールしたのでcsvとjsonデータをpandasとmatplotlibで分析してみる

JupyterをMacにインストールするの続き Jupyterをインストールしたので活用する 今回使うデータは、「Trending YouTube Video Statistics」 Kaggleのページから取ってくる(会員登録が必要) https://www.kaggle.com/datasnaek/youtube-new と打ったディレクトリと同じ階層に取ってきたデータを配置する 今回は、USのデータのみ使う データを配置したので、新しいノートを作成する まずは、「New」>「Notebook」>「Python3」をクリック csv/jsonデータを読み込む Terminalでpandasをインストール Jupyter画面で操作 配置した、csvを読み込む read_csvでいい感じに読み込んで表示してくれる あとで使うので、変数に格納しておく columns一覧を表示するにはこちら(唐突) jsonを読み込むにはread_jsonでOK 読み込んだデータをグラフ化する pandasで読み込んだデータをグラフで描写するにはmatplotlibを使う terminalでインストールする category_idごとのview数を出してみる csvとjsonのデータを合体させてグラフ化する このままだと、Categoryが数字なので、何のこっちゃわからない category_idとCategory名の結びつきは別のjsonデータの方に載っていた jsonのデータをpandasで読み込む 中身を見ると、itemsの中がさらにjson形式で格納されている itemsの中を表で表示してみる 多分、idというのがcsvデータの方のcategory_idで、Category名がsnippet.titleと思われる csvデータの方の「category_id」とjsonデータの方の「id」を結びつけて合体させる これでいい感じに表示された

JupyterをMacにインストールする

重い腰を上げてJupyterをMacにインストールする こちら のリンクを参考にする Jupyter NotebookをMacで動かしてみる 3.5ではうまくいかなかった 3.5ではうまくいかなかった とっととインストールしたい方は、下の3.6でやってみたらうまくいったをご確認ください 難しいことはやらず、バージョンを変えて 3.6でやってみる 3.6でやってみたらうまくいった failになった こちらのリンクを参考にエラー解消する pyenv install でエラーが発生する。 インストールの画面が立ち上がるので、言われるがままインストールする 3.6.6にしてしまったが、これでインストールできた これで無事にJupyterが起動する