読者です 読者をやめる 読者になる 読者になる

データ分析環境の構築

2017年に利用していく技術領域にてJupyterで視覚化するための環境を構築すると書いてましたが、一部構築できたのでこちらにも記述しておきます。

JupyterHubでGitHub認証×Django連携するデータ分析環境を構築する

以下のような構成でELB→EC2→nginx→JupyterHub(Tornade)→Django→RDSという流れが構築できます。 f:id:charly24:20170219181718p:plain

環境としてはDjangoを利用できるように設定してますが、JupyterHubのKernelの仕組みを利用すればRailsやその他コマンドライン環境をつなぐこともできるはずです。

構築しようとした背景としては、以前Tableauを導入したところ重量級過ぎてビジネスサイドに利用されなかった経験もあり、誰でも一定のITスキルを持っていればパラメーターを変更するだけで視覚的に結果を確認できる環境はあった方がいいなと考えたところからです。DailyでマスクされたDBを構築する仕組みも別途あるので、 Redashと連携させるのも良さそうです。