巷で話題になっている、データサイエンティスト協会の「データサイエンス100本ノック(構造化データ加工編)」が非常に良かったので、今回はそちらの導入までを紹介いたします。
こちらのデータサイエンス100本ノック(構造化データ加工編)をこなすことで、Python,R,SQLでの基礎的なデータ加工ができるようになります。
Dockerの準備
このデータサイエンス100本ノックは嬉しいことにDockerで提供されています。Jupyterの設定やDBの設定をしないで済むので楽ちんですね。
今回はWindows 10 Homeの環境で行います。Docker Toolboxは使わずにDocker Desktop for Windowsを使用するので、前回の記事を参考にDockerの環境を整えてください。
個人的にはDocker ToolboxよりWSL2を使ったDocker Desktop for Windowsを用いるほうがオススメです。
環境構築手順
任意のディレクトリでデータサイエンス100本ノックのリポジトリをクローンします。
git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess.git
その後、ディレクトリを移動
cd 100knocks-preprocess
そしてコンテナ作成のコマンドを実行
docker-compose up -d --build
これで環境構築は完了です。
ブラウザでhttp://localhost:8888/に移動してノックを開始してみましょう!