Pythonの開発環境Jupyter Notebook|【Python・R・エクセル統計学・統計解析】
Pythonの開発環境Jupyter Notebook
Jupyter Notebook
データ分析をコンピュータに行わせるために、Pythonというプログラミング言語を用いてプログラムを作成します。
数あるプログラミング言語の中からPythonを使用する理由としては、ライブラリが豊富に存在するということが挙げられます(ライブラリとは汎用性の高いプログラムを集めたもののことです)。
しかし、作業に必要なライブラリをインストールするというのは非常に面倒な作業になります。
なぜならば、ライブラリには膨大な種類が有り、その中から自分の作成するプログラムに必要なライブラリはどれかを調べた上で、ライブラリをインストールするためのコマンドを人力していかなければならないからです。
非常に面倒な作業になりますが、実はこの手間を幾分か省くことができる方法があります。
その方法とは、Anacondaと呼ばれるPythonパッケージを利用することです。
AnacondaをインストールすればPython本体といくつかのツール、ライブラリがインストールされるのですが、このときインストールされるライブラリやツールには有用性が高いものが多く含まれているのです。
実際、本書内で使用するライブラリの多くはAnacondaをインストールした時点で使用可能な状態になっており、足りないライブラリに関してもAnaconda Navigatorというツールを使えば簡単にインストールすることができます。
また、Jupyter Notebookと呼ばれるツールを用いてプログラミングコードを作成していくことを推奨します。
これは、データ分析において計算結果は重要であるという観点から、コードの記述、実行、結果や出力の保存までを同時行うことができるというJupyter Notebookの特色は非常に有用であるからです。
実はAnacondaをインストールするときに同時にインストールされるツールの中にこのJupyter Notebookも含まれています。
これらの理由からAnacondaによるPythonの環境構築をおすすめしています。
Jupyter Notebook のWindowsへのpipコマンドによるインストール
次に、開発環境Jupyter NotebookをWindowsへインストールします。これはpipコマンドを使って簡単にインストールできます。
コマンドプロンプト(PowerShell)に対して、
C:\Users\saki> pip install jupyter notebook
と打つと、jupyter notebookの動作に必要ないくつかのパッケージソフトをダウンロード・インストールします。
数が多いので多少時間がかかります。
すべて正常にインストールできると、
Successfully installed … パッケージのリスト…
が表示されます。
Jupiter NotebookのWindowsでの起動
コマンドプロンプトで、作業フォルダに移動します。
作業フォルダはユーザ自身が持っているフォルダの中なら好きなように作ってかまいません。
ここでは、ドキュメントフォルダ(Documents)の下にworkというディレクトリを作り、ここを作業フォルダとすることにします。
そこで、jupiter notebookと打って起動します。
PS C:\Users\saki\Documents > mkdir work s-- ディレクトリworkを作る
ディレクトリ: C:\Users\saki\Documents
PS C:\Users\saki\Documents\work> jupiter notebook s-- jupiter notebook起動
… メッセージ…
[I 13:10:21.562 NotebookApp] The Jupyter Notebook is running at: http://localhost: 8889/?token=504e380ce
[I 13:10:21.562 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip
… メッセージ…
無事に起動できたようです。
これと同時に、ブラウザの新しいウィンドウが開きます。
Pythonプログラムの入力と実行
では、Pythonを少しだけ使ってみます。
画面の右側になるnewのボタンを左クリックし、プルダウンメニューからPython 3をクリックしてみてください。
これで、Pythonをプログラムするためのウィンドウ(iPython形式のウィンドウ)が開きます。
この画面のIn[ ]:の右側の部分にプログラムを書くことができます。最初のプログラムとして、Hello Worldを出力してみましょう。
In[ ]:のところに、
print (‘Hello World’)
と書き込みます。
このプログラムを実行してみます。
実行するには、メニューバーの実行ボタンをクリックするか、さもなくばCellタブからプルダウンメニューでRun Cellsをクリックします(今後、実行キーを押す、と呼ぶことにします)。
そうすると実行結果が表示されます。
このプログラムの場合はHello Worldと表示されます。
このように、Jupiter Notebookの画面内では、プログラムを書きこんでそれを実行し、結果を出力することができます。
では、プログラムを間違えたらどうなるでしょうか。
例えばprintとすべきところを、間違えてprntと打ったとします。
実行キーを押して実行させると、エラーメッセージが出力されます。ここでは、
Name Error: name ‘print’ is not defined
というメッセージが出ているので、prntと書いたことが間違いだと分かります。
もう少しだけNotebook環境に使い慣れよう
では、もう少しだけ使って、Jupyter Notebookの環境に慣れることにしましょう。
先ほど間違えた状態のままで、In[2]のところにプログラムを上書きしてみます。
書くのは
x=2
print(x)
で、変数xに値2を代入する、その後print(x)によってxを出力(表示)する、というプログラムです。書き込んでから実行キーを押すと、「2」というprintの出力結果が見えます。
繰り返しが必要な場合には、forループと呼ばれる繰り返し命令を使います。
In[5]: x = [1, 3, 5, 7, 9]
Print(x)
For u in x
Print u
[1, 3, 5, 7, 9]
1
3
5
7
9
リストxに入っている要素を頭から順に1つずつ取り出して変数uに入れ、その次の行にあるprint(u)を実行、つまりuを印刷表示します。
Printは指定された内容を1行に書く(書き終わったら改行する)という設定になっているので、リストxからuを1→3→…→9と順番に取り出しながらそれぞれを1行ずつに表示し、その結果1行ずつに1, 3, 5, 7, 9と並んだ出力が得られます。
Pythonのプログラミングはこのように進めます。
作業結果の保存
Jupyter Notebookの環境で作業した内容は、好きな時に保存できます。
保存する前に、まず名前をつけましょう。名前をつけるには画面上の上部のFileタブからRenameをクリックします。
名前を付けないと、勝手にUntitled(すでにUntitledが存在すれば次はUntitled 1, その次は2…)という名前が付きます。
Renameで名前をつけたら、同じFileタブからSave and Checkpointをクリックします。
これによって今の時点での状態が「ファイル<付けた名前>.ipynb」に保存されます。
次に使うときには、このipynbのファイルはJupiter NotebookのHomeのページでクリックすると、保存した状態が再現され、作業を続けることができます。
また、このipynbのファイルは他のユーザーのJupiter Notebookの環境で開くことができるので、開発途中のプログラムを渡して作業を継続してもらってり、プログラムを見て助言をもらったりすることも可能です。
Jupiter Notebookの終了
Jupyter Notebookを終了するときは、次の手順で行います。
先ず、作業していたPythonのページを閉じます。
作業していたページのFileタブを開き、メニューからSave and Checkpointをクリックし、必要に応じて最後の状態を保存します。
次に、再びFileタブを開き、最下段のClose and Haltをクリックします。
これによってこの作業環境で動作していたカーネルが停止し、このウィンドウ自体が閉じます。
もし閉じないときは、カーネルが停止していればウィンドウを閉じる操作(xボタンをクリックするなど)で閉じてもかまいません。
Jupyter Notebook全体を停止する
最初にJupyter Notebookを起動したコマンドプロンプト画面で、Control-Cを2回押します。
Control-Cとは、キーボード上のControlキーを押しながらCのキーを押す(2つ同時に押す)ことです。
1回目で終了してよいかという確認メッセージが出るので、もう一度押します。これで終了します。
関連記事