序章

Anaconda は、オープンソースのパッケージマネージャー、環境マネージャー、およびPythonとRのプログラミング言語のディストリビューションです。 これは、大規模なデータ処理、科学計算、および予測分析に一般的に使用され、データサイエンティスト、開発者、ビジネスアナリスト、およびDevOpsで働く人々にサービスを提供します。

Anacondaは、720を超えるオープンソースパッケージのコレクションを提供しており、無料バージョンと有料バージョンの両方で利用できます。 Anacondaディストリビューションには、condaコマンドラインユーティリティが付属しています。 Anacondaドキュメントページを読むと、Anacondaとcondaの詳細を知ることができます。

このチュートリアルでは、Python3バージョンのAnacondaをUbuntu16.04サーバーにインストールする方法について説明します。

前提条件

このガイドを開始する前に、サーバーにsudo権限を持つroot以外のユーザーを設定する必要があります。 これを行う方法については、Ubuntu16.04初期サーバーセットアップガイドを完了することで学ぶことができます。

Anacondaのインストール

Anacondaをインストールする最良の方法は、最新のAnacondaインストーラーbashスクリプトをダウンロードして検証し、実行することです。

Anacondaダウンロードページで、Python3用のAnacondaの最新バージョンを見つけてください。 執筆時点では、最新バージョンは5.0.1ですが、利用可能な場合は、それ以降の安定バージョンを使用する必要があります。

次に、サーバーの/tmpディレクトリに移動します。 これは、Anaconda bashスクリプトなど、実行後に不要になる一時的なアイテムをダウンロードするのに適したディレクトリです。

  1. cd /tmp

curlを使用して、AnacondaWebサイトからコピーしたリンクをダウンロードします。

  1. curl -O https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh

これで、SHA-256チェックサムを介した暗号化ハッシュ検証を使用してインストーラーのデータ整合性を検証できます。 スクリプトのファイル名とともにsha256sumコマンドを使用します。

  1. sha256sum Anaconda3-5.0.1-Linux-x86_64.sh

次のような出力が表示されます。

Output
55e4db1919f49c92d5abbf27a4be5986ae157f074bf9f8238963cd4582a4068a Anaconda3-5.0.1-Linux-x86_64.sh

適切なAnacondaバージョンについては、 Anaconda with Python 3 on64ビットLinuxページで利用可能なハッシュに対して出力を確認する必要があります。 出力がsha2561行に表示されているハッシュと一致する限り、問題はありません。

これで、スクリプトを実行できます。

  1. bash Anaconda3-5.0.1-Linux-x86_64.sh

次の出力が表示されます。

Output
Welcome to Anaconda3 5.0.1 (by Continuum Analytics, Inc.) In order to continue the installation process, please review the license agreement. Please, press ENTER to continue

ENTERを押して続行し、ENTERを押してライセンスを読み進めます。 ライセンスの読み取りが完了すると、ライセンス条項を承認するように求められます。

Output
Do you approve the license terms? [yes|no]

同意する限り、yesと入力します。

この時点で、インストールの場所を選択するように求められます。 ENTERを押してデフォルトの場所を受け入れるか、別の場所を指定して変更することができます。

Output
Anaconda3 will now be installed into this location: /home/sammy/anaconda3 - Press ENTER to confirm the location - Press CTRL-C to abort the installation - Or specify a different location below [/home/sammy/anaconda3] >>>

インストールプロセスは続行されますが、時間がかかる場合があります。

完了すると、次の出力が表示されます。

Output
... installation finished. Do you wish the installer to prepend the Anaconda3 install location to PATH in your /home/sammy/.bashrc ? [yes|no] [no] >>>

yesと入力して、condaコマンドを使用できるようにします。 次に、次の出力が表示されます。

Output
Prepending PATH=/home/sammy/anaconda3/bin to PATH in /home/sammy/.bashrc A backup will be made to: /home/sammy/.bashrc-anaconda3.bak ...

インストールをアクティブ化するには、~/.bashrcファイルを入手する必要があります。

  1. source ~/.bashrc

それが完了したら、condaコマンドを使用して、たとえばlistを使用して、インストールを確認できます。

  1. conda list

Anacondaのインストールで利用できるすべてのパッケージの出力を受け取ります。

Output
# packages in environment at /home/sammy/anaconda3: # _ipyw_jlab_nb_ext_conf 0.1.0 py36he11e457_0 alabaster 0.7.10 py36h306e16b_0 anaconda 5.0.1 py36hd30a520_1 ...

Anacondaがインストールされたので、Anaconda環境のセットアップに進むことができます。

アナコンダ環境のセットアップ

Anaconda仮想環境を使用すると、必要なPythonバージョンとパッケージごとにプロジェクトを整理できます。 セットアップしたAnaconda環境ごとに、使用するPythonのバージョンを指定し、関連するすべてのプログラミングファイルをそのディレクトリ内にまとめることができます。

まず、使用できるPythonのバージョンを確認できます。

  1. conda search "^python$"

Python3とPython2の両方のバージョンを含む、ターゲットにできるさまざまなバージョンのPythonで出力を受け取ります。 このチュートリアルではPython3でAnacondaを使用しているため、Python3バージョンのパッケージにのみアクセスできます。

最新バージョンのPython3を使用して環境を作成しましょう。 これは、バージョン3をpython引数に割り当てることで実現できます。 環境をmy_envと呼びますが、環境を使用して複数のバージョンのPythonにアクセスする場合は特に、環境にわかりやすい名前を使用することをお勧めします。

  1. conda create --name my_env python=3

ダウンロードされたものとインストールされるパッケージに関する情報を含む出力を受け取り、yまたはnに進むように求められます。 同意する限り、yと入力します。

condaユーティリティは、環境のパッケージをフェッチし、完了したときに通知するようになりました。

次のように入力して、新しい環境をアクティブ化できます。

  1. source activate my_env

環境をアクティブにすると、コマンドプロンプトのプレフィックスが変更されます。

環境内で、使用する予定のバージョンのPythonを使用していることを確認できます。

  1. python --version
Output
Python 3.6.0 :: Continuum Analytics, Inc.

Anaconda環境を非アクティブ化する準備ができたら、次のように入力して非アクティブ化できます。

  1. source deactivate

sourceという単語を.に置き換えて、同じ結果を得ることができることに注意してください。

Pythonのより具体的なバージョンをターゲットにするには、3.5のように、特定のバージョンをpython引数に渡すことができます。次に例を示します。

  1. conda create -n my_env35 python=3.5

次のコマンドを使用して、それぞれの環境内で同じブランチに沿ってPythonのバージョンを更新できます(Python3.5.1をPython3.5.2に更新する場合と同様)。

  1. conda update python

より具体的なバージョンのPythonをターゲットにする場合は、python=3.3.2のように、それをpython引数に渡すことができます。

このコマンドを使用して、セットアップしたすべての環境を検査できます。

  1. conda info --envs
Output
# conda environments: # my_env /home/sammy/anaconda3/envs/my_env my_env35 /home/sammy/anaconda3/envs/my_env35 root * /home/sammy/anaconda3

アスタリスクは、現在アクティブな環境を示します。

conda createで作成する各環境には、いくつかのデフォルトパッケージが付属しています。

  • openssl
  • pip
  • python
  • readline
  • setuptools
  • sqlite
  • tk
  • wheel
  • xz
  • zlib

次のコマンドを使用して、たとえばnumpyなどのパッケージを追加できます。

  1. conda install --name my_env35 numpy

作成時にnumpy環境が必要であることがわかっている場合は、conda createコマンドでそれをターゲットにできます。

  1. conda create --name my_env python=3 numpy

特定のプロジェクトに取り組んでおらず、関連する環境がさらに必要ない場合は、そのプロジェクトを削除できます。 これを行うには、次のように入力します。

  1. conda remove --name my_env35 --all

これで、conda info --envsコマンドを入力すると、削除した環境が一覧表示されなくなります。

Anacondaの更新

すべての最新パッケージリリースで作業できるように、Anacondaが最新であることを定期的に確認する必要があります。

これを行うには、最初にcondaユーティリティを更新する必要があります。

  1. conda update conda

プロンプトが表示されたら、yと入力して更新を続行します。

condaの更新が完了したら、Anacondaディストリビューションを更新できます。

  1. conda update anaconda

再度、プロンプトが表示されたら、yと入力して続行します。

これにより、condaおよびAnacondaの最新リリースを使用していることが保証されます。

Anacondaのアンインストール

Anacondaを使用しなくなり、アンインストールする必要がある場合は、anaconda-cleanモジュールから開始して、Anacondaをアンインストールするときに構成ファイルを削除する必要があります。

  1. conda install anaconda-clean

プロンプトが表示されたら、yと入力します。

インストールしたら、次のコマンドを実行できます。 それぞれを削除する前に、yと答えるプロンプトが表示されます。 プロンプトを表示したくない場合は、コマンドの最後に--yesを追加します。

anaconda-clean

これにより、ホームディレクトリに.anaconda_backupというバックアップフォルダも作成されます。

Output
Backup directory: /home/sammy/.anaconda_backup/2017-01-25T191831

次のコマンドを入力して、Anacondaディレクトリ全体を削除できるようになりました。

  1. rm -rf ~/anaconda3

最後に、Anacondaが追加した.bashrcファイルからPATH行を削除できます。 そのためには、最初にnanoを開きます。

  1. nano ~/.bashrc

次に、ファイルの最後までスクロールするか(これが最近のインストールの場合)、CTRL + Wと入力してAnacondaを検索します。 次の行を削除またはコメントアウトします。

/home/sammy/.bashrc
# added by Anaconda3 4.2.0 installer
export PATH="/home/sammy/anaconda3/bin:$PATH"

ファイルの編集が終了したら、CTRL + Xと入力して終了し、yと入力して変更を保存します。

これで、Anacondaがサーバーから削除されました。

結論

このチュートリアルでは、Anacondaのインストール、condaコマンドラインユーティリティの操作、環境のセットアップ、Anacondaの更新、および不要になった場合のAnacondaの削除について説明しました。

Anacondaを使用すると、データサイエンス、科学計算、分析、および大規模なデータ処理のワークロードを管理できます。