序章

Anacondaは、オープンソースのパッケージマネージャー、環境マネージャー、およびPythonおよびRプログラミング言語のディストリビューションです。 データサイエンスと機械学習のワークフロー向けに設計されたAnacondaは、大規模なデータ処理、科学コンピューティング、予測分析に一般的に使用されています。

データを操作するユーザーをサポートする1,000以上のパッケージのコレクションを提供するアナコンダは、無料と有料の両方のエンタープライズバージョンで利用できます。 Anacondaディストリビューションには、condaコマンドラインユーティリティが付属しています。 公式のAnacondaドキュメントを読むと、Anacondaとcondaの詳細を知ることができます。

このチュートリアルでは、Python3バージョンのAnacondaをDebian10サーバーにインストールする方法について説明します。

前提条件

このガイドを開始する前に、サーバーにsudo権限を持つroot以外のユーザーを設定する必要があります。

この前提条件を達成するには、Debian10初期サーバーセットアップガイドを完了してください。

Anacondaのインストール

AnacondaをDebian10サーバーにインストールするには、最新のAnacondaインストーラーbashスクリプトをダウンロードして検証し、実行する必要があります。

Anacondaディストリビューションページで、Python3用のAnacondaの最新バージョンを見つけてください。 執筆時点では、最新バージョンは2019.03ですが、入手可能な場合は、それ以降の安定バージョンを使用する必要があります。

次に、サーバーの/tmpディレクトリに移動します。 これは、Anaconda bashスクリプトなど、実行後に不要になる一時的なアイテムをダウンロードするのに適したディレクトリです。

  1. cd /tmp

curlコマンドラインツールを使用してスクリプトをダウンロードします。 curlをインストールします。

sudo apt install curl

次に、curlを使用して、AnacondaWebサイトからコピーしたリンクをダウンロードします。

  1. curl -O https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh

この時点で、SHA-256チェックサムを介した暗号化ハッシュ検証を使用してインストーラーのデータ整合性を検証できます。 スクリプトのファイル名とともにsha256sumコマンドを使用します。

  1. sha256sum Anaconda3-2019.03-Linux-x86_64.sh

次のような出力が表示されます。

Output
45c851b7497cc14d5ca060064394569f724b67d9b5f98a926ed49b834a6bb73a Anaconda3-2019.03-Linux-x86_64.sh

適切なAnacondaバージョンについては、 Anaconda with Python 3 on64ビットLinuxページで利用可能なハッシュに対して出力を確認する必要があります。 出力がsha2561行に表示されるハッシュと一致する限り、問題はありません。

これで、スクリプトを実行できます。

  1. bash Anaconda3-2019.03-Linux-x86_64.sh

次の出力が表示されます。

Output
Welcome to Anaconda3 2019.03 In order to continue the installation process, please review the license agreement. Please, press ENTER to continue >>>

ENTERを押して続行し、ENTERを押してライセンスを読み進めます。 ライセンスの読み取りが完了すると、ライセンス条項を承認するように求められます。

Output
Do you approve the license terms? [yes|no]

同意する限り、yesと入力します。

この時点で、インストールの場所を選択するように求められます。 ENTERを押してデフォルトの場所を受け入れるか、別の場所を指定して変更することができます。

Output
Anaconda3 will now be installed into this location: /home/sammy/anaconda3 - Press ENTER to confirm the location - Press CTRL-C to abort the installation - Or specify a different location below [/home/sammy/anaconda3] >>>

インストールプロセスは続行されます。 時間がかかる場合がありますのでご注意ください。

インストールが完了すると、次の出力が表示されます。

Output
... installation finished. Do you wish the installer to initialize Anaconda3 by running conda init? [yes|no] [no] >>>

yesと入力して、AnacondaをPATHに手動で追加する必要がないようにします。

Output
Appending source /home/sammy/anaconda3/bin/activate to /home/sammy/.bashrc A backup will be made to: /home/sammy/.bashrc-anaconda3.bak ...

これで、~/.bashrcファイルを入手してインストールをアクティブ化できます。

  1. source ~/anaconda3/bin/activate

これで、自動的にbaseという名前のAnacondaの基本プログラミング環境になります。 これを反映してプロンプトが変更されます。

これで、conda initコマンドを実行して環境を初期化できます。

  1. conda init

それが完了したら、condaコマンドを使用して、たとえばlistを使用して、インストールを確認できます。

  1. conda list

Anacondaのインストールで利用できるすべてのパッケージの出力を受け取ります。

Output
# packages in environment at /home/sammy/anaconda3: # # Name Version Build Channel _ipyw_jlab_nb_ext_conf 0.1.0 py37_0 alabaster 0.7.12 py37_0 anaconda 2019.03 py37_0 ...

Anacondaがインストールされたので、Anaconda環境のセットアップに進むことができます。

アナコンダ環境のセットアップ

Anaconda仮想環境を使用すると、必要なPythonバージョンとパッケージごとにプロジェクトを整理できます。 セットアップしたAnaconda環境ごとに、使用するPythonのバージョンを指定し、関連するすべてのプログラミングファイルをそのディレクトリ内にまとめることができます。

まず、使用できるPythonのバージョンを確認できます。

  1. conda search "^python$"

Python3とPython2の両方のバージョンを含む、ターゲットにできるさまざまなバージョンのPythonで出力を受け取ります。 このチュートリアルではPython3でAnacondaを使用しているため、Python3バージョンのパッケージにのみアクセスできます。

最新バージョンのPython3を使用して環境を作成しましょう。 これは、バージョン3をpython引数に割り当てることで実現できます。 環境をmy_envと呼びますが、環境を使用して複数のバージョンのPythonにアクセスする場合は特に、環境にわかりやすい名前を使用することをお勧めします。

  1. conda create --name my_env python=3

ダウンロードされたものとインストールされるパッケージに関する情報を含む出力を受け取り、yまたはnに進むように求められます。 同意する限り、yと入力します。

condaユーティリティは、環境のパッケージをフェッチし、完了したときに通知するようになりました。

次のように入力して、新しい環境をアクティブ化できます。

  1. conda activate my_env

環境をアクティブにすると、コマンドプロンプトのプレフィックスが変更されます。

環境内で、使用する予定のバージョンのPythonを使用していることを確認できます。

  1. python --version
Output
Python 3.7.3

Anaconda環境を非アクティブ化する準備ができたら、次のように入力して非アクティブ化できます。

  1. conda deactivate

Pythonのより具体的なバージョンをターゲットにするには、3.5のように、特定のバージョンをpython引数に渡すことができます。次に例を示します。

  1. conda create -n my_env35 python=3.5

次のコマンドを使用して、それぞれの環境内の同じブランチに沿ってPythonのバージョンを更新できます。

  1. conda update python

より具体的なバージョンのPythonをターゲットにする場合は、python=3.3.2のように、それをpython引数に渡すことができます。

このコマンドを使用して、セットアップしたすべての環境を検査できます。

  1. conda info --envs
Output
# conda environments: # base * /home/sammy/anaconda3 my_env /home/sammy/anaconda3/envs/my_env my_env35 /home/sammy/anaconda3/envs/my_env35

アスタリスクは、現在アクティブな環境を示します。

conda createで作成する各環境には、いくつかのデフォルトパッケージが付属しています。

  • openssl
  • pip
  • python
  • readline
  • setuptools
  • sqlite
  • tk
  • wheel
  • xz
  • zlib

次のコマンドを使用して、たとえばnumpyなどのパッケージを追加できます。

  1. conda install --name my_env35 numpy

作成時にnumpy環境が必要であることがわかっている場合は、conda createコマンドでそれをターゲットにできます。

  1. conda create --name my_env python=3 numpy

特定のプロジェクトに取り組んでおらず、関連する環境がさらに必要ない場合は、そのプロジェクトを削除できます。 これを行うには、次のように入力します。

  1. conda remove --name my_env35 --all

これで、conda info --envsコマンドを入力すると、削除した環境が一覧表示されなくなります。

Anacondaの更新

すべての最新パッケージリリースで作業できるように、Anacondaが最新であることを定期的に確認する必要があります。

これを行うには、最初にcondaユーティリティを更新する必要があります。

  1. conda update conda

プロンプトが表示されたら、yと入力して更新を続行します。

condaの更新が完了したら、Anacondaディストリビューションを更新できます。

  1. conda update anaconda

再度、プロンプトが表示されたら、yと入力して続行します。

これにより、condaおよびAnacondaの最新リリースを使用していることが保証されます。

Anacondaのアンインストール

Anacondaを使用しなくなって、アンインストールする必要がある場合は、システムから完全に離れていることを確認するためのいくつかの手順があります。

まず、現在の基本Anaconda環境を非アクティブ化します。

  1. conda deactivate

次に、anaconda-cleanモジュールをインストールします。これにより、Anacondaをアンインストールするときの構成ファイルが削除されます。

  1. conda install anaconda-clean

プロンプトが表示されたら、yと入力します。

インストールしたら、次のコマンドを実行できます。 それぞれを削除する前に、yと答えるプロンプトが表示されます。 プロンプトを表示したくない場合は、コマンドの最後に--yesを追加します。

  1. anaconda-clean

これにより、ホームディレクトリに.anaconda_backupというバックアップフォルダも作成されます。

Output
Backup directory: /home/sammy/.anaconda_backup/2019-07-09T020356

次のコマンドを入力して、Anacondaディレクトリ全体を削除できるようになりました。

  1. rm -rf ~/anaconda3

最後に、Anacondaが追加した.bashrcファイルからPATH行を削除できます。 これを行うには、最初にnanoなどのテキストエディタを開きます。

  1. nano ~/.bashrc

次に、ファイルの最後までスクロールするか(これが最近のインストールの場合)、CTRL + Wと入力してAnacondaを検索します。 condaを初期化するスクリプトを削除またはコメントアウトします。

/home/sammy/.bashrc
...
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
# __conda_setup="$('/home/sammy/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
# if [ $? -eq 0 ]; then
#     eval "$__conda_setup"
# else
#     if [ -f "/home/sammy/anaconda3/etc/profile.d/conda.sh" ]; then
#         . "/home/sammy/anaconda3/etc/profile.d/conda.sh"
#     else
#         export PATH="/home/sammy/anaconda3/bin:$PATH"
#     fi
# fi
# unset __conda_setup
# <<< conda initialize <<<

ファイルの編集が終了したら、CTRL + Xと入力して終了し、yと入力して変更を保存します。

これで、Anacondaがサーバーから削除されました。

結論

このチュートリアルでは、Anacondaのインストール、condaコマンドラインユーティリティの操作、環境のセットアップ、Anacondaの更新、および不要になった場合のAnacondaの削除について説明しました。

Anacondaを使用すると、データサイエンス、科学計算、分析、および大規模なデータ処理のワークロードを管理できます。 ここから、データ分析機械学習のチュートリアルをチェックして、使用できるさまざまなツールと実行できるプロジェクトについて詳しく知ることができます。