序章

Anacondaは、オープンソースのパッケージマネージャー、環境マネージャー、およびPythonおよびRプログラミング言語のディストリビューションです。 データサイエンスと機械学習のワークフロー向けに設計されており、大規模なデータ処理、科学コンピューティング、予測分析に一般的に使用されています。

Anacondaは、無料と有料の両方のエンタープライズバージョンで利用でき、1,000を超えるデータサイエンスパッケージのコレクションを提供します。 Anacondaディストリビューションには、condaコマンドラインユーティリティが付属しています。 公式のAnacondaドキュメントを読むと、Anacondaとcondaの詳細を知ることができます。

このチュートリアルでは、Python3バージョンのAnacondaをDebian9サーバーにインストールする方法について説明します。

前提条件

このガイドを開始する前に、サーバーにsudo権限を持つroot以外のユーザーを設定する必要があります。

この前提条件を達成するには、Debian9初期サーバーセットアップガイドを完了してください。

Anacondaのインストール

Anacondaをインストールする最良の方法は、最新のAnacondaインストーラーbashスクリプトをダウンロードして検証し、実行することです。

AnacondaホームページからアクセスできるダウンロードページでPython3用のAnacondaの最新バージョンを見つけてください。 執筆時点では、最新バージョンは5.2ですが、入手可能な場合は、それ以降の安定バージョンを使用する必要があります。

次に、サーバーの/tmpディレクトリに移動します。 これは、Anaconda bashスクリプトなど、実行後に不要になる一時的なアイテムをダウンロードするのに適したディレクトリです。

  1. cd /tmp

curlコマンドラインツールを使用してスクリプトをダウンロードします。 curlをインストールします。

  1. sudo apt install curl

次に、curlを使用して、AnacondaWebサイトからコピーしたリンクをダウンロードします。

  1. curl -O https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh

これで、SHA-256チェックサムを介した暗号化ハッシュ検証を使用してインストーラーのデータ整合性を検証できます。 スクリプトのファイル名とともにsha256sumコマンドを使用します。

  1. sha256sum Anaconda3-5.2.0-Linux-x86_64.sh

次のような出力が表示されます。

Output
09f53738b0cd3bb96f5b1bac488e5528df9906be2480fe61df40e0e0d19e3d48 Anaconda3-5.2.0-Linux-x86_64.sh

適切なAnacondaバージョンについては、 Anaconda with Python 3 on64ビットLinuxページで利用可能なハッシュに対して出力を確認する必要があります。 出力がsha2561行に表示されるハッシュと一致する限り、問題はありません。

これで、スクリプトを実行できます。

  1. bash Anaconda3-5.2.0-Linux-x86_64.sh

次の出力が表示されます。

Output
Welcome to Anaconda3 5.2.0 In order to continue the installation process, please review the license agreement. Please, press ENTER to continue >>>

ENTERを押して続行し、ENTERを押してライセンスを読み進めます。 ライセンスの読み取りが完了すると、ライセンス条項を承認するように求められます。

Output
Do you approve the license terms? [yes|no]

同意する限り、yesと入力します。

この時点で、インストールの場所を選択するように求められます。 ENTERを押してデフォルトの場所を受け入れるか、別の場所を指定して変更することができます。

Output
Anaconda3 will now be installed into this location: /home/sammy/anaconda3 - Press ENTER to confirm the location - Press CTRL-C to abort the installation - Or specify a different location below [/home/sammy/anaconda3] >>>

インストールプロセスは続行されます。 時間がかかる場合がありますのでご注意ください。

インストールが完了すると、次の出力が表示されます。

Output
... installation finished. Do you wish the installer to prepend the Anaconda3 install location to PATH in your /home/sammy/.bashrc ? [yes|no] [no] >>>

yesと入力して、condaコマンドを使用できるようにします。 次に、次の出力が表示されます。

Output
Appending source /home/sammy/anaconda3/bin/activate to /home/sammy/.bashrc A backup will be made to: /home/sammy/.bashrc-anaconda3.bak ...

最後に、Linuxで実行できるMicrosoftによって開発されたコード用の無料のオープンソースエディターであるVisual Studio Code(またはVSCode)をダウンロードするかどうかに関する次のプロンプトが表示されます。 このエディターの詳細については、公式のVisual StudioCodeのWebサイトを参照してください。

この時点で、yesまたはnoと入力して、エディターを今すぐダウンロードするかどうかを決定できます。

Anaconda is partnered with Microsoft! Microsoft VSCode is a streamlined
code editor with support for development operations like debugging, task
running and version control.

To install Visual Studio Code, you will need:
  - Administrator Privileges
  - Internet connectivity

Visual Studio Code License: https://code.visualstudio.com/license

Do you wish to proceed with the installation of Microsoft VSCode? [yes|no]
>>> 

インストールをアクティブ化するには、~/.bashrcファイルを入手する必要があります。

  1. source ~/.bashrc

それが完了したら、condaコマンドを使用して、たとえばlistを使用して、インストールを確認できます。

  1. conda list

Anacondaのインストールで利用できるすべてのパッケージの出力を受け取ります。

Output
# packages in environment at /home/sammy/anaconda3: # # Name Version Build Channel _ipyw_jlab_nb_ext_conf 0.1.0 py36he11e457_0 alabaster 0.7.10 py36h306e16b_0 anaconda 5.2.0 py36_3 ...

Anacondaがインストールされたので、Anaconda環境のセットアップに進むことができます。

アナコンダ環境のセットアップ

Anaconda仮想環境を使用すると、必要なPythonバージョンとパッケージごとにプロジェクトを整理できます。 セットアップしたAnaconda環境ごとに、使用するPythonのバージョンを指定し、関連するすべてのプログラミングファイルをそのディレクトリ内にまとめることができます。

まず、使用できるPythonのバージョンを確認できます。

  1. conda search "^python$"

Python3とPython2の両方のバージョンを含む、ターゲットにできるさまざまなバージョンのPythonで出力を受け取ります。 このチュートリアルではPython3でAnacondaを使用しているため、Python3バージョンのパッケージにのみアクセスできます。

最新バージョンのPython3を使用して環境を作成しましょう。 これは、バージョン3をpython引数に割り当てることで実現できます。 環境をmy_envと呼びますが、環境を使用して複数のバージョンのPythonにアクセスする場合は特に、環境にわかりやすい名前を使用することをお勧めします。

  1. conda create --name my_env python=3

ダウンロードされたものとインストールされるパッケージに関する情報を含む出力を受け取り、yまたはnに進むように求められます。 同意する限り、yと入力します。

condaユーティリティは、環境のパッケージをフェッチし、完了したときに通知するようになりました。

次のように入力して、新しい環境をアクティブ化できます。

  1. source activate my_env

環境をアクティブにすると、コマンドプロンプトのプレフィックスが変更されます。

環境内で、使用する予定のバージョンのPythonを使用していることを確認できます。

  1. python --version
Output
Python 3.7.0 :: Anaconda, Inc.

Anaconda環境を非アクティブ化する準備ができたら、次のように入力して非アクティブ化できます。

  1. source deactivate

sourceという単語を.に置き換えて、同じ結果を得ることができることに注意してください。

Pythonのより具体的なバージョンをターゲットにするには、3.5のように、特定のバージョンをpython引数に渡すことができます。次に例を示します。

  1. conda create -n my_env35 python=3.5

次のコマンドを使用して、それぞれの環境内で同じブランチに沿ってPythonのバージョンを更新できます(Python3.5.1をPython3.5.2に更新する場合と同様)。

  1. conda update python

より具体的なバージョンのPythonをターゲットにする場合は、python=3.3.2のように、それをpython引数に渡すことができます。

このコマンドを使用して、セットアップしたすべての環境を検査できます。

  1. conda info --envs
Output
# conda environments: # base * /home/sammy/anaconda3 my_env /home/sammy/anaconda3/envs/my_env my_env35 /home/sammy/anaconda3/envs/my_env35

アスタリスクは、現在アクティブな環境を示します。

conda createで作成する各環境には、いくつかのデフォルトパッケージが付属しています。

  • openssl
  • pip
  • python
  • readline
  • setuptools
  • sqlite
  • tk
  • wheel
  • xz
  • zlib

次のコマンドを使用して、たとえばnumpyなどのパッケージを追加できます。

  1. conda install --name my_env35 numpy

作成時にnumpy環境が必要であることがわかっている場合は、conda createコマンドでそれをターゲットにできます。

  1. conda create --name my_env python=3 numpy

特定のプロジェクトに取り組んでおらず、関連する環境がさらに必要ない場合は、そのプロジェクトを削除できます。 これを行うには、次のように入力します。

  1. conda remove --name my_env35 --all

これで、conda info --envsコマンドを入力すると、削除した環境が一覧表示されなくなります。

Anacondaの更新

すべての最新パッケージリリースで作業できるように、Anacondaが最新であることを定期的に確認する必要があります。

これを行うには、最初にcondaユーティリティを更新する必要があります。

  1. conda update conda

プロンプトが表示されたら、yと入力して更新を続行します。

condaの更新が完了したら、Anacondaディストリビューションを更新できます。

  1. conda update anaconda

再度、プロンプトが表示されたら、yと入力して続行します。

これにより、condaおよびAnacondaの最新リリースを使用していることが保証されます。

Anacondaのアンインストール

Anacondaを使用しなくなり、アンインストールする必要がある場合は、anaconda-cleanモジュールから開始する必要があります。これにより、Anacondaをアンインストールするときに構成ファイルが削除されます。

  1. conda install anaconda-clean

プロンプトが表示されたら、yと入力します。

インストールしたら、次のコマンドを実行できます。 それぞれを削除する前に、yと答えるプロンプトが表示されます。 プロンプトを表示したくない場合は、コマンドの最後に--yesを追加します。

anaconda-clean

これにより、ホームディレクトリに.anaconda_backupというバックアップフォルダも作成されます。

Output
Backup directory: /home/sammy/.anaconda_backup/2018-09-06T183049

次のコマンドを入力して、Anacondaディレクトリ全体を削除できるようになりました。

  1. rm -rf ~/anaconda3

最後に、Anacondaが追加した.bashrcファイルからPATH行を削除できます。 これを行うには、最初にnanoなどのテキストエディタを開きます。

  1. nano ~/.bashrc

次に、ファイルの最後までスクロールするか(これが最近のインストールの場合)、CTRL + Wと入力してAnacondaを検索します。 export PATH行を削除またはコメントアウトします。

/home/sammy/.bashrc
...
# added by Anaconda3 installer
export PATH="/home/sammy/anaconda3/bin:$PATH"

ファイルの編集が終了したら、CTRL + Xと入力して終了し、yと入力して変更を保存します。

これで、Anacondaがサーバーから削除されました。

結論

このチュートリアルでは、Anacondaのインストール、condaコマンドラインユーティリティの操作、環境のセットアップ、Anacondaの更新、および不要になった場合のAnacondaの削除について説明しました。

Anacondaを使用すると、データサイエンス、科学計算、分析、および大規模なデータ処理のワークロードを管理できます。 ここから、データ分析機械学習のチュートリアルをチェックして、使用できるさまざまなツールと実行できるプロジェクトについて詳しく知ることができます。