1. 概要

このチュートリアルでは、機械学習(ML)モデルの3つの主要コンポーネントである機能、パラメーター、クラスについて説明します。

2. 予選

過去数年間、 MLの分野は、工学や金融から医学や生物学に至るまで、私たちの生活の多くの側面に革命をもたらしました。 その用途は、自動運転車から癌などの致命的な病気の予測まで多岐にわたります。 一般に、MLの目標は、データの構造を理解し、そのデータを人々が理解して利用できるモデルに適合させることです。 これらのモデルは、実際のプロセスを数学的に表現したものであり、次のように分類されます。

  • 監視対象では、ラベル付けされたデータセットを使用して、データを分類したり、結果を正確に予測したりするためのアルゴリズムをトレーニングします。
  • 教師なしここでは、人間の介入を必要とせずに、ラベルのないデータセットを分析およびクラスター化します。

3. 特徴

まず、モデルへの入力として機能する機能について説明します。 機能は、タスクのプロパティまたは特性を測定する個別の独立変数です。有益で、識別力があり、独立した機能を選択することは、モデルを実装する際の最初の重要な決定です。 従来のMLでは、データのいくつかの有用な機能を手作りして選択するのが私たちの責任ですが、現代の深層学習では、機能は基礎となるアルゴリズムに基づいて自動的に学習されます。

機能の概念をよりよく説明するために、学生が大学の大学院に受け入れられるかどうかを予測するモデルを実装したいとします。機能を選択するには、相関する変数を考える必要があります。結果は、卒業生の申請の結果に影響を与えることを意味します。 たとえば、次の機能を使用できます。

  • 彼らの学部研究のGPA
  • 以前の教授や雇用主の推薦状
  • GRE、GMATなどの標準化されたテストでのスコア
  • 以前の出版物がある場合
  • 彼らが学部時代に取り組んだプロジェクト

 

結果(受け入れられるかどうか)は、これらの変数のすべてに多かれ少なかれ依存するため、MLモデルへの入力機能として使用できます。 機能が多すぎる場合は、機能選択メソッドを使用できます。

4. パラメーター

次のステップは、タスク用にトレーニングするMLモデルを選択することです。 モデルパラメータは、このモデルの内部変数として定義されます。 すべてのMLアルゴリズムにはこれらのパラメーターを最適化するメカニズムがあるため、トレーニング中にデータから純粋に学習または推定されます。

トレーニングは通常、パラメータがいくつかの値に初期化されることから始まります。 トレーニングが進むにつれて、初期値は最適化アルゴリズムを使用して更新されます(例: 最急降下法)。 学習アルゴリズムは、学習が進むにつれてパラメータ値を継続的に更新しています。 学習プロセスの最後に、モデルパラメータがモデル自体を構成します。

パラメータの概念をよりよく理解するために、いくつかの一般的なMLモデルのパラメータを見てみましょう。

  • 単純な線形回帰モデルでは、変数とはモデルのパラメーターです。
  • ニューラルネットワークモデルでは、重みとバイアスがモデルのパラメーターです。
  • Clustering モデルでは、クラスターの重心がモデルのパラメーターです。

パラメータとハイパーパラメータを混同することがよくあります。 ただし、ハイパーパラメーターは、モデルによるトレーニング中に学習されるのではなく、事前に設定されます。たとえば、クラスタリングでは、クラスターの数はハイパーパラメーターであり、クラスターの重心はパラメーターです。

5. クラス

最後の用語は、入力特徴からいくつかの離散出力変数へのマッピング関数を学習したい分類タスクにのみ適用されます。 これらの出力変数は、クラス(またはラベル)と呼ばれます。

 

卒業生の申請の前のタスクでは、「受け入れられた」と「受け入れられなかった」ではない2つのクラスしかありません。

6. 結論

この記事では、MLモデルの3つの主要コンポーネントである機能、パラメーター、およびクラスについて説明しました。 最初にそれらを定義し、次にいくつかの実用的な例を示しました。