1. 序章

私たちが住んでいる時代では、データを適切に使用し、それを活用する方法を学ぶことが非常に重要です。 小売業者はこれをよく知っているので、事前に計画するために売上予測を行います。 これにより、注文する製品の数量、在庫がある、保管しているなどを知ることができ、顧客への供給を維持しながらコストを削減できます。

それでも、私たちの予測が十分に良いことをどうやって知ることができますか? その精度をどのように測定できますか?

このチュートリアルでは、そのためのさまざまな方法を分析します。

2. 問題

村で1ガロンのミルクを販売する中小企業があると想像してみてください。 来週の月曜日から水曜日までの販売額を予測したいと思います。 この村のほとんどの人は月曜日にたくさんのミルクを買う傾向があるので、火曜日にはもうそれを買わず、水曜日までにそれを使い果たします。 以前の売上を考慮して、単純なモデルを作成し、この予測を作成します(ここでは、後で取得する実際の売上と比較します)。

これで、平均絶対誤差の式を使用して、予測によって得られた平均誤差を計算できます。これは、時間での予測と実際の値です。

これにより、平均絶対誤差が2になります。 これは、2ガロンのミルクによって予測が誤って計算されたことを示しているだけなので、あまり役に立ちません。 売上に関連してより良い情報が必要です。

3. MAPE

MAPEは、予測精度を測定するための最も一般的な方法の1つです。 これは、平均絶対パーセント誤差を意味し、実際の値に対する予測のパーセント誤差を測定します。 時間の経過またはさまざまな製品の平均誤差を計算するため、それらを区別しません。 これは、より適切に予測するために、どの日またはどの製品の間に優先順位がないことを前提としていることを意味します。 次のように計算されます。

   

予測で計算すると、次のようになります。

ここでは、MAPEの主な弱点を見ることができます。 売上が少ない場合、MAPEの価値は膨らみ、そのため、そうであるように、欺瞞的な結果を示す可能性があります。

販売された102の合計のうち2ガロンだけ予測がずれていますが、実際のMAPEは36.7%です。 これは、火曜日に2ガロンを販売すると予測したが、代わりに1ガロンを販売することになり、その日は100%のエラーが発生したためです。 これを解決するには、代わりにWAPEを使用する必要があります。

4. WAPE

WAPEは、MAD /平均比とも呼ばれ、加重平均パーセント誤差を意味します。 総売上高を加算することにより、エラーに重みを付けます。

   

この例では:

これで、エラーがどのように意味をなすかがわかり、結果は5.9%になります。 総売上高が少ない場合や分析対象商品の売上が断続的である場合は、MAPEよりWAPEをお勧めします。

5. WMAPE

前述のように、MAPEもWAPEも、製品間または時間の瞬間の優先順位の可能な違いを考慮していません。 の私たちの例、l たとえば、月曜日が予測するのに最も重要な日だと思います。 これを予測誤差にどのように反映できますか?

WMAPEは、ユースケースでこれが必要な場合に使用できます。 これは加重平均絶対パーセント誤差を意味し、次のように計算されます:

   

この式により、さまざまな要因に重み、つまり重要性を与えることができます。

私たちの例では、月曜日に他の日と比べて80 % oの重要性を与え、10% eachが与えられているとしましょう。 これにより、次のようになります。

したがって、月曜日の重要性を考慮すると、最終的にWMAPEは9.1%になります。

6. 結論

この記事では、予測精度を測定する3つの異なる方法と、それらを適用する方法について説明しました。 すべての問題に完全な対策はありませんが、ユースケースに応じて各対策を選択する必要があります。

MAPEは通常、予測誤差を測定するために使用されますが、売上がゼロに近い場合、または断続的な売上の場合は、欺くことができます。 WAPEは、総売上高に対するエラーを重み付けすることによってこれに対抗する手段です。 WMAPEは、ユースケースで特定の販売を優先する必要がある場合に使用されます。 これは、予測エラーをそれに偏らせる優先項目に重みを与えます。

これらのメトリックはすべて対称的です。つまり、予測が過大予測されているか過小予測されているかは考慮されていません。 これは、いくつかの問題に関連する可能性があり(在庫が多すぎることと不足することは同じではありません)、考慮に入れる必要があります。