ベル曲線は、正規分布とも呼ばれ、変数の分布の最も一般的なタイプです。 これは、多くの状況で自然に発生する分布として受け入れられています。 ベル曲線では、円弧の最高点が要素の最大出現数である平均を定義します。 発生の確率は、曲線の両側に向かって減少します。 ベル曲線を使用して、両極端を除外してパフォーマンスを比較したり、結果が中央の左または右の範囲内にある可能性によって期待値を定義したり このガイドでは、実際のユースケースシナリオを例にしてExcelでベル曲線を作成する方法を説明します。
ワークブックのダウンロード
基本
必要なのは、データセットの平均(平均)と標準偏差値だけです。 これらの指標は両方とも、以下の式を使用してExcelで計算できます。
これらの2つの値を考慮して、正規分布の値は次の規則に従います:
- 曲線の下の総面積は次のようになります1 (100%)
- ベル曲線の中心は、データ点
- (1-π)の平均であり、曲線下の面積の約68.2%が1つの標準偏差(平均±標準偏差)に該当します)
- (2-△)約95曲線の下の面積の5%は、2つの標準偏差(平均±2*標準偏差)内にあります。)
- (3-σ)曲線下の面積の約99.7%が三つの標準偏差(平均±3*標準偏差)内に入る)
バージニア大学からの画像
Excelでベル曲線を作成する
一般的な例を挙げて、学生のクラスの試験結果を分析しているとしましょう。 私たちは、より良い比較のために試験結果を測定するためにベル曲線を使用します。
まず、曲線を生成する正規分布データを生成するためにメトリックを計算することから始めます。 私たちは計算する必要があります:
- 値の平均(平均)。
- 値の標準偏差。
- 3-平均前後の標準偏差の限界。
- 正規分布データポイントの間隔値。 これには、区間ポイントの決定も必要です。 任意の数を選択できますが、間隔が多いほど精度が高くなります。
メトリクス
まず、データの平均と標準偏差を計算します。 AVEREAGEとSTDEVを使用できます。Pは、それぞれ平均値と標準偏差値を計算する関数です。
次のステップは、データの99.7%の最小値と最大値を設定するために3つの標準偏差値を計算することです。
最大= 83.23 – 3 * 5.54 = 99.86
曲線の最小値と最大値を設定した後、区間を生成する必要があります。 区間の値は、正規分布の値のベースになります。 間隔を計算するには、最小値と最大値の間の領域を間隔カウントで除算するだけです。 この例では、これを20に設定しますが、より大きな数値を使用してデータポイントの数を増やすことができます。
間隔の値が計算されると、データポイントを生成できます。 これを行うには、セルに最小値を入力します。 次に、最小値のすぐ下に数式を入力して、間隔値を最小値に追加します。 ここでは、データポイントを最大値まで簡単に入力するのに役立つセル参照(J4など)を使用しました。
次のステップは、生成されたデータポイントから正規分布値を計算することです。 Excelの標準を使用できます。これらの値を生成するDIST関数。
移入されたデータポイントを関数の最初の引数として使用します。 平均値と標準偏差値は次の引数です。 この関数の非累積型を使用するには、FALSEブール値で数式を終了します。
チャート
もうすぐ終わりです! データ点と正規分布の値を選択し、X-Y散布図を挿入します。 Excelでベル曲線を作成するには、Scattered with Smooth Linesバージョンを使用します。
チャートは、最初に少しオフに見えるかもしれません。 あなたはそれが良く見えるようにする方法を見てみましょう。
チャートのタイトルを変更するには、タイトルをダブルクリックして名前を更新します。
次に、X軸をダブルクリックし、軸オプションパネルから最小値と最大値を定義して、両側の空白を取り除きます。 これはあなたの図表によりよい鐘の形を与える。 私たちは、データセットの少し外にある値を設定します。 たとえば、値66.30–99.86の場合は66–100です。
標準偏差値を追加することで、グラフをさらに強化できます。