はじめに
すべては、統計分析方法の特権を利用することになります。
通常のビジネスは、最近の十年の過程で根本的に変化しています。 それが作業領域で使用されるハードウェアであるか、または付与するために使用されるソフトウェアであるかにかかわらず、非常にまれなものは、 統計的モデリング手法は、ロジスティック回帰、線形回帰、変動の分析、相関、行列演算、サンプリングなどです。
ユニークな別の何かが、私たちが容易に入手できる情報の量です。 かつて不足していたものは、現在、情報の圧倒的な尺度です。 それは可能性がありますように、それはおそらくあなたが洞察力と真の意味を発見するためにあなたのビジネスの情報を調査する方法foggiestアイデア
統計分析を行うための5つの方法
この統計分析方法には、5つの方法があります:
- 平均
- 標準偏差
- 回帰
- 仮説検定
- サンプルサイズ決定
1) 平均値:
統計分析法は平均値を使用していましたが、これはより一般的には平均値として言及されています。 この手法が利用される時点では、データの迅速かつコンパクトな視点を得る能力と同様に、データセットの一般的なパターンを決定することを考慮に入 この技術の顧客は速く、単純化した推定からのその上に利点。
統計的手段は、準備されている情報の主な問題を考えています。 結果は、与えられた情報の平均として暗示される。 実際には、個人は通常、探査、スポーツ、および学者に関する意図を利用しています。
平均を見つける方法
データの平均を見つけるには、最初に数値を一緒に追加し、その後、データセット内にある数値の数で全体を除算します。
例えば、の平均を見つけるために24, 3, 15, 6, 2, あなたは最初にそれらを一緒に追加します。
24 3 15 6 2=50
その時点で、ランダウン(5)の数字の数で除算します。
50/5= 10
平均は10です。
マイナス
平均を利用することが異常である場合、それは独立した統計分析方法として提案されていません。 これは、そうすることで、同様にいくつかのデータセットの中央値とモードで識別されるように見て、推定の背後にある総努力を破壊する可能性がある
2)標準偏差:
標準偏差は、平均の周りの情報の広がりを測定する統計分析方法の戦略です。
上昇した偏差を管理している時点では、これは平均から広く広がっている情報に焦点を当てています。 同様に、低い標準偏差は、ほとんどの情報が平均によるものであり、同様にセットの期待値として知ることができることを示しています。標準偏差を求める方法
標準偏差を計算する式は次のとおりです。
π2=Π(x−π)2/n
この式では:
- nは、母集団内のデータポイントの数を表します。
- σ2は分散を表します。
- μはデータの平均を表します。
- xはデータセットの値を表します。
- Σはデータの合計を表します。
- 標準偏差の記号はσです。
欠点
平均を利用することの欠点に匹敵するノートでは、標準偏差は、測定可能な検査で孤独な戦略として利用されると欺くことができます。
3)回帰:
洞察に関しては、回帰は統計分析手法における独立変数と従属変数との間の接続です。 回帰分析チャートやグラフで使用される線は、時間の特定の尺度全体のパターンを示すにもかかわらず、要因間の接続が固体または虚弱であるかどうか
回帰式
情報が後でどのように一目でわかるかを知覚するために利用される回帰式は次のとおりです。
Y=a b(x)
この式では、
Y=a b(x)
:
- bは斜面、または上昇オーバーランを指します。
- Yは独立変数です。
- xは従属変数です。
- aは、x=0のときのyの値であるy切片を指します。
欠点
データの統計分析の構成要素として回帰を利用することの欠点の1つは、回帰が紛れもないことではなく、散逸プロットの異常が重要であるにもかかわらず、それらが例外である理由についての理由であることを意味することです。
4)仮説検定:統計分析法では、仮説検定、それ以外の場合は”T検定”と呼ばれます。 仮説検定法は、特定の競合または終了がデータセットに対して有効であるかどうかの検定と結びついています。 これは、異なる仮定や仮説に対して情報を対照することを考慮します。 それは同様になされるどんな選択がビジネスのために意味することができるか推定と助けることができる。
仮説検定式
統計的仮説検定の後遺症は、p値として言及されている特定のケースを作るために解読されるべきである。
この仮説検定の式は次のようになります:
- H1:P≤0.5
- H0:P=0.5
欠点
仮説検定は、場合によっては、プラセボ効果と同様に、定期的な間違いによって歪んで曇る可能性があります。
5)サンプルサイズの決定:
統計的方法の情報を調べることに関しては、データセットが本質的に膨大であり、データセットのすべてのコンポーネントの正確な情報を収集することが困難な場合があります。
サンプルサイズを見つける
いずれにしても、サンプルサイズを決定する際に覚えておくべきいくつかの広範なヒントがあります:
- より控えめなサンプルサイズを考慮しながら、直接統計データ。
- あなた自身のような調査からのサンプルサイズを利用しなさい。
- あなたが非排他的なレポートを指示している場合、あなたの潜在的な利益のために使用できるテーブルが存在する可能性があります。
欠点
このテクニック内の別のテストされていない情報変数を調べるとき、特定の疑いに依存する必要があります。 そうすることで、完全にオフベースの疑いをもたらす可能性があります。
結論
あなたが選ぶ統計分析方法のためのどの戦略にもかかわらず、予想されるすべての欠点を例外的にメモしてみてください。 利用するべき良質のレベルか間違ったまたは右の技術がありません。 それはあなたが最終製品として持っていることを望んでいる知識のビットと同じように、あなたが集めた情報の種類に依存します。 データ分析の例は、規範的分析、予測分析、診断分析、推論分析である。 記述分析、テキスト分析など。
データサイエンスドメインでのキャリアを作ることに興味がある場合は、私たちの11ヶ月のデータサイエンスインパーソンPGDMコースは、成功したデータサイエンスプロフェッショナルになるために非常に助けることができます。
また読む
- 2021年のデータ科学者のための重要なクラスタリングアルゴリズム