5 Metody analizy statystycznej-szczegółowy przegląd (2021)

wprowadzenie

wszystko sprowadza się do wykorzystania przywilejów metod analizy statystycznej, czyli sposobu, w jaki współdziałamy i zbieramy testy danych w celu ujawnienia trendów i wzorców.

normalny biznes zmienił się zasadniczo w ciągu ostatniej dekady. Niezależnie od tego, czy jest to sprzęt wykorzystywany w miejscach pracy, czy oprogramowanie używane do nadawania, nie bardzo rzadkie rzeczy wyglądają na równoważne z tym, czym były. Techniki modelowania statystycznego to regresja logistyczna, regresja liniowa, Analiza zmienności, korelacja, operacje matrycowe, próbkowanie i tak dalej.

coś innego, co jest unikalne, to to, jak wiele informacji mamy łatwo dostępnych. To, co kiedyś było skąpe, jest obecnie przytłaczającą miarą informacji. Być może, jest to prawdopodobnie przytłaczające na off szansa, że nie masz mglistego pomysłu, jak zbadać informacje o swojej firmie, aby odkryć wnikliwe i prawdziwe znaczenie.

5 metod przeprowadzania analizy statystycznej

w przypadku tych metod analizy statystycznej do wyboru jest 5:

  1. Średnia
  2. odchylenie standardowe
  3. regresja
  4. Testowanie hipotez
  5. określenie wielkości próby

1) Średnia:

metody analizy statystycznej wykorzystały średnią, która jest tym bardziej normalnie przywoływana jako średnia. W momencie wykorzystania tej techniki bierze się pod uwagę decydowanie o ogólnym wzorze zbioru danych, podobnie jak zdolność do szybkiego i zwartego spojrzenia na dane. Klienci tej techniki dodatkowo korzystają z szybkiego i prostego oszacowania.

Wynik jest aluzją jako średnia podanych informacji. W rzeczywistości jednostki zwykle wykorzystują zamiar dotyczący eksploracji, sportu i naukowców.

jak znaleźć średnią

aby zlokalizować średnią danych, najpierw dodasz liczby do siebie, a następnie podzielisz całość przez liczbę liczb znajdujących się w zbiorze danych.

na przykład, aby zlokalizować średnią 24, 3, 15, 6, 2, początkowo można je dodać do siebie.

24 3 15 6 2=50

w tym momencie podziel przez liczbę liczb w rundown (5).

50/5= 10

średnia wynosi 10.

minusem

gdy wykorzystanie średniej jest Nadzwyczajne, nie jest sugerowana jako niezależna metoda analizy statystycznej. Dzieje się tak, ponieważ może to zniszczyć całkowite wysiłki stojące za oszacowaniem, ponieważ jest to również identyfikowane z medianą i modą w niektórych zestawach danych.

2) odchylenie standardowe:

odchylenie standardowe jest strategią dla metod analizy statystycznej, które mierzą rozprzestrzenianie się informacji wokół średniej.

w momencie, gdy radzisz sobie z podwyższonym odchyleniem, koncentruje się to na informacjach, które są szeroko rozpowszechnione od średniej. Podobnie, niskie odchylenie standardowe pokazuje, że większość informacji jest średnia i może być również znana jako wartość oczekiwana zestawu.

jak znaleźć odchylenie standardowe

wzór do obliczenia odchylenia standardowego wynosi:

σ2 = Σ (x − μ)2/n

w tym wzorze:

  1. n oznacza liczbę punktów danych w populacji.
  2. σ2 reprezentuje wariancję.
  3. μ oznacza średnią z danych.
  4. x reprezentuje wartość zbioru danych.
  5. Σ oznacza sumę danych.
  6. symbolem odchylenia standardowego jest σ.

minusem

na porównywalną uwagę na niekorzyść wykorzystania średniej, odchylenie standardowe może być mylące, gdy jest wykorzystywane jako samotna strategia w mierzalnym badaniu.

3) regresja:

w odniesieniu do spostrzeżeń, regresja jest połączeniem między zmienną niezależną i zmienną zależną w metodach analizy statystycznej. Linia wykorzystywana w wykresach i wykresach analizy regresji oznacza, czy połączenia między czynnikami są stałe lub wątłe, niezależnie od pokazywania wzorców w określonym czasie.

równanie regresji

równanie regresji, które jest wykorzystywane do postrzegania, jak informacje mogą wyglądać później, to:

Y = a b (x)

w tym równaniu:

  1. b odnosi się do nachylenia, lub wzrost przekroczenia.
  2. y jest zmienną niezależną.
  3. X jest zmienną zależną.
  4. a odnosi się do punktu przecięcia osi y, wartości y, gdy x = 0.

minusem

jedną z wad wykorzystania regresji jako składnika statystycznej analizy danych jest to, że regresja nie jest niewątpliwa, co oznacza, że chociaż anomalie na wykresie rozproszonym są znaczące, tak samo są powody, dla których są wyjątkami.

4) Testowanie hipotezy:

Testowanie hipotezy, inaczej zwane „testowaniem T”, w metodach analizy statystycznej. Metoda testowania hipotezy wiąże się z testowaniem, jeśli konkretny argument lub koniec jest ważny dla zestawu danych. Rozważa porównanie informacji z różnymi założeniami i hipotezami. Może również pomóc w oszacowaniu, jakie wybory mogą oznaczać dla firmy.

Testowanie hipotezy wzór

następstwa testu hipotezy statystycznej powinny być rozszyfrowane, aby szczególny przypadek, który jest aluzją do wartości P.

wzór na ten test hipotezy jest:

  1. H1: p ≠ 0,5
  2. H0: P = 0.5

minusem

testowania hipotez może, w niektórych przypadkach, być wypaczone i przyćmione przez regularne błędy, podobne do efektu placebo.

5) określenie wielkości próby:

w odniesieniu do badania informacji dla metod statystycznych, w niektórych przypadkach, zbiór danych jest zasadniczo nadmiernie ogromny, co utrudnia zebranie dokładnych informacji dla każdego składnika zbioru danych.

znalezienie rozmiaru próbki

w każdym razie, istnieje kilka szerokich wskazówek do zapamiętania przy podejmowaniu decyzji o rozmiarze próbki:

  1. rozważając skromniejszą wielkość próby, bezpośrednie dane statystyczne.
  2. wykorzystaj Rozmiar próbki z dochodzenia, takiego jak twoje.
  3. w przypadku, gdy kierujesz niewyłącznym raportem, może istnieć tabela, która na razie istnieje, którą możesz wykorzystać dla swojej potencjalnej korzyści.
  4. wykorzystaj minikomputer o wielkości próbki.

minusy

badając inną i nieprzetestowaną zmienną informacji wewnątrz tej techniki, musisz polegać na konkretnych podejrzeniach. Może to wywołać podejrzenia.

wniosek

niezależnie od tego, jaką strategię dla metod analizy statystycznej wybierzesz, staraj się zwracać szczególną uwagę na każdą oczekiwaną wadę, podobnie jak ich inną formułę. Nie ma najwyższego poziomu jakości ani niewłaściwej lub właściwej techniki do wykorzystania. Będzie polegać na rodzaju informacji, które zebrałeś, tak jak fragmenty wiedzy, które masz nadzieję mieć jako produkt końcowy. Przykładami analizy danych są Analiza predykcyjna, Analiza predykcyjna, Analiza diagnostyczna, Analiza Wnioskowa. Analiza opisowa, analiza tekstu i tak dalej.

jeśli jesteś zainteresowany karierą w dziedzinie nauk o danych, Nasz 11-miesięczny osobisty kurs PGDM w dziedzinie nauk o danych może pomóc ci w osiągnięciu sukcesu w dziedzinie nauk o danych.

czytaj także

  • ważne algorytmy klastrowania danych w 2021 r.

Leave a Reply

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.