5 metode de analiză statistică – o prezentare detaliată (2021)

Introducere

totul se reduce la utilizarea privilegiului metodelor de analiză statistică, care este modul în care interacționăm și adunăm teste de date pentru a dezvălui tendințe și modele.

afacerile normale s-au schimbat fundamental în cursul ultimului deceniu. Indiferent dacă este vorba de hardware-ul utilizat în zonele de lucru sau de software-ul folosit pentru a împărtăși, lucrurile nu foarte rare par echivalente cu ceea ce erau. Tehnicile de modelare statistică sunt regresia logistică, regresia liniară, analiza variației, corelația, operațiile matricei, eșantionarea și așa mai departe.

ceva diferit, care este unic este cât de multe informații avem disponibile. Ceea ce a fost cândva insuficient este în prezent o măsură copleșitoare de informații. Fie ca atare, este posibil să fie copleșitor pe șansa de a nu avea cea mai vagă idee cum să investigați informațiile afacerii dvs. pentru a descoperi un sens perspicace și adevărat.

cele 5 metode pentru efectuarea analizei statistice

pentru aceste metode de analiză statistică, există 5 dintre care puteți alege:

  1. medie
  2. deviația Standard
  3. regresie
  4. Testarea ipotezelor
  5. determinarea dimensiunii eșantionului

1) medie:

metodele de analiză statistică utilizate înseamnă, ceea ce este cu atât mai normal menționat ca medie. În momentul în care această tehnică este utilizată, se ia în considerare decizia modelului general al unui set de date, la fel ca și capacitatea de a obține o perspectivă rapidă și compactă asupra datelor. Clienții acestei tehnici beneficiază în plus de o estimare rapidă și simplistă.

mijloacele statistice se gândesc la problema principală a informațiilor care se pregătesc. Rezultatul este menționat ca media informațiilor furnizate. În realitate, indivizii folosesc în mod obișnuit intenția de a în ceea ce privește explorarea, sportul și mediul academic.

cum să găsiți media

pentru a localiza media datelor dvs., ați adăuga inițial numerele împreună și, ulterior, împărțiți întregul la numărul de numere din setul de date.

de exemplu, pentru a localiza media 24, 3, 15, 6, 2, le-ați adăuga inițial împreună.

24 3 15 6 2=50

în acel moment, împărțiți la numărul de numere din rundown (5).

50/5= 10

media este de 10.

dezavantajul

când se utilizează media este extraordinar, nu este sugerat ca o metodă independentă de analiză statistică. Acest lucru se datorează faptului că acest lucru poate distruge eforturile totale din spatele estimării, văzând că este, de asemenea, identificat cu mediana și modul în unele seturi de date.

2) deviația Standard:

abaterea Standard este o strategie pentru metodele de analiză statistică care măsoară răspândirea informațiilor în jurul mediei.

în momentul în care gestionați o abatere ridicată, aceasta se concentrează pe informații care sunt răspândite pe scară largă de la medie. De asemenea, o abatere standard scăzută arată că majoritatea informațiilor sunt medii și pot fi cunoscute și ca valoarea așteptată a unui set.

cum se găsește deviația standard

formula de calcul a deviației standard este:

irakc2 = (x−) 2/n

în această formulă:

  1. n reprezintă numărul de puncte de date din populație.
  2. xlx2 reprezintă varianța.
  3. XQX reprezintă media datelor.
  4. x reprezintă valoarea setului de date.
  5. XV reprezintă suma datelor.
  6. Simbolul pentru deviația standard este de la valoarea INX.

dezavantajul

pe o notă comparabilă cu dezavantajul utilizării medii, abaterea standard poate fi înșelătoare atunci când este utilizată ca strategie solitară în examinarea măsurabilă.

3) regresie:

în ceea ce privește insights, regresia este legătura dintre o variabilă independentă și o variabilă dependentă în metodele de analiză statistică. Linia utilizată în diagramele și graficele analizei de regresie înseamnă dacă conexiunile dintre factori sunt solide sau fragile, în ciuda faptului că prezintă modele pe o anumită măsură de timp.

ecuația de regresie

ecuația de regresie care este utilizată pentru a percepe modul în care informațiile ar putea privi mai târziu este:

Y = A b (x)

în această ecuație:

  1. b se referă la panta, sau creșterea depășire.
  2. Y este variabila independentă.
  3. x este variabila dependentă.
  4. a se referă la interceptarea y, valoarea lui y când x = 0.

dezavantajul

un dezavantaj al utilizării regresiei ca o componentă a analizei statistice a datelor este că regresia nu este inconfundabilă, ceea ce înseamnă că, deși anomaliile de pe un complot disipat sunt semnificative, la fel sunt și motivele pentru care sunt excepții.

4) Testarea ipotezelor:

Testarea ipotezelor, altfel numită „testare T”, în metodele de analiză statistică. Metoda de testare a ipotezelor este legată de testare dacă o anumită dispută sau sfârșit este valabilă pentru setul de date. Acesta consideră contrastarea informațiilor cu diferite ipoteze și ipoteze. De asemenea, poate ajuta la estimarea a ceea ce alegerile făcute ar putea însemna pentru afacere.

formula de testare a ipotezelor

efectele ulterioare ale unui test de ipoteză statistică ar trebui descifrate pentru a face un caz particular, la care se face aluzie ca valoarea P.

formula pentru acest test de ipoteză este:

  1. H1: p 0,5
  2. H0: P = 0.5

dezavantajul

Testarea ipotezelor poate fi, în unele cazuri, distorsionată și întunecată de greșeli regulate, similar cu un efect placebo.

5) determinarea dimensiunii eșantionului:

în ceea ce privește examinarea informațiilor pentru metodele statistice, în unele cazuri, setul de date este în esență excesiv de enorm, ceea ce face dificilă colectarea informațiilor exacte pentru fiecare componentă a setului de date.

găsirea unei dimensiuni a eșantionului

în orice caz, există câteva sfaturi generale de reținut în timp ce decideți o dimensiune a eșantionului:

  1. luând în considerare o dimensiune mai modestă a eșantionului, date statistice directe.
  2. utilizați o dimensiune a eșantionului dintr-o investigație ca a dvs.
  3. în cazul în care direcționați un raport neexclusiv, ar putea exista un tabel care, de acum, există pe care îl puteți utiliza pentru beneficiul dvs. potențial.
  4. utilizați un mini-computer cu dimensiunea eșantionului.

dezavantajul

pe măsură ce examinați o altă variabilă netestată de informații din această tehnică, va trebui să depindeți de suspiciuni specifice. Acest lucru ar putea aduce o suspiciune total off bază.

concluzie

indiferent de strategia pentru metodele de analiză statistică pe care o alegeți, încercați să luați notă excepțională de fiecare dezavantaj așteptat, la fel ca formula lor diferită. Nu există cel mai înalt nivel de calitate sau o tehnică greșită sau corectă de utilizat. Se va baza pe tipul de informații pe care le-ați adunat, la fel ca și biții de cunoștințe pe care sperați să le aveți ca produs final. Exemple de analiză a datelor sunt analiza prescriptivă, analiza predictivă, analiza diagnosticului, analiza inferențială. Analiza descriptivă, analiza textului și așa mai departe.

dacă sunteți interesat să faceți o carieră în domeniul științei datelor, cursul nostru de 11 luni în persoană PGDM în domeniul științei datelor vă poate ajuta foarte mult să deveniți un profesionist de succes în domeniul științei datelor.

citește și

  • algoritmi importanți de grupare pentru oamenii de știință de date în 2021

Leave a Reply

Lasă un răspuns

Adresa ta de email nu va fi publicată.