Introduction
kaikki perustuu siihen, että hyödynnämme tilastollisten analyysimenetelmien etuoikeutta, mikä on tapa, jolla olemme vuorovaikutuksessa ja keräämme aineistotestejä trendien ja mallien paljastamiseksi.
normaali liiketoiminta on muuttunut perusteellisesti viimeisen vuosikymmenen aikana. Riippumatta siitä, onko se laitteisto hyödynnetään työalueilla tai ohjelmisto käytetään antamaan, ei hyvin harvinaisia asioita näyttää vastaavan, mitä ne ennen olivat. Tilastollisia mallinnustekniikoita ovat logistinen regressio, lineaarinen regressio, variaation analysointi, korrelaatio, Matriisioperaatiot, näytteenotto ja niin edelleen.
jotain ainutlaatuista on se, kuinka paljon tietoa meillä on helposti saatavilla. Se, mikä oli kerran niukkaa, on tällä hetkellä ylivoimaista tietoa. On niin kuin se voi, se on mahdollisesti overpowering pois mahdollisuus, että sinulla ei ole sumuinen idea miten tutkia yrityksesi tiedot löytää oivaltava ja todellinen merkitys.
5 tilastollisen analyysin suorittamismenetelmää
näille tilastollisille analyysimenetelmille on valittavana 5:
- keskiarvo
- keskihajonta
- regressio
- Hypoteesitestaus
- otoskoon määrittäminen
1) keskiarvo:
käytettyjen tilastollisten analyysimenetelmien keskiarvo, jota sitäkin tavallisemmin kutsutaan keskiarvoksi. Siinä vaiheessa, kun tätä tekniikkaa käytetään, siinä otetaan huomioon tietojoukon yleiskaavan päättäminen, aivan kuten kyky saada nopea ja kompakti näkökulma dataan. Asiakkaat tämän tekniikan lisäksi hyötyä nopea ja yksinkertainen arvio.
tilastokeinoissa ajatellaan valmisteilla olevan tiedon pääasia. Lopputulokseen viitataan annetun tiedon keskiarvona. Todellisuudessa, yksilöt tavallisesti käyttää aikovat koskevat etsintä, urheilu, ja tutkijat.
miten löytää keskiarvo
löytääksesi tiedon keskiarvon, laskisit ensin luvut yhteen, ja sen jälkeen jakaisit kokonaisuuden numeroilla, jotka ovat aineiston sisällä.
esimerkiksi paikantaa keskiarvo 24, 3, 15, 6, 2, aluksi ne lasketaan yhteen.
24 3 15 6 2=50
tässä vaiheessa, Jaa määrä numeroita rundown (5).
50/5= 10
keskiarvo on 10.
varjopuoli
kun keskiarvon hyödyntäminen on poikkeuksellista, sitä ei ole ehdotettu itsenäisenä tilastollisena analyysimenetelmänä. Tämä johtuu siitä, että tämä voi tuhota estimoinnin takana olevat kokonaispyrkimykset, koska se samastetaan myös mediaaniin ja moodiin joissakin tietokokonaisuuksissa.
2) keskihajonta:
keskihajonta on tilastollisten analyysimenetelmien strategia, jolla mitataan tiedon leviämistä keskiarvon tuntumaan.
siinä vaiheessa, kun hallitset kohonnutta poikkeamaa, tämä keskittyy informaatioon, joka leviää laajasti keskiarvosta. Samoin Alhainen keskihajonta osoittaa, että suurin osa informaatiosta on keskiarvoa ja sitä voidaan samoin kutsua joukon odotusarvoksi.
kuinka löytää keskihajonta
keskihajonnan laskukaava on:
σ2 = Σ (x-μ) 2 / n
tässä kaavassa:
- n tarkoittaa datapisteiden määrää perusjoukossa.
- σ2 edustaa varianssia.
- μ on aineiston keskiarvo.
- x edustaa aineiston arvoa.
- Σ on tietojen summa.
- keskihajonnan symboli on σ.
haittapuolena
keskiarvon hyödyntämisen haittapuolena keskihajonta voi pettää, kun sitä käytetään yksinäisenä strategiana mitattavissa olevassa tutkimuksessa.
3) regressio:
Insightsin osalta regressio on tilastollisissa analyysimenetelmissä riippumattoman muuttujan ja riippuvaisen muuttujan välinen yhteys. Regressioanalyysikaavioissa ja-kaavioissa käytetty linja tarkoittaa sitä, ovatko tekijöiden väliset yhteydet kiinteitä vai heikkoja, vaikka ne näyttäisivät kuvioita koko tietyn ajan.
regressioyhtälö
regressioyhtälö, jota käytetään hahmottamaan, miten informaatio voisi vilkaista myöhemmin, on:
Y = a b (x)
tässä yhtälössä:
- b tarkoittaa rinnettä eli nousun ylitystä.
- Y on itsenäinen muuttuja.
- x on riippuvainen muuttuja.
- A tarkoittaa y-leikkauspistettä, jonka arvo on y, kun x = 0.
haittapuolena
yksi haittapuoli regression hyödyntämisessä aineiston tilastollisen analyysin osana on, että regressio ei ole erehtymätön, mikä viittaa siihen, että vaikka dissipaatin poikkeavuudet ovat merkittäviä, niin ovat myös syyt siihen, miksi ne ovat poikkeuksia.
4) Hypoteesitestaus:
Hypoteesitestaus eli ”T-testaus” tilastollisissa analyysimenetelmissä. Hypoteesitestausmenetelmä liittyy testaukseen, jos tietynlainen väite tai tarkoitus on pätevä aineiston osalta. Se katsoo, että informaatio asetetaan vastakkain erilaisten oletusten ja hypoteesien kanssa. Se voi myös auttaa arvioimaan, mitä valintoja voisi merkitä liiketoimintaa.
Hypoteesitestin formula_9076 >
tilastollisen hypoteesitestin jälkivaikutukset on tulkittava, jotta saadaan erityistapaus, johon viitataan p-arvona.
tämän hypoteesitestin kaava on:
- H1: P ≠ 0, 5
- H0: P = 0.5
haittapuolena
Hypoteesitestaus voi joissain tapauksissa olla säännöllisten virheiden vääristämä ja sumentama samaan tapaan kuin lumelääkevaikutus.
5) otoskoon määrittäminen:
tilastollisia menetelmiä koskevien tietojen tutkimisen osalta aineisto on joissakin tapauksissa olennaisesti liian valtava, minkä vuoksi aineiston jokaisesta osasta on vaikea kerätä tarkkoja tietoja.
otoskoon löytäminen
joka tapauksessa on joitakin laajoja vinkkejä, jotka on muistettava otoskokoa päätettäessä:
- kun otetaan huomioon vaatimattomampi otoskoko, suorat tilastotiedot.
- Hyödynnä omanlaisesi tutkimuksen otoskoko.
- jos olet johtamassa ei-yksinoikeudellista raporttia, saattaa olla olemassa taulukko, jota voit käyttää mahdollisena hyötynäsi.
- käytetään otoskokoista minitietokonetta.
varjopuoli
kun tarkastelet toista testaamatonta informaatiomuuttujaa tämän tekniikan sisällä, sinun on luotettava tiettyihin epäilyihin. Se voisi saada aikaan täysin väärän epäilyn.
johtopäätös
riippumatta siitä, minkä strategian tilastollisille analyysimenetelmille valitset, yritä ottaa poikkeuksellisesti huomioon jokainen odotettu haitta, aivan kuten niiden erilainen kaava. Ei ole korkeinta laatutasoa tai väärää tai oikeaa tekniikkaa hyödynnettäväksi. Se luottaa siihen, millaista tietoa olet kerännyt, aivan kuten tiedon palaset, joita toivot saavasi lopputuotteena. Esimerkkejä data-analyysistä ovat ohjaava analyysi, ennustava analyysi, diagnostinen analyysi, Päättelyanalyysi. Kuvaileva analyysi, tekstianalyysi ja niin edelleen.
jos olet kiinnostunut tekemään uraa Data Science-alalla, 11 kuukauden henkilökohtainen PGDM in Data Science-kurssimme voi auttaa sinua valtavasti menestymään Data Science-ammattilaisena.
luetaan myös
- tärkeitä Ryhmittelyalgoritmeja Datatieteilijöille vuonna 2021