Introdução
Tudo se resume a utilizar o privilégio de métodos de análise estatística, que é a forma de interagir e reunir provas de dados para revelar as tendências e padrões.
o negócio normal mudou fundamentalmente no decorrer da década mais recente. Independentemente de ser o hardware utilizado nas áreas de trabalho ou o software usado para transmitir, coisas não muito raras parecem equivalentes ao que costumavam ser. As técnicas de modelagem estatística são regressão logística, regressão Linear, Análise de variação, correlação, operações matriciais, amostragem e assim por diante.
algo diferente que é único é a quantidade de informações que temos prontamente disponíveis. O que antes era escasso é atualmente uma medida avassaladora de informação. Seja como for, é possivelmente avassalador na chance de você não ter a ideia mais nebulosa de como investigar as informações da sua empresa para descobrir um significado perspicaz e verdadeiro.
Os 5 métodos para a realização de análise estatística
Para isso métodos de análise estatística, existem 5 para escolher:
- Média
- Desvio Padrão
- Regressão
- Teste de Hipóteses
- Determinação do Tamanho amostral
1) Médio:
Os métodos de análise estatística utilizados dizer, o que é que normalmente faz alusão ao médio. No momento em que esta técnica é utilizada, leva em consideração a decisão do padrão geral de um conjunto de dados, assim como a capacidade de obter uma perspectiva rápida e compacta sobre os dados. Os clientes desta técnica também se beneficiam da estimativa rápida e simplista.
o meio estatístico é pensar na questão principal da informação que está sendo preparada. O resultado é aludido como o meio da informação fornecida. Na realidade, os indivíduos normalmente utilizam a intenção de concernir a exploração, esportes e acadêmicos.
Como encontrar a média
Para localizar a média de seus dados, você deve, inicialmente, adicionar os números, e, depois, dividir o todo, a quantidade de números que estão dentro do conjunto de dados.
por exemplo, para localizar a média de 24, 3, 15, 6, 2, você inicialmente os adicionaria juntos.
24 3 15 6 2=50
nesse ponto, divida pelo número de números no resumo (5).
50/5= 10
a média é 10.
a desvantagem
ao utilizar a média é extraordinária, não é sugerido como um método de análise estatística independente. Isso ocorre porque isso pode destruir os esforços totais por trás da estimativa, visto que ela também é identificada com a mediana e o modo em alguns conjuntos de dados.
2) desvio padrão:
o desvio padrão é uma estratégia para os métodos de análise estatística que medem a disseminação de informações em torno da média.
no ponto em que você está gerenciando um desvio elevado, isso se concentra em informações que se espalham amplamente a partir da média. Da mesma forma, um baixo desvio padrão mostra que a maioria das informações é pela média e também pode ser conhecida como o valor esperado de um conjunto.
Como encontrar o desvio padrão
A fórmula para calcular o desvio padrão é:
σ2 = Σ (x − µ)2/n
nesta fórmula:
- n representa o número de pontos de dados na população.
- σ2 representa a variância.
- μ representa a média dos dados.
- x representa o valor do conjunto de dados.
- Σ representa a soma dos dados.
- o símbolo do desvio padrão É σ.
a desvantagem
em uma nota comparável à desvantagem de utilizar a média, o desvio padrão pode enganar quando utilizado como a estratégia solitária em seu exame mensurável.
3) Regressão:
no que diz respeito aos insights, a regressão é a conexão entre uma variável independente e uma variável dependente nos métodos de análise estatística. A linha utilizada em gráficos e gráficos de análise de regressão significa se as conexões entre os fatores são sólidas ou frágeis, apesar de mostrar padrões ao longo de uma determinada medida de tempo.
equação de Regressão
A equação de regressão é utilizado para perceber como a informação poderia olhar mais adiante, é:
Y = b(x)
nesta equação:
- b refere-se à inclinação, ou um aumento da saturação.
- Y é a variável independente.
- x é a variável dependente.
- a refere-se ao y-intercept, o valor de y quando x = 0.
A desvantagem
Uma desvantagem da utilização da regressão como um componente da análise estatística dos dados é que a regressão não é inconfundível, o que implica que embora as anomalias em um dissipar o enredo são significativos e, portanto, são as razões de por que eles são exceções.
4) Teste de hipótese:
teste de hipótese, também chamado de “teste T”, em métodos de análise estatística. O método de teste de hipótese está vinculado ao teste se uma contenção ou fim específico for válido para o conjunto de dados. Considera contrastar as informações com diferentes suposições e hipóteses. Também pode ajudar a estimar o que as escolhas feitas podem significar para o negócio.
fórmula de teste de hipótese
os efeitos posteriores de um teste de hipótese estatística devem ser decifrados para fazer um caso particular, que é aludido como o valor p.
a fórmula para este teste de hipótese é:
- H1: p 0 0, 5
- H0: P = 0.5
a desvantagem
teste de hipótese pode, em alguns casos, ser distorcida e nublada por erros regulares, semelhante a um efeito placebo.
5) Determinação do Tamanho amostral:
Com relação ao exame de informações para a métodos estatísticos, em alguns casos, o conjunto de dados é essencialmente excessivamente enorme, o que torna difícil reunir informações exatas para cada componente do conjunto de dados.
encontrar um tamanho de amostra
em qualquer caso, existem algumas dicas amplas para lembrar ao decidir um tamanho de amostra:
- considerando um tamanho de amostra mais modesto, dados estatísticos diretos.
- Utilize um tamanho de amostra de uma investigação como a sua.
- caso você esteja dirigindo um relatório não exclusivo, pode haver uma tabela que, a partir de agora, existe que você pode usar para seu benefício potencial.
- Utilize um mini-computador de tamanho de amostra.
a desvantagem
conforme você examina outra variável de informação não testada dentro desta técnica, você precisará depender de suspeitas específicas. Fazer isso pode trazer uma suspeita totalmente fora da base.
conclusão
independentemente de qual estratégia para os métodos de análise estatística que você escolher, Tente tomar nota excepcional de cada desvantagem esperada, assim como sua fórmula diferente. Não há nível de qualidade mais alto ou técnica errada ou certa para utilizar. Ele dependerá do tipo de informação que você reuniu, assim como os bits de conhecimento que você espera ter como produto final. Exemplos de análise de dados são análise prescritiva, análise preditiva, análise diagnóstica, análise inferencial. Análise descritiva, Análise de texto e assim por diante.
se você está interessado em fazer uma carreira no domínio da ciência de Dados, nosso curso de 11 meses em pessoa PGDM em Ciência de dados pode ajudá-lo imensamente a se tornar um profissional de Ciência de dados de sucesso.
leia também
- algoritmos de agrupamento importantes para cientistas de dados em 2021