Introduction
Tout se résume à utiliser le privilège des méthodes d’analyse statistique, qui est la façon dont nous interagissons et collectons des tests de données pour révéler des tendances et des modèles.
L’activité normale a fondamentalement changé au cours de la dernière décennie. Qu’il s’agisse du matériel utilisé dans les zones de travail ou du logiciel utilisé pour transmettre, des choses pas très rares semblent équivalentes à ce qu’elles étaient auparavant. Les techniques de modélisation statistique sont la régression logistique, la régression linéaire, l’Analyse de la variation, la Corrélation, les opérations matricielles, l’échantillonnage, etc.
Quelque chose de différent qui est unique est la quantité d’informations dont nous disposons facilement. Ce qui était autrefois rare est actuellement une mesure accablante de l’information. Quoi qu’il en soit, il est peut-être accablant au hasard que vous n’ayez pas la meilleure idée de la façon d’enquêter sur les informations de votre entreprise pour découvrir une signification perspicace et vraie.
Les 5 méthodes d’analyse statistique
Pour ces méthodes d’analyse statistique, il y en a 5 au choix:
- Moyenne
- Écart type
- Régression
- Test d’hypothèse
- Détermination de la taille de l’échantillon
1) Moyenne :
La moyenne des méthodes d’analyse statistique utilisées, qui est d’autant plus normalement appelée moyenne. Au moment où cette technique est utilisée, elle prend en compte le modèle général d’un ensemble de données, tout comme la capacité d’obtenir une perspective rapide et compacte des données. Les clients de cette technique bénéficient en outre d’une estimation rapide et simpliste.
Les moyens statistiques réfléchissent à la question principale de l’information en cours de préparation. Le résultat est évoqué comme le moyen de l’information donnée. En réalité, les individus utilisent habituellement l’intention de concernant l’exploration, les sports et les universitaires.
Comment trouver la moyenne
Pour localiser la moyenne de vos données, vous devez d’abord additionner les nombres, puis diviser le tout par le nombre de nombres à l’intérieur de l’ensemble de données.
Par exemple, pour localiser la moyenne de 24, 3, 15, 6, 2, vous les additionneriez initialement ensemble.
24 3 15 6 2=50
À ce stade, divisez par le nombre de nombres dans le résumé (5).
50/5= 10
La moyenne est de 10.
L’inconvénient
Lorsque l’utilisation de la moyenne est extraordinaire, elle n’est pas suggérée comme une méthode d’analyse statistique indépendante. En effet, cela peut détruire les efforts totaux derrière l’estimation, car elle est également identifiée avec la médiane et le mode dans certains ensembles de données.
2) Écart type:
L’écart type est une stratégie pour les méthodes d’analyse statistique qui mesurent la propagation de l’information autour de la moyenne.
Au moment où vous gérez un écart élevé, cela se concentre sur des informations largement réparties par rapport à la moyenne. De même, un écart type faible montre que la plupart des informations sont en moyenne et peuvent également être connues comme la valeur attendue d’un ensemble.
Comment trouver l’écart type
La formule pour calculer l’écart type est:
σ2 = Σ(x−μ) 2 / n
Dans cette formule:
- n représente le nombre de points de données dans la population.
- σ2 représente la variance.
- μ représente la moyenne des données.
- x représente la valeur de l’ensemble de données.
- Σ représente la somme des données.
- Le symbole de l’écart type est σ.
L’inconvénient
Sur une note comparable à l’inconvénient d’utiliser la moyenne, l’écart-type peut être trompeur lorsqu’il est utilisé comme stratégie solitaire dans votre examen mesurable.
3) Régression:
En ce qui concerne les connaissances, la régression est le lien entre une variable indépendante et une variable dépendante dans les méthodes d’analyse statistique. La ligne utilisée dans les tableaux et les graphiques d’analyse de régression indique si les liens entre les facteurs sont solides ou fragiles, même s’ils montrent des tendances tout au long d’une mesure de temps donnée.
Équation de régression
L’équation de régression utilisée pour percevoir la façon dont l’information pourrait être vue plus tard est:
Y = a b(x)
Dans cette équation:
- b fait référence à la pente ou au dépassement de montée.
- Y est la variable indépendante.
- x est la variable dépendante.
- a fait référence à l’ordonnée à l’origine, la valeur de y lorsque x = 0.
L’inconvénient
Un inconvénient de l’utilisation de la régression comme composante de votre analyse statistique des données est que la régression n’est pas indubitable, ce qui implique que même si les anomalies sur un graphique dissipé sont significatives, les raisons expliquant pourquoi elles sont des exceptions le sont également.
4) Test d’hypothèse:
Test d’hypothèse, autrement appelé « Test T », dans les méthodes d’analyse statistique. La méthode de test d’hypothèse est liée au test si une contention ou une fin spécifique est valide pour l’ensemble de données. Il envisage de comparer les informations avec différentes hypothèses et hypothèses. Il peut également aider à estimer ce que les choix faits pourraient signifier pour l’entreprise.
Formule de test d’hypothèse
Les séquelles d’un test d’hypothèse statistique doivent être déchiffrées pour faire un cas particulier, auquel on fait allusion comme la valeur p.
La formule de ce test d’hypothèse est:
- H1: P ≠ 0,5
- H0: P = 0.5
L’inconvénient
Les tests d’hypothèse peuvent, dans certains cas, être biaisés et assombris par des erreurs régulières, similaires à un effet placebo.
5) Détermination de la taille de l’échantillon:
En ce qui concerne l’examen des informations pour les méthodes statistiques, dans certains cas, l’ensemble de données est essentiellement excessivement énorme, ce qui rend difficile la collecte d’informations exactes pour chaque composante de l’ensemble de données.
Trouver une taille d’échantillon
Dans tous les cas, il y a quelques conseils généraux à retenir lors de la décision d’une taille d’échantillon:
- Tout en considérant une taille d’échantillon plus modeste, des données statistiques directes.
- Utilisez une taille d’échantillon d’une enquête comme la vôtre.
- Dans le cas où vous dirigez un rapport non exclusif, il peut y avoir une table qui, à partir de maintenant, existe que vous pouvez utiliser pour votre bénéfice potentiel.
- Utilisez un mini-ordinateur de taille d’échantillon.
L’inconvénient
Lorsque vous examinez une autre variable d’information non testée dans cette technique, vous devrez dépendre de soupçons spécifiques. Cela pourrait entraîner une suspicion totalement hors de la base.
Conclusion
Quelle que soit la stratégie pour les méthodes d’analyse statistique que vous choisissez, essayez de prendre une note exceptionnelle de chaque inconvénient attendu, tout comme leur formule différente. Il n’y a pas de niveau de qualité le plus élevé ou de technique incorrecte ou correcte à utiliser. Il s’appuiera sur le type d’informations que vous avez recueillies, tout comme les connaissances que vous espérez avoir en tant que produit final. Des exemples d’analyse de données sont l’Analyse Prescriptive, l’Analyse Prédictive, l’Analyse Diagnostique, l’Analyse Inférentielle. Analyse descriptive, Analyse de texte, etc.
Si vous êtes intéressé à faire carrière dans le domaine de la Science des données, notre cours PGDM en science des données de 11 mois en personne peut vous aider énormément à devenir un professionnel de la science des données à succès.
LISEZ ÉGALEMENT
- Algorithmes De Clustering Importants Pour Les Scientifiques Des Données En 2021