Comment calculer la valeur P dans Excel?

Contenu

    1. Quelle Est La Valeur P?
    2. Pourquoi Avons-Nous Besoin De La Valeur P?
    3. Où Utilisons-Nous La Valeur P Dans La Vie Réelle?
      • Marketing
      • Probabilité
    4. Comment calculer la valeur P dans Excel?
    5. DERNIERS MOTS

Quelle est la valeur P?

La valeur P est un terme statistique qui vous aide à déterminer, si l’hypothèse que vous utilisez est vraie, la probabilité de la variation d’échantillonnage. Il nous indique simplement quelles sont les chances d’obtenir ces résultats si notre hypothèse nulle est vraie.

  • Une hypothèse nulle est une hypothèse qui prétend que les résultats que nous obtenons sont causés par la pure chance.
  • Une autre hypothèse prétend que les résultats que nous obtenons ne sont pas de la chance mais qu’il y a des éléments extérieurs qui affectent nos résultats.

C’est un terme statistique très important et couramment utilisé et peut être facilement calculé dans des programmes d’analyse de données comme Microsoft Excel. Dans cet article, vous apprendrez comment nous l’utilisons, où l’utilisons-nous et comment le calculer dans Excel de différentes manières.

Commençons!

Pourquoi Avons-Nous Besoin De La Valeur P?

Tout en faisant des recherches avec de grandes populations, vous devez calculer les statistiques pour chaque individu. Mais même dans un tel cas, vous ne pouvez pas être sûr que quelque chose se soit passé par hasard ou simplement par hasard car il est impossible de tout observer. C’est là que les statistiques entrent en jeu.

Les calculs statistiques ne peuvent pas vous donner une vérité absolue mais ils vous aideront à avoir une bonne idée de vos recherches.

La valeur P nous permet de tester l’hypothèse sur notre sujet. Nous pouvons comparer les résultats mathématiques à ces hypothèses et reconsidérer notre chemin sans passer beaucoup de temps à la recherche.

Où Utilisons-Nous La Valeur P Dans La Vie Réelle?

Nous utilisons la valeur de probabilité où nous essayons de tester une hypothèse. Il peut s’agir de recherches ou d’un simple pari que nous avons fait avec notre ami.

Il est plus facile de le comprendre avec des exemples.

Marketing:

Disons que vous travaillez dans le domaine du marketing et que votre projet récent porte sur la publicité pour les céréales.

Vous avez produit une vidéo pour les médias sociaux et vous avez les informations pour que les utilisateurs l’aient ignorée ou regardée pendant longtemps.

À titre d’exemple, le temps de visionnage courant de la vidéo est de 20 secondes. La moyenne est de 20 secondes. Et vous avez pris la décision d’éditer la vidéo avec un morceau de musique plus joyeuse.

Maintenant, comment allez-vous reconnaître si cela a fonctionné? À ce stade, nous utilisons des statistiques de signification.

Tout d’abord, produisez une hypothèse nulle:

Une hypothèse nulle prétend qu’il n’y a aucune corrélation entre ce que vous investissez et les résultats que vous obtenez. Cela n’affecte pas les résultats.

Dans cet exemple, l’hypothèse nulle sera la suivante: « Il n’y a aucune relation entre les modifications que vous appliquez à l’heure de veille. »

Ensuite, l’hypothèse alternative:

L’hypothèse alternative suggère que changer réellement la musique a fonctionné et que maintenant les gens regardent la publicité pendant plus de 20 secondes. Mathématiquement, l’hypothèse alternative dit:

 » La moyenne est maintenant supérieure à 20 secondes. »

Calculez le niveau de signification:

Maintenant, nous devons définir un seuil de limite pour calculer si nous réussissons ou non. C’est ce qu’on appelle un niveau de signification appelé en outre la valeur alpha. Cela peut être n’importe quel pourcentage que vous souhaitez, c’est absolument à vous de décider.

Mais dans cet exemple, ce sera 0,05.

Maintenant, pour calculer avec certitude, nous devrions toujours avoir toutes les données de l’heure de veille. Mais en termes de temps et de sources, vous devez prélever un échantillon de la population:

  1. Vous avez prélevé un échantillon de 100 personnes.
  2. Ces 100 personnes disposent de 25 secondes de temps de veille pour la publicité.
  3. Cela signifie que la moyenne de l’échantillon est de 25.

Ceci est une version très simple du calcul. Mais l’écart-type de l’échantillon est généralement calculé dans cette échelle si vous ne connaissez pas l’écart-type de l’ensemble de la population.

Vous pouvez utiliser les valeurs que vous avez calculées pour l’échantillon car elles sont proches des valeurs de population. La moyenne de l’échantillon est proche de la moyenne de la population.

Calculer la valeur P:

La valeur p nous montre si nous pouvons rejeter l’hypothèse nulle ou non. La probabilité que la moyenne de l’échantillon soit supérieure ou égale à 25 minutes compte tenu de l’hypothèse nulle est vraie.

Deux situations peuvent se produire.

  1. Si la valeur p est inférieure à l’alpha, vous pouvez rejeter l’hypothèse nulle. Vous avez la preuve statistique que l’hypothèse alternative est vraie.
  2. Mais si la valeur p est supérieure ou égale à l’alpha, vous ne pouvez pas rejeter l’hypothèse nulle. Cela ne signifie pas que l’hypothèse nulle est certainement vraie, mais elle ne peut pas non plus être évitée.

Probabilité

Travaillons sur un autre exemple.

Votre ami et vous avez fait lancer la pièce en l’air: Si c’est des queues, vous perdez 5 dollars et si c’est des têtes, vous gagnez 5 dollars.

  • Votre ami retourne la pièce une fois : Elle vient comme une queue. C’est bon, il y a 50% de chances que cela vienne en queue de peloton. Maintenant, vous supposez que la probabilité est de 0,5 parce que vous croyez que c’est une pièce équitable. C’est votre hypothèse nulle.
Mais il y a une autre possibilité, la pièce est délicate. Lors du calcul de la valeur p, vous agissez comme si l’hypothèse nulle était vraie.
  • Deuxièmement: Ce sont des queues. Vous avez perdu encore 5 dollars mais c’est correct car il y a encore de bonnes chances de deux queues d’affilée. La valeur p est de 0,25 et c’est toujours un juste rapport.
  • Troisièmement: ce sont encore des queues. La chance de queues trois fois de suite est de 0,12. Il n’est pas bas donc il n’y a pas assez de preuve que l’hypothèse nulle n’est pas correcte. Mais vous commencez à penser que votre hypothèse alternative pourrait être correcte.
  • Quatrième: Il tourne à nouveau comme des queues, vous verrez à quel point les chances deviennent vraiment faibles. Cela peut être une coïncidence miraculeuse, mais il y a encore une chance de 0,6 et il n’y a toujours pas assez de preuves pour soutenir l’hypothèse alternative selon laquelle la pièce est délicate. Et vous attendez le cinquième flip.
  • Cinquième: Ce sont des queues. La chance d’une pièce se révèle comme des queues cinq fois de suite est de 0,3, ce qui est très faible. C’est le point où vous pouvez rejeter l’hypothèse nulle car il n’y a plus assez de preuves pour la soutenir.

lottery-simulator-excel-template

Vous demandez à votre ami de voir la pièce et lorsque vous la tenez, vous vous rendez compte qu’elle a deux queues et que c’est une pièce délicate.

Qu’est-ce qui nous a fait perdre confiance en notre hypothèse nulle?

Dans un jeu équitable de retournement de pièces, la chance d’obtenir une tête ou une queue est de 50%. C’est une situation où nous pensons que la pièce est juste, mais à mesure que la valeur p diminue, notre confiance dans cette hypothèse s’est également affaiblie.

Il y a peu de chances d’avoir des queues aléatoires lorsque la valeur p tombe sous 0,05. Ainsi, lorsque vous appliquez ce terme statistique sur des questions telles que les recherches sur le cancer ou les effets du changement climatique, il gagne en importance.

 Remarque: Il n'y a pas de raison spécifique pour laquelle nous utilisons la valeur 0,05 p pour le calcul par défaut. Le créateur de la formule a décidé que c'était un bon nombre pour le calcul et les calculs par défaut s'y tiennent. 0,05 signifie 5% dans les populations de 100 individus qui tombe dans la courbe normale. C'est l'une des raisons pour lesquelles il est couramment utilisé. Si vous voulez le changer pendant le calcul vous-même, vous pouvez.

Comment calculer la valeur P dans Excel?

Il existe plusieurs façons de calculer la valeur p dans Microsoft Excel. Vous pouvez taper des formules ou utiliser Analysis ToolPak. Cet article contient comment le faire dans les deux sens.

Utilisation de formules Excel classiques:

Commençons par la formule Excel classique. Il existe deux façons de faire cette formule TDIST et la formule T-test.

1.1) Formule TDIST

Tout d’abord, vous aurez besoin d’un ensemble de données pour calculer une valeur p.

  • Disons que vous êtes enseignant et que vous souhaitez comparer ce que vos élèves ont obtenu lors de votre dernier examen et ce que vous attendiez que leur score soit basé sur leurs examens précédents.
  • Vous avez les résultats 25, 46, 34, 27, 35, 43, 40, 44, 21 et 39 pour votre dernier examen.
  • Maintenant, pour le calcul, vous avez besoin d’une autre queue, c’est le score que vous attendiez en fonction des tests précédents: 23, 44, 32, 20, 46, 37, 35, 42, 33, et 35

Maintenant, pour utiliser la formule de la valeur p sur Excel, vous devez calculer quelques choses à l’avance:

Coefficient de Pearson (r): C’est un terme statistique qui mesure la corrélation linéaire entre deux données. Vous n’avez pas besoin de connaître l’aspect mathématique de celui-ci pour calculer la valeur p. Vous verrez la formule simple pour cela dans les paragraphes suivants.

Population (n) : n est le nombre total d’individus dans votre ensemble de données.Statistiques

T: C’est le rapport entre l’écart de la valeur estimée des données de sa valeur supposée et son erreur type.

Degré de liberté : C’est le nombre d’individus dans l’ensemble de données moins deux.

how-to-calculate-pearson-coefficient-in-excel

Maintenant, le coefficient de Pearson sera écrit sur F4 dans cet exemple. Après avoir cliqué dessus, vous tapez la formule:

= PEARSON(C4: C13; D4: D13)

Les colonnes C sont pour les scores et les colonnes D sont pour les scores attendus. Le coefficient de Pearson est de 0,691473 dans cet exemple.

how-to-calculate-pearson-coefficient-in-excel-2

Ensuite, vous tapez le nombre d’individus dans l’ensemble de données. Si vous savez certainement combien d’individus vous avez, vous pouvez le taper manuellement, mais si vous ne le faites pas, vous pouvez utiliser la formule:

= COUNT(C4, C13)

Pourquoi la formule ne contient-elle qu’une colonne C?

C’est parce que nous n’avons besoin que des individus dans un ensemble de données pour calculer, donc une colonne fera l’affaire. La cellule G5 contiendra maintenant le numéro 10. C’est notre population.

how-to-calculate-p-value-count-function

Maintenant que vous avez à la fois le coefficient de Pearson et la population, vous pouvez calculer les statistiques T. La formule mathématique pour les statistiques T est le coefficient de Pearson (r) fois le signe racine carrée de la population (n) moins 2 divisé par la racine carrée de 1 moins le coefficient de Pearson au carré:

=(G4*(SQRT(G5-2))) / SQRT(1-G4^2)

La cellule G6 contiendra le résultat 2,70733. Ceci est notre statistique T.

how-to-calculate-t-statistics-in-excel

Après cela, vous calculerez le degré de liberté. Vous allez taper:

= G5-2

Dans la cellule G7. C’est le degré de liberté. Ce sera à 8 heures.

Maintenant, vous avez tout ce dont vous avez besoin pour calculer la valeur P. La cellule G8 contiendra la formule pour cela. C’est-à-dire:

= TDIST(statistiques t, degré de liberté, queues)

Ou

= TDIST(G6, G7, 2)

Le résultat sera 0,026768. Il s’agit de la valeur p de l’ensemble de données.

how-to-calculate-p-value-in-excel

1.2. Formule de test T

La deuxième façon de déterminer la valeur p avec des formules Excel consiste à utiliser la formule de test T. C’est un peu similaire à l’exemple précédent mais plus court.

  • Disons que l’ensemble de données est le même, vous avez les résultats 25, 46, 34, 27, 35,43, 40, 44, 21, 39 pour votre dernier examen.
  • Les résultats attendus sont 23, 44, 32, 20, 46, 37, 35, 42, 33, 35.
  • Vous allez ajouter une troisième colonne pour la différence entre ce qui était attendu et le score réel. Dans la colonne différence 2, 2, 2, 7, 11, 6, 5, 2, 12, 4 sera écrit de E4 à E13.

Tapez maintenant T-Test sur la cellule E8. Vous allez écrire la formule du test T dans la cellule vide à côté. C’est-à-dire :

= T.Test(C4:C13, E4:E13, 1, 1)

Et cette formule vous donnera directement la valeur p.

Déterminez la valeur P avec l’outil Excel Pak

Taken Pak est un pack qui vous permet de calculer automatiquement diverses mesures statistiques afin qu’il soit facile et très pratique. Il est également facile à installer.

Étape 1: Accédez aux paramètres. Il y a un bouton « Compléments » en bas du coin gauche, cliquez dessus. Une nouvelle fenêtre apparaîtra, recherchez l’option « Outil d’analyse Pak », cliquez dessus, puis cliquez sur le bouton go en bas de la fenêtre.

Étape 2: Activez le complément en cliquant sur le symbole de coche à côté et après le bouton OK dans la colonne de droite.

Étape 3: Si vous avez réussi à l’activer correctement, un bouton « Analyse de données » apparaîtra dans le menu supérieur de votre feuille de calcul à droite.

Étape 4: Cliquez sur le bouton « Analyse de données » et choisissez l’option « t-Test: Appariement de deux échantillons pour les moyens ». Cliquez sur OK après cela. Une nouvelle fenêtre apparaîtra.

Étape 5: Il demandera les entrées dans la première ligne de la fenêtre. Tapez C4: C13 dans la case « plage variable 1 ». Vous allez taper D4:D13 dans la case « plage variable 2 ». Laissez la case alpha avec sa valeur par défaut.

Étape 6: Dans la deuxième ligne de la fenêtre, vous pouvez sélectionner l’endroit où surveiller vos résultats. Il peut s’agir d’une nouvelle feuille de calcul ou de cellules vides. Si vous voulez le résultat sur une cellule, assurez-vous de verrouiller la colonne et la ligne. Cliquez ensuite sur le bouton OK.

 Astuce: Utilisez le signe dollar avant la lettre et le chiffre pour verrouiller la colonne et la ligne. Par exemple, si vous souhaitez verrouiller la cellule A2, vous tapezAA22.

Étape 7: Excel calculera la moyenne, la variance, les observations, la corrélation de Pearson, la différence moyenne hypothétique, les statistiques t, la valeur p, etc.

MOTS FINAUX

La valeur P est facile à calculer et à adapter dans de nombreuses situations différentes. Il vous aide à obtenir les informations dont vous avez besoin sans y consacrer beaucoup de temps ou d’efforts. Il est encore plus facile de calculer lorsque vous utilisez des programmes d’analyse statistique comme Microsoft Excel qui sont livrés avec les bons outils et formules. Vérifions la collection de modèles Someka et téléchargeons des modèles statistiques pour faciliter votre travail!

Lectures connexes:

  • Comment calculer l’intervalle de confiance dans Excel?
  • Excel Peut-Il Analyser Des Données?

Leave a Reply

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.