Contenido
-
- ¿Cuál Es El Valor P?
- ¿Por Qué Necesitamos El Valor P?
- ¿Dónde Usamos El Valor P En La Vida Real?
- Marketing
- Probabilidad
- Cómo Calcular el P-Valor en Excel?
- PALABRAS FINALES
¿Cuál es el Valor de P?
El valor de P es un término estadístico que le ayuda a determinar, si la hipótesis que utiliza es verdadera, la probabilidad de la variación de muestreo. Simplemente nos dice cuáles son las probabilidades de obtener estos resultados si nuestra hipótesis nula es verdadera.
- Una hipótesis nula es una hipótesis que afirma que los resultados que obtenemos son causados por pura suerte.
- Una hipótesis alternativa afirma que los resultados que obtenemos no son suerte, pero hay elementos externos que afectan nuestros resultados.
Es un término estadístico muy importante y de uso común y se puede calcular fácilmente en programas de análisis de datos como Microsoft Excel. En este artículo, aprenderá cómo lo usamos, dónde lo usamos y cómo podemos calcularlo en Excel de varias maneras.
¡Comencemos!
¿Por Qué Necesitamos El Valor P?
Al hacer investigaciones con poblaciones grandes, debe calcular las estadísticas para cada individuo. Pero incluso en tal caso, no puede estar seguro de si algo sucedió por coincidencia o simplemente por suerte, ya que es imposible observarlo todo. Aquí es donde entran las estadísticas.
Los cálculos estadísticos no pueden darte una verdad absoluta, pero te ayudarán a tener una buena idea de tus investigaciones.
El valor P nos permite probar la hipótesis sobre nuestro tema. Podemos comparar los resultados matemáticos con estas hipótesis y reconsiderar nuestro camino sin gastar una gran cantidad de tiempo en investigación.
¿Dónde Usamos El Valor P En La Vida Real?
Usamos el valor de probabilidad donde intentamos probar una hipótesis. Puede ser de investigación o de una simple apuesta que hicimos con nuestro amigo.
Es más fácil entenderlo con ejemplos.
Marketing:
Digamos que está trabajando dentro del área de marketing y su proyecto reciente es sobre publicidad de cereales.
Ha producido un video para redes sociales y tiene la información para que los usuarios lo omitan o lo vean durante mucho tiempo.
Por ejemplo, el tiempo de visualización habitual del vídeo es de 20 segundos. La media es de 20 segundos. Y tomaste la decisión de editar el video con un trozo de música más alegre.
Ahora, ¿cómo reconocerá si funcionó? En este punto, utilizamos estadísticas de importancia.
Primero, produce una hipótesis nula:
Una hipótesis nula afirma que no hay correlación entre lo que inviertes y los resultados que obtienes. No afecta a los resultados.
Durante este ejemplo, la hipótesis nula será la siguiente: «No hay ninguna relación entre los cambios que está aplicando a la hora de reloj.»
Luego, la hipótesis alternativa:
La hipótesis alternativa sugiere que en realidad cambiar la música funcionó y ahora la gente ve el comercial durante más de 20 segundos. Matemáticamente, la hipótesis alternativa dice:
» Ahora la media es superior a 20 segundos.»
Calcular el Nivel de Significancia:
Ahora tenemos que establecer un umbral de límite para calcular si tenemos éxito o no. Esto se llama un nivel de significación, además, se conoce como el valor alfa. Puede ser cualquier porcentaje que desee, depende absolutamente de usted.
Pero durante este ejemplo, será 0,05.
Ahora, para calcular con certeza, siempre debemos tener todos los datos de la hora de reloj. Pero en términos de su tiempo y fuentes, debe tomar una muestra de la población:
- Tomó una muestra de 100 personas.
- Estas 100 personas tienen 25 segundos de tiempo de observación para el comercial.
- Significa que la media de la muestra es 25.
Esta es una versión muy simple del cálculo. Pero la desviación estándar de la muestra generalmente se calcula en esta escala si no conoce la desviación estándar de toda la población.
Puede utilizar los valores que calculó para la muestra, ya que se acercan a los valores de la población. La media de la muestra es cercana a la media de la población.
Calcular el valor P:
El valor p nos muestra si podemos rechazar la hipótesis nula o no. La probabilidad de que la media muestral sea mayor o igual a 25 minutos dada la hipótesis nula es verdadera.
Pueden ocurrir dos situaciones.
- Si el valor p es menor que el alfa, puede rechazar la hipótesis nula. Tienes pruebas estadísticas de que la hipótesis alternativa es cierta.
- Pero si el valor p es mayor o igual al alfa, no se puede rechazar la hipótesis nula. No significa que la hipótesis nula sea ciertamente cierta, pero tampoco puede evitarse.
Probabilidad
Trabajemos en otro ejemplo.
Tu amigo y tú hiciste lanzar una moneda al aire: Si es cruz pierdes 5 dólares y si viene cara ganas 5 dólares.
- Tu amigo lanza la moneda una vez: Viene en forma de cruz. Está bien, hay un 50% de probabilidades de que venga como cruz. Ahora, asumes que la probabilidad es 0,5 porque crees que es una moneda justa. Esta es tu hipótesis nula.
- Segundo: Es cruz. Perdiste otros 5 dólares, pero está bien porque todavía hay una buena posibilidad de dos colas seguidas. El valor de p es 0,25 y sigue siendo una proporción justa.
- Tercero: es tails una vez más. La probabilidad de cruz tres veces seguidas es de 0,12. No es baja, por lo que no hay pruebas suficientes de que la hipótesis nula no sea correcta. Pero empiezas a pensar que tu hipótesis alternativa podría ser correcta.
- Cuarto: Se convierte en cruz de nuevo, verás cómo las posibilidades son muy bajas. Puede ser una coincidencia milagrosa, pero todavía hay una probabilidad de 0,6 y todavía no hay suficiente evidencia para apoyar la hipótesis alternativa que dice que la moneda es difícil. Y esperas la quinta vuelta.
- Quinto: Es cruz. La probabilidad de que una moneda se convierta en cruz cinco veces seguidas es de 0,3, que es muy baja. Este es el punto en el que puede rechazar la hipótesis nula porque ya no hay suficiente evidencia para apoyarla.
Le pides a tu amigo que vea la moneda y cuando la sostienes te das cuenta de que tiene dos colas y es una moneda complicada.
¿Qué nos hizo perder la fe en nuestra hipótesis nula?
En un juego justo de lanzar monedas, la probabilidad de obtener una cara o una cruz es del 50%. Esta es una situación en la que creemos que la moneda es justa, pero a medida que el valor p cae, nuestra confianza en esa hipótesis también se debilitó.
Hay pocas posibilidades de tener colas aleatorias cuando el valor p cae por debajo de 0,05. Por lo tanto, cuando se aplica este término estadístico a cuestiones como las investigaciones sobre el cáncer o los efectos del cambio climático, gana más importancia.
Nota: No hay ninguna razón específica por la que utilicemos el valor p 0,05 para el cálculo predeterminado. El creador de la fórmula decidió que era un buen número para calcular y los cálculos predeterminados se adhieren a él. 0,05 significa el 5% en 100 poblaciones de individuos que cae en la curva normal. Esta es una de las razones por las que se usa comúnmente. Si desea cambiarlo durante el cálculo usted mismo, puede hacerlo.
¿Cómo calcular el valor P en Excel?
Hay más de una forma de calcular el valor p en Microsoft Excel. Puede escribir fórmulas descendentes o puede usar Análisis ToolPak. Este artículo contiene cómo hacerlo en ambos sentidos.
Uso de fórmulas clásicas de Excel:
Comencemos con la fórmula clásica de Excel. Hay dos formas de hacer esta fórmula TDIST y la fórmula T-test.
1.1) Fórmula TDIST
En primer lugar, necesitará un conjunto de datos para calcular un valor p.
- Digamos que usted es un profesor y desea comparar lo que sus estudiantes obtuvieron en su último examen y lo que esperaba que su puntaje se basara en sus exámenes anteriores.
- Tienes los resultados 25, 46, 34, 27, 35, 43, 40, 44, 21 y 39 para tu último examen.
- Ahora para el cálculo, necesita otra cola, esta es la puntuación que esperaba basada en pruebas anteriores: 23, 44, 32, 20, 46, 37, 35, 42, 33, y 35
Ahora, para usar la fórmula del valor de p en Excel, debe calcular algunas cosas de antemano:
Coeficiente de Pearson (r): Es un término estadístico que mide la correlación lineal entre dos datos. No tienes que conocer el aspecto matemático para calcular el valor p. Verá la fórmula simple para ello en los siguientes párrafos.
Población (n): n es el número total de individuos en su conjunto de datos.
T estadística: Es la relación entre la desviación del valor estimado de los datos de su valor supuesto y su error estándar.
Grado de libertad: es el número de individuos en el conjunto de datos, menos dos.
Ahora, el coeficiente de Pearson se escribirá en F4 en este ejemplo. Después de hacer clic en él, escribirá la fórmula:
Las columnas C son para las puntuaciones y las columnas D para las puntuaciones esperadas. El coeficiente de Pearson es 0,691473 en este ejemplo.
A continuación, escribirá el número de personas en el conjunto de datos. Si sabe con certeza cuántas personas tiene, puede escribirlo manualmente, pero si no lo hace, puede usar la fórmula:
¿Por qué la fórmula contiene solo una columna C?
Es porque solo necesitamos los individuos en un conjunto de datos para calcular, por lo tanto, una columna servirá. La celda G5 ahora contendrá el número 10. Esta es nuestra población.
Ahora que tiene el coeficiente de Pearson y la población puede calcular estadísticos de ajuste. La fórmula matemática para la estadística de T es el coeficiente de Pearson (r) por el signo raíz cuadrada de la población (n) menos 2 dividido por la raíz cuadrada de 1 menos el coeficiente de Pearson al cuadrado:
La celda G6 contendrá el resultado 2,70733. Esta es nuestra estadística T.
Después de eso, calcularás el grado de libertad. Escribirá:
En la celda G7. Este es el grado de libertad. Será a las 8.
Ahora tiene todo lo que necesita para calcular el valor P. La celda G8 contendrá la fórmula para ello. Que es:
O
El resultado será 0,026768. Este es el valor p para el conjunto de datos.
1.2. Fórmula de prueba T
La segunda forma de determinar el valor p con fórmulas de Excel es utilizando la fórmula de prueba T. Es un poco similar al ejemplo anterior, pero más corto.
- Digamos que el conjunto de datos es el mismo, tiene los resultados 25, 46, 34, 27, 35,43, 40, 44, 21, 39 para tu último examen.
- Los resultados esperados son 23, 44, 32, 20, 46, 37, 35, 42, 33, 35.
- Va a agregar una tercera columna para la diferencia entre lo que se esperaba y la puntuación real. En la columna de diferencia 2, 2, 2, 7, 11, 6, 5, 2, 12, 4 será por escrito de E4 a E13.
Ahora escriba la prueba T en la celda E8. Vas a escribir la fórmula de la prueba T en la celda en blanco al lado de ella. Es decir:
Y esta fórmula le dará el valor p directamente.
Determine el valor de P con la herramienta de Excel Pak
Took Pak es un paquete que le permite calcular varias mediciones estadísticas automáticamente por lo que es fácil y muy práctico. También es fácil de instalar.
Paso 1: Vaya a configuración. Hay un botón «Complementos» en la parte inferior de la esquina izquierda, haz clic en él. Aparecerá una nueva ventana, busque la opción «Herramienta de análisis Pak», haga clic en ella y, a continuación, haga clic en el botón ir en la parte inferior de la ventana.
Paso 2: Active el complemento haciendo clic en el símbolo de marca junto a él y después del botón ACEPTAR en la columna derecha.
Paso 3: Si logró activarlo correctamente, aparecerá un botón «Análisis de datos» en el menú superior de su hoja de trabajo a la derecha.
Paso 4: Haga clic en el botón » Análisis de datos «y elija la opción» Prueba en t: Muestra emparejada de Dos Medios». Haga clic en Aceptar después de eso. Aparecerá una nueva ventana.
Paso 5: Pedirá las entradas en la primera fila de la ventana. Tipo C4: C13 a la caja de «rango variable 1». Escribirá D4: D13 en el cuadro «rango variable 2». Deje el cuadro alfa con su valor predeterminado.
Paso 6: En la segunda fila de la ventana, puede seleccionar dónde monitorear sus resultados. Puede ser una nueva hoja de trabajo o cualquier celda en blanco. Si desea el resultado en una celda, asegúrese de bloquear la columna y la fila. Haga clic en el botón ACEPTAR después de eso.
Tip: Utilice el signo de dólar antes de la letra y el número para bloquear la columna y la fila. Por ejemplo, si desea bloquear la celda A2, escriba $A 2 2.
Paso 7: El Excel calculará la media, la varianza, las observaciones, la correlación de Pearson, la diferencia de medias hipotética, las estadísticas t, el valor p y más.
PALABRAS FINALES
El valor P es fácil de calcular y adaptar en muchas situaciones diferentes. Le ayuda a obtener la información que necesita sin gastar mucho tiempo o esfuerzo en ella. Es aún más fácil calcular cuando utiliza programas de análisis estadístico como Microsoft Excel que vienen con las herramientas y fórmulas adecuadas. ¡Revisemos la colección de plantillas de Someka y descarguemos plantillas estadísticas para hacer su trabajo más fácil!
Lecturas relacionadas:
- ¿Cómo calcular el intervalo de confianza en Excel?
- ¿Puede Excel Analizar Datos?