¿Cómo elegir un árbol de decisión Análisis estadístico?

Un árbol de decisión es como un modelo para elegir las estadísticas apropiadas.
Un árbol de decisión es como un modelo para elegir las estadísticas apropiadas. (Imagen: Monkey Business Images Ltd / Valueline / Getty Images)

Parte del diseño de un proyecto de investigación sólida es la elección de los análisis estadísticos. Una forma de abordar esta tarea es utilizar un árbol de decisión. Si usted se está dirigiendo múltiples preguntas en su proyecto, usted tendrá que utilizar el árbol de decisión para cada uno de ellos.

Cosas que necesitará

  • libro de texto de estadística
  • diseño de la investigación de libros de texto

Preparación

Anote las cinco categorías de preguntas de investigación: “Descripción” -Usted quiere saber los valores típicos de la muestra, tales como la edad media de sus pacientes o el tamaño promedio de una “diferencia” venta- -¿Quieres saber si dos o más grupos difieren en una o más características, como el tipo de coche comprado, o del hogar de ingresos “Asociación” -Usted quiere saber cómo de cerca dos variables están asociadas, tales como la educación y los ingresos, o la percepción del dolor y la depresión-y “Predicción “-Usted quiere saber cómo uno o más factores tiene un impacto sobre alguna característica de interés, tales como la predicción de la audiencia televisiva sobre la base de variables- demográfica y `Otros`.

Video: Clúster Jerarquico ejemplo

Anote los cuatro niveles de medición. Cada calidad o característica medida en un proyecto de investigación que es, cada variable-hace uso de uno de los cuatro niveles de medición, que, en orden ascendente o la fuerza, son nominales, ordinal, de intervalo y de relación. Los datos relacionados con recuentos, tales como el número de cada tipo de película que los espectadores ven en una noche de romance dada frente a la acción / aventura, por ejemplo, utilizan el nivel nominal de medición. Los datos que implican la clasificación, tales como las preferencias ordenados para las vacaciones lugar de usar el nivel ordinal de medición. Los datos que se usan números donde la diferencia entre, por ejemplo 25 y 35 implica la misma diferencia en algo de calidad como entre 55 y 65, tales como la temperatura de uso de nivel de intervalo de medición. Los datos que se usan números de una manera como una escala de intervalo, pero con un cierto parecido a cero la cantidad de horas extras que una persona trabajaba a utilizar el nivel de relación de la medición.

Video: Diagrama de árbol para combinaciones

Video: José Supo - ANOVA para el análisis de la Repetibilidad y Reproducibilidad

Anote las dos grandes categorías de la forma de una colección o la distribución de los datos. Si los datos crean una distribución de campana curva o “Normal”, utilizar la estadística paramétrica. Utilizar la estadística no paramétrica si los datos crean una distribución "no normal", como una forma de doble joroba de camello, o una sola vez como una antena parabólica.

Dibuje un árbol de decisión Análisis Estadístico

Dibujar el primer tenedor en el árbol de decisión con cinco alternativas, respecto al tipo de pregunta de investigación tiene: Descripción, Diferencia, Asociación, Predicción, o de otra. Si una pregunta tipo como “Otros”, que tendrá que hablar con un consultor estadístico, así que ignore "Otros" de aquí en lo que se refiere a la elaboración del árbol de decisión.

Dibuje cuatro alternativas para cada tenedor en la etapa anterior, aparte de "Otros". Estos implican el nivel de los datos de medición, nominal, ordinal, de intervalo y de relación. Al final de este paso usted debe tener 16 horquillas: Descripción / nominal, descripción / ordinal, Descripción / Intervalo Descripción / Razón, Diferencia / nominal, y así sucesivamente.

Dibuje dos horquillas para cada alternativa que implica ordinal, intervalo o datos de relación. Estos implican la forma de la distribución, como se describe en la Preparación Paso 4. Por ejemplo, Descripción / nominal no tiene más horquillas, pero Descripción / ordinal se descompone en Descripción / ordinal / paramétrico y Descripción / ordinal / no paramétricos. Al final de este paso usted debe tener 28 horquillas.

Escribir en las estadísticas que se aplican a cada uno de los "Descripción" Forks Finales

Escribir en las siguientes estadísticas para Descripción / nominal: frecuencia, frecuencia relativa, de modo. Para Descripción / ordinal / paramétrico: frecuencia, frecuencia relativa, modo, gama. Para Descripción / ordinal / no paramétrico: frecuencia, frecuencia relativa, mediana, moda, rango.

Escribir en las siguientes estadísticas para Descripción / Intervalo / paramétrico: frecuencia, frecuencia relativa, media, mediana, moda, rango, desviación estándar o varianza. Para Descripción / Intervalo / no paramétrico: frecuencia, frecuencia relativa, mediana, moda, rango.

Escribir en las siguientes estadísticas para Descripción / Relación / paramétrico: frecuencia, frecuencia relativa, media, mediana, moda, rango, desviación estándar o varianza. Para Descripción / Ratio / no paramétrico: frecuencia, frecuencia relativa, mediana, moda, rango.

Escribir en las estadísticas que se aplican a cada una de las bifurcaciones finales “diferencia”

Escribir en las siguientes estadísticas para Diferencia / nominal: Si la comparación es para dos muestras independientes y dos grupos completamente separados de la gente, decir a calcular el estadístico chi-cuadrado. Si la comparación es para dos vinculados o dependientes muestras, digamos, dos grupos que han sido emparejados entre sí, o dos “grupos” de las puntuaciones de las que una persona aporta dos puntuaciones de elección, como una “antes de ver el grupo de anuncios” y un “ después de ver el grupo de anuncios”Calcule la prueba de McNemar para la importancia de los cambios. Si la comparación es por más de dos muestras independientes, calcular el estadístico chi-cuadrado. Si la comparación es por más de dos muestras dependientes o relacionados, el cálculo de la prueba Q de Cochran.

Escribir en las siguientes estadísticas para Diferencia / ordinal / paramétrico o no paramétrico: Si la comparación es para dos muestras independientes, calcular la prueba de Mann-Whitney, la prueba de dos muestras de Kolmogorov-Smirnov, o las sumas de rangos. Si la comparación es para dos muestras relacionadas o dependientes, el cálculo de la prueba de los signos o las Wilcoxon de pares relacionados firmaron filas o prueba de la t. Si la comparación es más de dos muestras independientes, utilice la Prueba de Kruskal-Wallis o la prueba H. Si la comparación es más de dos muestras dependientes o relacionados, utilizar el Friedman análisis de dos vías de la varianza o la prueba de chi-cuadrado.

Escribir en las siguientes estadísticas para Diferencia / Intervalo / paramétrico: Calcular Si la comparación es para dos muestras independientes, calcule la muestras independientes t-test. Si la comparación es para dos muestras relacionadas o dependientes, calcular muestras dependientes t-test. Si la comparación es más de dos muestras independientes, utilizar el análisis entre sujetos de la varianza, o ANOVA. Si la comparación es más de dos muestras dependientes o relacionadas, utilice el intra-sujetos ANOVA.

Video: Introducción Técnica del Árbol

Escribir en las siguientes estadísticas para Diferencia / Intervalo / no paramétrico, y Diferencia / Relación / no paramétrico: Ver “Diferencia / ordinal / paramétrico o no paramétrico,” anteriormente también, prueba la prueba de azar para los pares emparejados. Para Diferencia / Relación / paramétrico: Ver “Diferencia / Intervalo / paramétrico,” por encima.

Escribir en las estadísticas que se aplican a cada una de las bifurcaciones y Finales "asociación" "predicción"

Escribir en las siguientes estadísticas para Nominal / Asociación: el coeficiente de contingencia, C - ver Siegel - o el coeficiente de correlación phi para - ver Heiman. Para Asociación / ordinal / paramétricos y no paramétricos: coeficiente de correlación de Spearman, r-sub-s, o el coeficiente de correlación de rangos de Kendall, tau.

Escribir en el siguiente estadística de la Asociación / Intervalo / paramétrico: de Pearson de correlación, r. Para la Asociación / Intervalo / no paramétrico: No hay opción disponible.

Escribir en el siguiente estadística de la Asociación / Relación / paramétrico: el momento de correlación de Pearson, r. Para la Asociación / Relación / no paramétrico: No hay opción disponible.

Escribir en el siguiente estadística para la Predicción / nominal: regresión múltiple para nominal dependiente variables- ver Pedhazur, 1997. Para todas las demás ramas de predicción: Llevar a cabo una regresión múltiple, la interpretación de los datos con mucha cautela en el caso de datos no paramétricos. Si está utilizando predictores a nivel nominal, véase Pedhazur de 1997, o Aguinis, 2004.

Solicitud

Anote cada una de sus preguntas de investigación. Un proyecto dado puede tener más de una pregunta. Por ejemplo, “¿Cuánto de cada tamaño de la ropa para cada estilo de ropa se venden nuestras tiendas?” O “¿Hay una diferencia real entre los estilos o cantidades de materiales ordenados en Nueva York frente a Los Ángeles?” - que es en realidad dos preguntas -o “¿Cómo es el tamaño del tumor en relación con la edad y el sexo del paciente, y el tiempo transcurrido desde el diagnóstico inicial?”

Ordenar su primera pregunta de investigación en una de las cinco categorías, descripción y así sucesivamente.

Determinar el nivel de medición que se utilizará para los datos, para su primera pregunta de investigación. Los niveles son nominal, ordinal, intervalo y de razón.

Hacer una estimación de la forma de la distribución de sus datos, para su primera pregunta de investigación, si tiene datos numéricos medidos en el ordinal, de intervalo o de razón. Es decir, estimar si los datos para cada variable son normales o no normales en la distribución.

Siga el árbol de decisiones para determinar qué estadísticas a utilizar para su primera pregunta de investigación.

Repita la aplicación los pasos 2 a 5 para cada una de sus preguntas de investigación.

Consejos advertencias

  • No dude en trabajar con un asesor estadístico en la planificación o el cálculo de las estadísticas.
Artículos Relacionados