EJERCICIOS DE REPASO
• 1.- ARCHIVO PH.SAV
– LA VARIABLE PH, CONTIENE LOS
VALORES DE PH SANGUÍNEO DE 80
INDIVIDUOS
– REALIZA UN ANÁLISIS EXPLORATORIO COMPLETO
QUE INCLUYA BOX-PLOT, STEM&LEAF,
NORMALIDAD E HISTOGRAMA
Antes cerrar estos 2 temas….
EJERCICIOS REPASO
•
•
•
•
•
Salario00 ¿es normal?
Salario00 y 01 ¿difieren?
Consumo90 y 120 ¿difieren?
Consumo90 y los cilindros ¿Difieren?
Factorial/comparacion medias.xls
– Influye el tamaño en la variedad
productos???
CONTRASTE DE HIPÓTESIS
• NO TRATAR LAS VARIABLES COMO ALGO
AISLADO (DESCRIPTIVO) O
CORRELACIONADO, SINO VER SENTIDOS
DE CAUSA-EFECTO
– Ejemplo: ¿influye la zona o región de trabajo en el
salario medio de los comerciales de mi empresa?
– Ejemplo: ¿influye el sector o industria en la
performance de las empresas?
– Ejemplo: ¿varían los gustos y preferencias respecto
de nuestro producto en función de la zona de
residencia, Centro, Levante, Sur?
CONTRASTE DE HIPÓTESIS
• DEBEMOS SEPARAR LA VARIABLE DEPENDIENTE
DE LA INDEPENDIENTE
– V. dependiente = f ( v. independiente)
– V. dependiente: veremos si los valores medios de los grupos son
iguales o distintos
– V. independiente o factor, es la variable que ejerce una
influencia sobre la v. independiente. Es la que establece los
grupos
• EN PRIMER LUGAR, DEBEMOS SEPARAR EL TIPO
DE DATOS A MEDIR EN LA VARIABLE DEPENDIENTE:
– MÉTRICOS
– NO MÉTRICOS
V. Dependiente es MÉTRICA: pruebas t y anova
de un factor (one way)
• OBJETIVO: SABER SI UNA VARIABLE TOMA
VALORES MEDIOS SIGNIFICATIVAMENTE
DISTINTOS EN LOS GRUPOS QUE FORMAN
LA OTRA VARIABLE (FACTOR)
Se trata de una COMPARACIÓN DE MEDIAS
• VARIABLES
– Factor (v. independiente): nominal (no métrica)
– V. dependiente: métrica
Análisis de varianza (ANOVA): pruebas t y
anova de un factor (one way);
• Formulación de la hipótesis nula
• Ho: medias grupo 1 = medias grupo 2 = medias grupo 3 =..
• H1: no lo son
• Estadístico F
• Significatividad (p): ¿Acepto o rechazo la
hipótesis?
– Si la significatividad es menor que 10% rechazo la
hipótesis nula (acepto la alternativa)
– Si la significatividad es mayor que el 10% acepto la
hipótesis nula: NO EXISTEN DIFERENCIAS
Análisis de varianza (ANOVA): pruebas t y
anova de un factor (one way);
• ESTRATÉGIA Y PLAN DE ACCIÓN
– SE REQUIERE QUE LA V. DEPENDIENTE
(MÉTRICA) SIGA UNA DISTRIBUCIÓN NORMAL
(pruebas paramétricas)
– En función del número de grupos que contenga la
muestra existirán diferentes pruebas
– Deberemos concluir siempre los resultados con
respecto a la aceptación o rechazo de la hipótesis
nula
– Para ello, buscaremos el nivel de significativad
PRUEBAS PARAMÉTRICAS que exigirán
datos con distribución NORMAL
Análisis de varianza (ANOVA): pruebas t y
anova de un factor (one way);
• En primer lugar, las comparaciones de medias
podemos realizarlas para diferentes particiones
de la muestra
– Objetivo: ver en la muestra los indicadores por
grupos (factor)
– Objetivo: ver si en la muestra la media (sin grupos)
los valores medios son o no diferentes de los valores
teóricos poblacionales (prueba una muestra t)
– Objetivo: determinar si entre dos grupos de la
muestra existen diferencias (muestras
independientes t)
– Objetivo: determinar si para más de dos grupos en
la muestra existen diferencias, en general y
comparación grupo a grupo (anova un factor)
Análisis de varianza (ANOVA): pruebas t y
anova de un factor (one way);
• EJERCICIOS
– FICHERO: TÉCNICOS
– ESTUDIO DE 64 TECNICOS DE UNA
EMPRESA DE REPARACIÓN DE APARATOS
DE AIRE ACONDICIONADO
• Variables dependientes: salarios 2001, días (días
trabajados semestre, valor teórico 125) y visitas
(total visitas efectuadas, valor teórico 500)
• VARIABLES independientes (factores)
– Estado civil (solteros y casados)
– Zona de trabajo (Norte, Sur, Levante, Centro)
COMPARACIÓN DE MEDIAS, Análisis de
varianza (ANOVA): pruebas t y anova de un factor
(one way);
• PROCESO: ANALIZAR/COMPARACIÓN
MEDIAS
• OBJETIVOS
– ANÁLISIS COMPLETO DE DATOS PARA
POSIBILIDAD DE APLICACIÓN
– 1.descriptivos para dias-zonas y visitas-zonas
– 2. ¿existen diferencias entre la media de la muestra y
los valores teóricos para visitas y días? (prueba una
muestra t)
– 3. ¿hay diferencias entre el estado civil y el salario
del año 2001? muestras independientes t)
COMPARACIÓN DE MEDIAS, Análisis de
varianza (ANOVA): pruebas t y anova de un factor
(one way)
4. ¿existen diferencias entre las zonas de trabajo y
los salarios en el año 2001? anova un factor)
5. ¿existen diferencias entre el número de visitas y
las zonas de trabajo? anova un factor)
¿QUÉ ZONAS SON LAS QUE REALMENTE PRESENTAN
DIFERENCIAS SIGNIFICATIVAS?
COMPARACIÓN DE MEDIAS:
PRUEBAS NO PARAMÉTRICAS
• SE UTILIZAN EN CONTEXTOS EN LOS QUE
LOS DATOS NO SON PARAMÉTRICOS (NO
SIGUEN UNA FUNCIÓN DE DISTRIBUCIÓN
NORMAL)
• LAS
HIPÓTESIS
SON
IGUALES,
LA
SIGNIFICATIVIDAD, ETC.
• VENTAJAS
RESPECTO
A
LOS
PARAMÉTRICOS
– NO
INCORPORAN
LOS
RESTRICTIVOS DE LOS ANOVA
SUPUESTOS
EJERCICIO
• REPITE LOS EJERCICIOS ANTERIORES
CON PRUEBAS NO PARAMÉTRICAS
• PROCESO: ANALIZAR/ PRUEBAS NO
PARAMÉTRICAS..
• 2 INDEPENDIENTES (MANN&WHITNEY)
• K INDEPENDIENTES (KRUSKAL-WALLIS)
CONTRASTES DE HIPÓTESIS
• En este caso, el objetivo consiste en evaluar las
diferencias en las variables entre los distintos
grupos
– V.dependiente (nominal, no métrica)
– V. independiente (nominal, no métrica)
• SI LA VARIABLE DEPENDIENTE ES NO
MÉTRICA (NOMINAL U ORDINAL) ENTONCES
UTILIZAREMOS:
– TABLAS DE CONTINGENCIA
– PRUEBA DE CHI-CUADRADO
Tablas de contingencia
• Expresan las relaciones cruzadas entre
diversas variables categóricas.
• Sirven para analizar mejor las relaciones
entre variables categóricas
• La idea de independencia o relación
– V.independiente: nominal
– V. dependiente: nominal
Se realiza a través del estadístico ChiCuadrado (no paramétrico)
Ejercicios tabla de contingencia
• Fichero: directivos.sav
• Variables: b2 (compra internet); b3 (es la red
segura?)
• Fichero: trabajo.sav
– Variable: C8 (práctica religiosa) y C1 (sexo)
• 1. no practicante
• 2. bajo
• 3. medio
• 4. alto
• 5. muy practicante
Obten la tabla de contingencia y averigua si son o no
independientes
Tablas de contingencia: dicotomías
múltiples
• Definiremos tantas variables como respuestas
diferentes tengamos a la pregunta planteada,
etiquetando cada variable con 0 o 1 para cada
caso
• Estas variables (NOMINALES) se pueden tratar
de forma individual, en tablas de contingencia
• Pero tenemos la opción de la dicotomías
múltiples, que nos permitirán tratar estas
variables como si fueran, efectivamente,
respuestas de una ÚNICA PREGUNTA
• Para ello podemos utilizar tablas de frecuencia
múltiple y tablas de contingencia múltiple
Tablas de contingencia: dicotomías
múltiples
• Las dicotomías múltiples (como conjunto o
set de variables) sólo se pueden utilizar
para
– Tablas de frecuencia múltiple
– Tablas de contingencia múltiple
Para el resto de casos actuarán como variables
individuales
Tablas de contingencia: dicotomías
múltiples; EJERCICIO
• Fichero: directivos; variable C1 (c1.1 a c1.11)
• C1. Podría indicar qué incentivos salariales tiene en su empresa
(elija los que crea convenientes)
–
–
–
–
–
–
–
–
–
Por resultado empresa
por resultado negocio
Por objetivos individuales
Por objetivos equipo
Por evaluación cumplimiento
Colectivos
Comisiones
Participación en beneficios
Otros
(ENTREGAR EJERCICIO DE CATEGORÍAS MÚLTIPLES): EN QUÉ
TRES SECTORES INVERTIRÍA VD.?
Tablas de contingencia: dicotomías
múltiples; EJERCICIO
• FICHERO: productos azulejo. xls.
• Dicotomías múltiples
• Tipología de productos en empresas del
sector cerámico
V a ria b le
P01
P02
P03
D efin ició n
A zu lejo p asta b lan ca p eq u eño
A zu lejo p asta b lan ca m ed ian o
A zu lejo p asta b lan ca gran d e
P04
P05
P06
A zu lejo p asta ro ja p eq u eño
A zu lejo p asta ro ja m ed ian o
A zu lejo p asta ro ja g ran d e
P07
P08
P09
P av im en to p asta b lan ca p eq u eñ o
P av im en to p asta b lan c a m ed ian o
P av im en to p asta b lan ca g rande
P10
P11
P12
P av im en to p asta ro ja p eq u eñ o
P av im en to p asta ro ja m ed ian o
P av im en to p asta ro ja g ran d e
P13
P14
P15
G res p o rcelán ico p eq u eñ o
G res p o rcelán ico m ed ian o
G res p o rcelán ico g rand e
P16
P17
P18
G res rú stico p eq u eño
G res rú stico m ed ian o
G res rú stico g ran d e
P19
P20
P21
T erraco ta
M o saico d e v id rio
P iezas esp eciale s
A zu lejo p asta b lan c a p eq u eño
A zu lejo p asta b lan ca m ed ian o
A zu lejo p asta b lan ca gran d e
A zu lejo p asta ro ja p eq u eño
A zu lejo p asta ro ja m ed ian o
A zu lejo p asta ro ja g ran d e
A zu lejo d e p asta b aln ca (a b lan ca )
A zu lejo d e p asta ro ja (aro ja)
P av im en to p asta b lan ca p eq u eñ o
P av im en to p asta b lan ca m ed ian o
P av im en to p asta b lan ca g rande
P av im en to d e p asta b lan ca (pblan co )
P av im en to p asta ro ja p eq u eñ o
P av im en to p asta ro ja m ed ian o
P av im en to p asta ro ja g ran d e
P av im en to d e p asta ro ja (pro ja)
G res p o rcelán ico p eq u eñ o
G res p o rcelán ico m ed ian o
G res p o rcelán ico g rand e
G res p o rcelán ico (g res)
G res rú stico p eq u eño
G res rú stico m ed ian o
G res rú stico g ran d e
G res rú stico (ru stico )
P iezas esp eciale s
P ieza s esp ecia les (esp ecia l)
PRINCIPALES TEST CONTRASTE
DE HIPÓTESIS
MUESTRAS Y MUESTREO
CONCEPTOS BÁSICOS
-MUESTRA: conjunto reducido de individuos o elementos
de una población, escogidos para obtener información
sobre los mismos y generalizarla al resto de la población
-POBLACIÓN: todos y cada uno de los individuos o
elementos de los cuales se quiere tener una información
-ERROR SISTEMÁTICO: o de muestreo, es el asociado a
la difernecia entre un estimador concreto de una
muestra y el parámetro calculado en la población
PLANIFICACIÓN DE LA OBTENCIÓN DE LA MUESTRA
Fuente:
Investigación de
Mercados
Miquel et al.
(1997:140) capítulo
7
Tipos de muestreo
• Aleatorio
• Estratificado (afijaciones)
-Afijación simple: consiste en el reparto a partes
iguales de la muestra entre los diversos estratos
conocidos
-Afijación proporcional: consiste en el reparto
proporcional de la muestra entre los distintos
estratos, en base al número de efectivos de cada
uno de los mismos (así se mantiene constante el
coeficiente de elevación)
• Por conglomerados
• otros
CÁLCULO DEL TAMAÑO MUESTRAL
TABLA DE MUESTRAS EN FUNCIÓN DEL ERROR Y
LA POBLACIÓN
Fuente: Miquel
et al.
(1997:151)
CÁLCULO DE LA MUESTRA
Fuente: Miquel et al.
(1997:150)
EJERCICIOS
• N= 25.534, ERROR DEL 5%, Z = 2,
VARIANZA = 3.56 PRETEST
• LO ANTERIOR CON POBLACIÓN
INFINITA
• N = 54.000, ERROR DEL 7%, 95,5%
CONFIANZA, P=Q
• LO ANTERIOR CON POBLACIÓN
INFINITA
EJERCICIOS
• FICHERO: TRABAJO
• SELECCIONAR FORMA ALEATORIA 200
CASOS
• POR CONGLOMERADOS: POR SEXOS
• PROCEDE: DATOS /SELECCIONAR
CASOS
• SOBRE EL SECTOR DEL AZULEJO
– SUPONIENDO VARIABLE ES NOMINAL
COMPARACIÓN DE MEDIAS, Análisis de
varianza (ANOVA): pruebas t y anova de un factor
(one way);
• TRABAJO COMPLETO CON DATOS
SECUNDARIOS: ORGANIZACIÓN EMPRESAS
– OBJETIVO: ¿existen diferencias en el ROA de las
empresas del sector cerámico en función de su
localización?
– OBJETIVO: ¿existen diferencias entre los ROA de las
empresas cerámicas que se aglomeran en Castellón
en función de su tamaño: (1) pequeñas <50; (2)
medias (50-200); (3) grandes >200 empleados?
COMPARACIÓN DE MEDIAS, Análisis de
varianza (ANOVA): pruebas t y anova de un factor
(one way);
• EJERCICIO COMPLETO CON DATOS
SECUNDARIOS: CONTABILIDAD
– OBJETIVO:
¿EXISTEN
DIFERENCIAS
ENTRE
LAS
EMPRESAS
QUE
REVALORIZARON Y NO EN 1996, CON
RESPECTO AL RATIO DE INTENSIDAD DE
ACTIVOS FIJOS?
BASE DE DATOS SABI
Descargar

MUESTRAS Y MUESTREO