


Objetivo del análisis descriptivo
Tipos de variables
Gráficas básicas
 Histograma y estimación de la densidad
 Diagramas de dispersión
 Boxplot


Cálculo de índices básicos
Discusión de ejemplos




Explorar la estructura de los datos
Proponer una interpretación de la variación
observada
Valorar la influencia de variables de confusión
Resumir las principales características de los
datos

Cuantitativas
 Discretas: Número de accidentes, Número de
hijos varones, Número de diagnósticos correctos,
 Continuas: Edad, Peso, Tiempo, Volumen celular

Cualitativas
 Nominales: Género (Hombre/Mujer), Diagnóstico
(Sano/Emfermo), Fenotipo (AA/Aa/aa)
 Ordinales: Gravedad (0,+,++), Obesidad
(Normal/Sobrepeso/Obeso/Obeso Grave)

Utilizaremos la base de datos fat disponible
en el paquete UsingR

¿Qué valores de BMI se han obtenido?
 Estudiar la distribución de los valores en la
muestra (histograma y densidad).

¿Cómo se relaciona la altura con el peso? ¿La
distribución del BMI depende de la edad?
 Diagrama de dispersión. Regresión de cuantiles
60
40
20
0
Frequency
80
100
120
Histogram of fat$BMI
15
20
25
30
35
fat$BMI
40
45
50
0.00
0.02
0.04
0.06
Density
0.08
0.10
0.12
BMI
20
25
30
35
fat$BMI
40
45
50
0.00
0.02
0.04
0.06
Density
0.08
0.10
0.12
Histogram of BMI
20
25
30
35
BMI
40
45
50
0.00
0.02
0.04
0.06
Densidad
0.08
0.10
0.12
Distribución de BMI
20
30
40
BMI
50
0.00
0.02
0.04
0.06
Densidad
0.08
0.10
0.12
Distribución de BMI
20
30
40
BMI
50
0.00
0.02
0.04
0.06
Densidad
0.08
0.10
0.12
Distribución de BMI
20
30
40
BMI
50
35
30
25
20
Sample Quantiles
40
45
50
Normal Q-Q Plot
-3
-2
-1
0
Theoretical Quantiles
1
2
3
30
40
50
60
height
70
64
66
68
70
72
height
74
76
78
150
150
200
200
250
weight
250
weight
300
300
350
350
La regresión de cuantiles
permite estimar cómo varían los
cuantiles de una varaible en
función de otra(s) variable(s).
350
250
200
150
weight
Ejemplo: Si el cuantil 90 de peso
es de 70 kg., entonces un 90% de
individuos de esta población
tienen valores de peso iguales o
inferiores a 70 kg.
300
Cuantil: Valor para el cual un
determinado % de individuos
tienen valores iguales o
inferiores a el.
64
66
68
70
72
height
74
76
78
35
30
25
20
BMI
40
45
50
El análisis descriptivo indica que la
variación del BMI con la edad no es
muy importante. La dispersión por
edades parece mantenerse
constante.
20
30
40
50
age
60
70
80



Los datos AssaigClinic.R estan en formato de tabla. En cada
caso, debéis copiar el fichero en un directorio.
Indicar el directorio en la instrucción read.table
El resultado es un data.frame que contiene la información
del fichero.

Podemos explorar qué variables se han recogido:

Veamos qué tratamientos se han incluido:

Recordad que podemos acceder directamente a las variables
de un data.frame mediante attach
Tabulación de datos
Tabulación de datos
Tabulación de datos
A
B
Control
0.0
0.2
0.4
0.6
0.8
1.0
A
B
Control
0.0
0.2
0.4
0.6
0.8
1.0
A
B
Control
2
4
6
8
10
12
14
16
No
Si
Concentracio
15
10
5
A
B
Control
A
B
Control
Control
15
10
Concentracio
5
A
B
15
10
5
No
Si
No
Si
5
10
Control
No
Control
Si
B
No
B
Si
15
0.3
0.2
0.1
0.0
Density
0.3
0.2
0.1
0.0
A
No
A
Si
0.3
0.2
0.1
0.0
5
10
15
Concentracio
12
11
10
9
8
7
6
Tractament[Millora == "Si"]
Control
B
A
5
#this next command defines a new function which can then be used #for making multiple histograms multi.hist <- function(x) {nvar <- dim(x)[2] #number of variable
Descargar

Introduccion al analisis descriptivo en R (2011)