DESARROLLO HISTORICO
DE LA
ESTADISTICA
Jorge Galbiati Riesco
1
Todo el que toma decisiones debe hacerlo bajo condiciones
de incertidumbre, en mayor o menor grado.
Con el aumento de la competitividad, la administración de las
instituciones requiere tomar decisiones cada vez con una mayor
base de conocimiento para así reducir la incertidumbre.
2
Datos no faltan ...
El aumento en la eficiencia de los sistemas
computacionales en las instituciones ...
… ha producido un aumento en la capacidad de
almacenar datos.
Tanto, que ésta supera ampliamente la capacidad de
procesarlos.
Pero los datos por si solos no sirven …
3
… si la institución no es capaz de extraer información de ellos.
Y con los recursos necesarios, como competencias y
experiencia, se puede convertir esta información en
conocimiento …
… que permite tomar buenas decisiones estratégicas,
tácticas y operativas.
4
Las etapa de producción de datos y de extracción de
información, requiere de métodos, técnicas y herramientas
de análisis.
El desarrollo de estos métodos, técnicas y herramientas se
encuentra en una ciencia que se llama ESTADISTICA.
5
El ciclo de la producción
de conocimiento.
CONOCIMIENTO
RECURSOS
INTELECTUALES
ESTADISTICA
INFORMACION
DATOS
ESTADISTICA
6
El ciclo de la producción
de conocimiento.
CONOCIMIENTO
RECURSOS
INTELECTUALES
ESTADISTICA
INFORMACION
DATOS
ESTADISTICA
Requerimientos de
más información
7
Godofredo Achenwall
Cientista político y estadístico alemán, 1719-1772.
En 1760 acuñó la palabra
estadística, del italiano statista
(estadista), del latín status,
estado o situación.
Pensaba, y con razón, que esta
nueva ciencia serían el aliado
más eficaz del gobernante.
8
Antecedentes Remotos de la Estadística
Egipto 3050 AC
Hay
Datos sobre
población y riqueza.
Según Herodoto, para preparar la
construcción de las pirámides de Egipto.
9
Babilonia 3000 AC
Hay registros de datos
comerciales y agrícolas.
10
Antiguo Israel
La Biblia, en el Libro de los Números: Hay
datos estadísticos de dos recuentos de la
población.
El rey David, alrededor de 1000 AC,
ordenó hacer un censo de Israel,
para conocer el número de
habitantes.
11
China, 2000 AC
Existen registros numéricos del bienestar
material.
12
Grecia, 540 AC
Censos periódicos para fines tributarios,
sociales y militares.
13
Imperio Romano
Eran maestros de la organización
política, y realizaban censos de población cada cinco años.
Recordemos que JESUS nació en Belén porque sus Padres
debieron acudir allí por un censo ordenado por el emperador
Augusto.
14
Francia, 758 y 762
Se hicieron relaciones de tierra de la Iglesia,
ordenadas por Pipino el Breve y por Carlomagno, respectivamente.
Francia, siglo IX
Censos parciales de la
servidumbre de los campos.
15
Inglaterra, 1086
Censo encargado por Guillermo I,
el Conquistador.
Sus resultados aparecen en el
Domesday Book, que es el primer
compendio estadístico de ese
país.
Inglaterra, siglo XVI Hicieron un registro minucioso de
muertes por la temida peste.
16
Los Censos continúan en nuestros días...
… pero tienen sus días contados.
17
En efecto, es posible que en 20 años más sean sustituidos
totalmente por muestras.
Las mediciones por muestreo contienen error muestral,
que se puede cuantificar y controlar.
Los censos no tienen error muestral, pero contienen error
no muestral, muchísimo más grande, que no se puede
cuantificar ni controlar. Aparte de eso, los censos son
excesivamente caros.
18
Hasta ahora la ESTADISTICA estaba constituida sólo por
datos. Faltaba otra componente muy importante para que se
convirtiera en ciencia ...
Datos
Probabilidad
19
La teoría de la probabilidad
Es una disciplina matemática que fundamenta la Estadística
como una lógica y una metodología para la medición y el estudio
de la incertidumbre
en la planeación e interpretación de la observación y la
experimentación.
20
Una aplicación de la
probabilidad empírica a
los seguros de buques se
encuentra en Flandes, en el
siglo XIV.
21
Girolamo Cardano
Físico italiano, 1501-1576.
Galileo Galilei
Físico y astrónomo italiano,
1564-1642.
Habían hecho cálculos de probabilidades numéricas, de diversas
combinaciones de dados.
22
Pero las raíces de la Teoría de la probabilidad se encuentran
en los juegos de azar.
23
Los inicios de la probabilidad, como teoría matemática, pueden
rastrearse en la correspondencia que sostuvo Pascal con Fermat,
en la década de 1650.
Blaise Pascal
Pierre de Fermat
Matemático, físico, filósofo y
Jurista y matemático francés,
teólogo francés, 1623-1662.
1601-1665.
24
Christian Huygens
Geómetra, físico,
astrónomo holándés,
1629-1695.
También los orígenes de la
teoría de la probabilidad
se encuentran en un corto
artículo escrito por él en
1657.
25
Estos trabajos tempranos de Fermat, Pascal y Huygens no
abordan problemas de estadística inferencial, o
confirmatoria, ni van más allá de los juegos de azar, que
eran sus intereses inmediatos.
26
John Graunt vendedor de accesorios de vestir y demógrafo
inglés, 1620-1674.
Es considerado por algunos, como el iniciador de la Estadística,
por sus trabajos en demografía, que incorporan nociones de
regularidad en el comportamiento de ciertas proporciones de
naturaleza aleatoria (1662).
27
Jacob Bernoulli
Matemático suizo
1654-1705
Es considerado el
iniciador de la teoría
de la probabilidad.
Introduce lo que hoy se
conoce como la primera
ley de los grandes
números.
28
Entre los siglos XVIII y XIX, la Estadística se propagó a través
de diversas disciplinas: la astronomía y la geodesia, la
psicología, la biología, hasta las ciencias sociales.
Y también profundizó en el conocimiento del rol de la
probabilidad, siendo desplazada la analogía de los juegos de
azar, por modelos probabilísticos para efectuar medidas
bajo incertidumbre.
De este modo se llega a los inicios de la inferencia estadística,
cuyo dominio de aplicación se extiende gradualmente, desde fines
de este período.
29
Abraham De Moivre
Matemático francés,
1667-1754
Efectuó estudios sobre la ley de
probabilidad binomial, y formuló
una aproximación para muestras
grandes, considerada la primera
formulación de la ley de
probabilidad normal, entre
1718 a 1730.
30
John Arbuthnot
Inglés, 1667-1735.
médico de la reina Ana.
Realizó estudios sobre las
proporciones de los
sexos en los nacimientos.
31
Thomas Bayes
Ministro presbiteriano y
matemático, 1702 – 1761.
En 1764 se publicó su trabajo
“Ensayo sobre la Resolución de un
Problema en la Doctrina del Azar”
póstumamente.
Ignorado por sus contemporáneos,
tuvo poca influencia sobre el desarrollo
temprano de la Estadística.
Sus contenidos sirvieron, casi dos siglos
después, para grabar su nombre en la
moderna inferencia bayesiana.
32
Una forma simple del Teorema de bayes (hay casos más
generales):
Dice que la probabilidad de
A dado B es proporcional
a la probabilidad de A.
El conocimiento de B
permite refinar la
probabilidad de A.
33
Una forma simple del Teorema de bayes (hay casos más
generales):
A medida que obtenemos
más conocimiento, la
probabilidad de A se va
acercando a la certeza de
que se va a cumplir A, o
a la certeza de que no se
va a cumplir.
34
La inferencia bayesiana es antagónica con la de los frecuentistas,
que sólo permiten asignar probabilidades cuando es posible que
éstas son apoyadas por experimentación.
La inferencia bayesiana permite asignar probabilidades a fenómenos
que no son de naturaleza repetibles, pero cuyos resultados no
son conocidos. La probabilidad viene a ser una medida de nuestra
incertidumbre del resultado del fenómeno.
35
En la concepción frecuentista de la probabilidad,
si se repite un experimento n veces,
se registra la fracción de veces que se cumple el evento que nos
interesa, E,
la probabilidad de E es el límite de esa fracción, cuando n tiende a
infinito.
36
Frecuentista esperando que n llegue a infinito.
37
Los Bayesianos permiten que se asigne probabilidad a eventos que
no son repetibles.
38
Arthur Young
Agricultor inglés,
1741-1820.
Desarrolló un
gran número de
experimentos
agrícolas en su
fundo.
Publicó sus resultados en 1771, con ideas sorprendentemente
modernas sobre el Diseño de Experimentos.
39
Pierre Simon Laplace
Matemático francés,
1749-1827.
Contribuyó en muchos
temas estadísticos, como
profundizar la aplicación de
la probabilidad a la
inferencia, la obtención
de una curva de errores,
llegando a la formulación
de la ley de probabilidad
normal, entre 1774 a
1781.
40
Adrian Marie Legendre Matemático y estadístico francés,
1752-1833.
Creó un sistema para describir
el movimiento planetario, que
involucra el método de los
mínimos cuadrados, tan
utilizado en la Estadística de
hoy, como método de
estimación de parámetros,
hacia 1805.
Mínimos Cuadrados fue tema dominante en el siglo XIX.
41
Karl Gauss
Matemático, astrónomo,
físico alemán, 1773-1855.
También contribuyó al método
de los mínimos cuadrados.
Desembocó en la ley de
probabilidad normal
independientemente de
Laplace, como descripción
probabilística del error, pero
encontró su asociación con el
método de mínimos
cuadrados.
42
Adolphe Quetelet
Matemático, meteorólogo,
astrónomo, estadístico, sociólogo
belga, 1781-1840.
Se le ha llamado el padre de la
Estadística moderna, por observar
la extraordinaria regularidad con que
se reproducían ciertos fenómenos
sociales, como crímenes o suicidios.
1835.
Argumenta que esas regularidades sólo pueden ser encontradas
mediante el uso de técnicas estadísticas.
Ajustó distribuciones de probabilidad a datos empíricos.
43
Simeón Denis Poisson
Matemático y físico francés, 1781-1840.
Publicó en 1837 el germen de
dos elementos asociados a su
nombre:
La distribución de Poisson.
La generalización de la ley de
los grandes números de
Bernoulli.
44
Numerosos investigadores, provenientes de las más
diversas disciplinas, hicieron contribuciones a la
Estadística durante la segunda mitad del siglo XIX,
construyendo de a poco una disciplina que se iría perfilando
cada vez más como una ciencia independiente.
45
Gustav Fechner
Psicólogo alemán, 18011887.
con estudios de medicina,
aplicó la experimentación
para describir relaciones
entre estímulos y
sensación.
Derivó la Estadística hacia la
psicología experimental.
Introdujo la medición en la psicología, hacia mediados del
siglo XIX.
46
Henry Buckle
Historiador inglés, 1821-1862.
Escribió una Historia de la
Civilización. Hablaba múltiples
idiomas y fue campeón de
ajedrez.
Precursor de la moderna Ciencia Histórica,
aplicó métodos estadísticos para ayudar de
hacer de la historia una ciencia.
47
Wilhelm Lexis
Economista y estadístico alemán, 1837-1914.
Contribuyó a la estadística social, estudiando datos
presentados como series de tiempo, por primera
vez. 1880
48
Hermann Ebbinghaus
Psicólogo alemán, 1850-1909.
Pensaba que el estudio cuantitativo era el
único medio de expresar las vagas
nociones que manejaba la psicología
entonces.
Aplicó el diseño experimental
al estudio de la memoria.
49
A partir de 1880, Francis Galton, Francis Edgeworth y
Karl Pearson, crean una revolución en la Estadística,
proporcionando una metodología empírica que sustituye a la
experimentación controlada, en disciplinas donde la
experimentación no es posible de aplicar.
Lo hicieron separadamente Galton en la Antropología,
Edgeworth en la Economía y Pearson en la filosofía de la
ciencia.
50
Francis
Galton
Inglaterra, 1822-1911.
Se interesó en la psicología,
biología, tecnología, geografía y
estadística.
Primo de Charles Darwin, aplicó
sus principios de genética.
Investigó el carácter hereditario de la genialidad.
Fué pionero en el tema de la regresión lineal simple, y
por la correlación.
Investigó la distribución normal bivariada.
51
Francis
Estudió las aproximaciones que se
Edgeworth
obtienen cuando los conjuntos de datos
Irlandés, 1845-1926.
Estudió literatura y
crecen.
posteriormente se
Aportó la aproximación de
transformó en economista.
Edgeworth, cuyo uso se ha
intensificado hoy.
Desarrolló una versión del teorema
del límite central, que establece que
bajo ciertas condiciones, un promedio
muestral sigue aproximadamente la
ley probabilística normal, si el tamaño
muestral es grande
52
Estudió las distribuciones
Karl Pearson
probabilísticas asimétricas,
Inglaterra, 1858-1936
Llegando a introducir la
distribución Gama.
Desarrolló el estadístico jicuadrado.
Mostró interés en los más diversos
temas, además de la estadística,
llegando a la convicción de que la
estadística analítica yace en los
fundamentos de todo el
conocimiento. 1892
53
La idea de representatividad, en Estadística, es decir, de
seleccionar aleatoriamente algunas unidades para llevar a cabo un
estudio sobre una población, es antigua.
En esta idea se fundamenta la técnica de muestreo. Sin embargo,
durante mucho tiempo no fue aceptado, por la generalidad de los
estadísticos.
54
En 1895, fue presentada formalmente en una reunión del
Instituto Internacional de Estadística, en Berna, por el director
de la Oficina Central de Estadística de Noruega, A. N. Kaier,
bajo el nombre de método representativo.
Despertó interés pero fue rechazado.
Se presentó nuevamente en una reunión del Instituto
Internacional de Estadística Roma, en 1926, y finalmente
aceptado.
55
Influyeron los trabajos en
estudios sociales y económicos,
de A. L. Bowley, Matemático y
economista nacido en Inglaterra,
1869-1957
A él se debe una aplicación de la
teoría de inferencia a las
encuestas por muestreo,
realizado en 1906.
56
Jerzy Neyman
Matemático y Estadístico
nacido en Polonia, 1894-1981.
Desarrolló el muestreo de
poblaciones finitas, y la
estimación por intervalos de
confianza. 1934.
Estableció que la selección aleatoria es la base de una teoría
científica que permite predecir la validez de las estimaciones
muestrales.
También dejó establecida toda una filosofía sobre la eficiencia de la
estrategia muestral.
57
Egon Pearson
Inglés, 1895-1980.
Hijo de Karl Pearson.
Junto a Neyman presentó una teoría sobre cómo probar hipótesis,
en base a datos, hacia 1936.
Resolvieron dificultades fundamentales para su comprensión,
introduciendo las nociones de hipótesis alternativa, y los dos tipos
de error, el de rechazar una hipótesis que es verdadera, y el de no
rechazar una hipótesis que es falsa.
Surge el Lema de Neyman-Pearson.
58
Ronald Fisher
Biólogo, genetista y estadístico
inglés, 1890-1962.
Ingresó a la estación experimental
agrícola de Rotahmsted en 1919.
Contribuyó a desarrollar técnicas
claves para en la experimentación:
El diseño experimental en
bloques, que permite el control de
efectos de factores no deseados.
La aleatorización, que constituye una protección contra la introducción
de factores impredecibles.
59
El diseño factorial, para el estudio del efecto de varios factores,
simultáneamente.
El análisis de varianza, técnica de análisis que permite separar
las fuentes de variación y así evaluar su influencia.
desarrolló una teoría de estimación eficiente, basada en la
Función de Verosimilitud.
Aparte de la aleatorización, estas técnicas eran conocidas de
antes. Pero el logró una clara comprensión de ellas.
60
Se crea una larga controversia entre Ronald Fisher y
Neyman y Pearson.
Fisher visualizaba la prueba de hipótesis como un
procedimiento mediante el cual el investigador podía formarse
una opinión sobre alguna característica de la población, o
parámetro.
Neyman y Pearson vieron la prueba de hipótesis como un
medio para que el investigador tomara una decisión sobre un
parámetro de la población.
61
William Gosset
Químico inglés, 1876-1937.
Trabajó como químico en la
cervecería Guiness, en particular
en Control Estadístico de
Calidad. Publicaba sus trabajos de
estadística bajo el seudónimo de
Student.
Desarrolló el test T, basado en la distribución de probabilidad T
de Student, introducida por él.
62
George Snedecor
Matemático nacido en Estados Unidos, 1881-1974.
Fué uno de los pioneros de la Estadística en los
Estados Unidos, al constituirse en fundador del
Laboratorio de Estadística de la Iowa State
University, en 1933, dedicado fundamentalmente
a las aplicaciones a la agricultura.
Trabajó en conjunto con Ronald Fisher, contribuyendo a
desarrollar algunas de las ideas de él. En particular, son
importantes sus contribuciones al Análisis de Varianza.
63
William Cochran
Matemático nacido en Escocia,
1909-1980.
Nacido en Escocia en 1909.
Trabajó en la Iowa State University, junto con Snedecor. Hizo
contribuciones al Diseño de Experimentos y a la Teoría
del Muestreo.
Se trasladó a Rothamsted, Inglaterra, donde tuvo contacto con
Ronald Fisher, donde se involucró en aplicaciones médicas de la
estadística.
64
Harold Hotelling
Economista y Estadístico nacido
en Estados Unidos, 1895-1973.
Pionero en la combinación de Estadística Matemática y Economía.
También trabajo con Ronald Fisher y aplicó algunas de sus técnicas.
En particular al periodismo, ciencia política, demografía y
alimentación.
Es conocido en Estadística por sus trabajos en Análisis
Multivariante, en particular por la distribucion de probabilidad TCuadrada de Hotelling, una generalización de la T de Student.
65
Frank Wilcoxon
Químico y Estadístico nacido en Estados Unidos, 1892-1965.
Contribuyó a la Estadística NoParamétrica, en particular es
suyo el test basado en rangos
de Wilcoxon.
66
Charles Spearman
Psicólogo nacido en Inglaterra, 1863-1945.
Se preocupó de definir la inteligencia.
Se le considera el primer psicometrista sistemático.
Fué pionero en el desarrollo del método del Análisis Multivariante
denominado Análisis Factorial.
67
L.L. Thurstone
Nació en Estados Unidos en 1887.
Estrados Unidos,
De formación original ingeniero, trabajó
1887-1955
junto a Thomas A. Edison.
Realizó grandes aportaciones a la
medición de la inteligencia y de las
actitudes sociales.
Defendió la explicación de la inteligencia
como conjunto de siete capacidades o
factores, también identificables mediante
el análisis factorial.
68
Abraham Wald
1902-1950, nacido en Transilvania,
entonces Hungría, actualmente Rumania.
Desarrolló la Teoría de Muestreo
Secuencial y la Teoría Estadística de
Decisiones. Aunque hay conceptos
decisionistas en Bernoulli, en Laplace
y en Gauss.
También en otros campos, como Máxima Verosimilitud
Asintótica, Estadística No-Paramétrica, Análisis
Discriminante, Control de calidad, Modelos Lineales
con Error en las Variables, entre otros.
69
Andrey Kolmogorov
Matemático, físico y probabilista
Ruso, 1903-1987
Planteó los fundamentos de la teoría
axiomática de la probabilidad.
Hizo contribuciones cruciales a la Teoría
Algorítmica de la Aleatoriedad, a la
Mecánica Estadística, a los Procesos
Estocásticos, a la Teoría de la
Información.
Analizó la entropía en los texto literarios, lo que dio origen a una
corriente de estudios sobre lingüística estadística.
70
George Box
Químico,
matemático,
estadístico ingles,
n. 1919.
Yerno de R. Fisher.
Acuñó, en 1953, el término Robustez
para designar procedimientos
estadísticos que dan resultados
aceptables cuando no se cumplen
totalmente los supuestos en que se
basan.
Sin embargo el tema de la Estadística
Robusta toma importancia a partir de
1960, con P. Huber y F.R. Hampel.
71
Calyampudi Radhakrishna Rao
Estadístico Indio nacido en 1920.
Hizo contribuciones en las
áreas de Teoría de
Estimación, Inferencia,
Modelos Lineales,
Análisis Multivariante,
entre otras.
Es conocido especialmente por la Cota de Crámer-Rao
y el Teorema de Rao-Blackwell.
72
C.R. Rao y todas las personas mencionadas anteriormente, y
muchas más, hicieron aportes a lo que ahora podemos llamar,
con toda propiedad, una ciencia: La ciencia estadística.
Sus principios, métodos, técnicas y herramientas, no
estaban disponibles para ser tomados con facilidad. Ellos
desarrollaron siguiendo un riguroso método científico.
Podemos observar que quienes construyeron esta ciencia son
científicos de las más diversas áreas del conocimiento. Esto
hace de ésta la más aplicada de todas las ciencias.
73
A partir de la II Guerra Mundial, comienza la era de los
computadores. Con ello la Estadística se evoluciona hacia áreas
nuevas, caracterizadas por técnicas que requieren enorme cantidad
de cálculos numéricos.
Actualmente, la investigación
en Estadística se apoya
fuertemente en la
Computación. El desarrollo
de ésta y aquella parecen ir
de la mano.
74
Bibliografía
T.W. Anderson: An introduction to Mathematical Statistics. Ed.
John Wiley, 1986.
Francisco Azorín – José Luis Sanchez-Crespo: Métodos y
Aplicaciones del Muestreo. Ed. Alianza Editorial, 1986.
Sergio Hernández: Historia de la Estadística. Revista Ciencia y
Hombre, Editorial Veracruzana, mayo-agosto 2005.
Peter Huber: Robust Statistics. Ed. John Wiley, 1981.
75
Heinz Koler: Statistics for Business and Economics. Ed. Scott,
Foreman and Company, 1988.
K.V. Mardia – J.T. Kent – J.M. Bibby: Multivariate Analysis. Ed.
Academic Press, 1978.
James Newman: Sigma. El Mundo de las Matemáticas. Ed
Grijaldo, 1968.
76
FIN
77
Descargar

Diapositiva 1 - :: Jorge Galbiati