Razonamiento
basado en memoria
Teoría
Tema 13
Minería de datos
Dr. Francisco J. Mata
1
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
2
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
3
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
4
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
5
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
6
Razonamiento basado en memoria

Funcionamiento
 Almacenar
los registros pre-clasificados
 Para un registro nuevo, encontrar los vecinos
más cercanos
 Utilizar los vecinos para decidir qué valor
asignarle al nuevo registro
Minería de datos
Dr. Francisco J. Mata
7
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
8
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
9
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
10
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
11
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
12
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
13
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
14
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
15
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
16
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
17
Razonamiento basado en memoria
Vecino
Distancia
Peso
Códigos
1
0.076
0.924
R/FE, R/CA,
R/CO
2
0.346
0.654
R/FE, R/JA,
R/CA
3
0.369
0.631
R/FE, R/JA,
R/MI
4
0.393
0.607
R/FE, R/JA,
R/CA
Minería de datos
Dr. Francisco J. Mata
18
Razonamiento basado en memoria
Código 1
2
3
4
Score
R/CA
0.924 0.645 0
0.607
2.176
R/CO
0.924 0
0
0.924
R/FE
0.924 0.654 0.631 0.607
2.816
R/JA
0
0.654 0.631 0.607
1.892
R/MI
0
0
0.631
0
0.631 0
Minería de datos
Dr. Francisco J. Mata
19
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
20
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
21
Razonamiento basado en memoria

Requerimientos de variables
 Una
variable “target”
Binaria, nominal o intervalo
 Ordinal debe ser convertida a intervalo

 Variables

“input”
Numéricas, ortogonales y estandarizadas

Utilizar el nodo “Princomp/Dmneural” para obtener una
descomposición mediante valores principales
Minería de datos
Dr. Francisco J. Mata
22
Razonamiento basado en memoria

Creación de un archivo de entrenamiento
 Número
similar de registros para cada clase
de la variable “target”
 Docenas de ejemplos mejor si son cientos o
miles
Minería de datos
Dr. Francisco J. Mata
23
Razonamiento basado en memoria
Pocos
registros
mejora
eficiencia
Muchos
registros
baja eficiencia
Minería de datos
Dr. Francisco J. Mata
24
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
25
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
26
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
27
Razonamiento basado en memoria
Minería de datos
Dr. Francisco J. Mata
28
Razonamiento basado en memoria

Fortalezas
 Resultados
son fácilmente entendibles
No son reglas del tipo if-then
 Sino del tipo se hace esta predicción considerando
los resultados de estos registros los cuales son
muy parecidos al nuevo

Minería de datos
Dr. Francisco J. Mata
29
Razonamiento basado en memoria

Fortalezas
 Funciona
bien con cualquier número de
variables
El rendimiento del razonamiento basado en
memoria depende más del conjunto de datos de
adiestramiento que en el número de variables
 Ventaja sobre rede neuronales y regresión

Minería de datos
Dr. Francisco J. Mata
30
Razonamiento basado en memoria

Debilidades
 Computacionalmente
costoso a la hora del
“scoring”
Encontrar los vecinos más cercanos es
computacionalmente costoso si el conjunto de
adiestramiento es muy grande
 Árboles de decisión y redes neuronales no utilizan
el conjunto de adiestramiento a la hora de hacer el
“scoring”

Minería de datos
Dr. Francisco J. Mata
31
Razonamiento basado en memoria

Debilidades
 Dependencia
de la función de distancia, de la
función de combinación y del número de
vecinos

Resultados dependen de estos parámetros
Minería de datos
Dr. Francisco J. Mata
32
Razonamiento basado en memoria

Cuando utilizarlo

Cuando los patrones en los datos son muchos y muy locales y
reglas y funciones globales no tienen sentido

Ejemplo: ¿Por qué clientes dejan de comprar de un catálogo?




Nuevos almacenes se abren en el vecindario
Están inundados de otros catálogos
Pierden el trabajo, etc.
Cuando no utilizarlo

Cuando hay pocas razones para algo y reglas son globales

Ejemplo: ¿Por qué clientes compran en diciembre?

Para dar regalos
Minería de datos
Dr. Francisco J. Mata
33
Descargar

Document