Sesión 13: Técnicas Alternativas
A
C
B
F
D
H
Técnicas Alternativas
• Se han desarrollado algunas técnicas
numéricas para manejo de incertidumbre
que no siguen los axiomas de probabilidad.
Entre éstas se encuentran:
• Métodos empíricos o ad-hoc
• Teoría de Dempster-Shafer
• Lógica difusa
• Métodos aproximados
Incertidumbre - T.A., L.E. Sucar
2
Técnicas Alternativas
• Algunas técnicas se pueden ver como casos
especiales o extensiones de probabilidad
• Técnicas que se reducen a casos especiales
de probabilidad
– Método de factores de certeza (MYCIN)
– Método de pseudo-probabilidades subjetivas
(Prospector)
• Técnicas que extienden a probabilidad:
– Teoría de Dempster-Shafer
Incertidumbre - T.A., L.E. Sucar
3
Técnicas empíricas
Las primeras técnicas que surgen, cuando
menos dentro del área de sistemas expertos,
son técnicas empíricas o ad-hoc orientadas a
resolver aplicaciones específicas y sin un
fuerte fundamento teórico.
Las más conocidas son las que corresponden
a dos de los primeros sistemas expertos:
Incertidumbre - T.A., L.E. Sucar
4
• PROSPECTOR (exploración minera)
• MYCIN (diagnóstico de enfermedades
infecciosas en la sangre)
Incertidumbre - T.A., L.E. Sucar
5
Sistemas basados en reglas
En sistemas basados en reglas se tiene
en general una estructura similar a la
siguiente:
Incertidumbre - T.A., L.E. Sucar
6
Si: se observa cierta evidencia E
Entonces: se concluye cierta hipótesis H con
probabilidad (certeza, ...) P
De aquí surgen varias interrogantes:
• ¿Cómo obtener estas medidas?
• ¿Cómo combinar estas medidas?
• ¿Cómo interpretar estas medias?
Incertidumbre - T.A., L.E. Sucar
7
MYCIN
Las técnicas desarrolladas en MYCIN y
Prospector son similares, ambas consideran
sistemas basados en reglas a los que se les
adicionan Factores de Certeza o
Probabilidades Subjetivas, respectivamente.
Veremos brevemente el método de MYCIN.
Incertidumbre - T.A., L.E. Sucar
8
Técnica de Factores de Certeza
• Los autores de MYCIN dicidieron no
aplicar probabilidad porque:
– “... requiere de grandes cantidades de datos o
numerosas aproximaciones y suposiciones”
• Desarrollaron una técnica alternativa basada
en factores de certeza (medidas no
probabilistas) y técnicas para combinarlas
Incertidumbre - T.A., L.E. Sucar
9
Medidas básicas
• MB[h,e] – incremento de la creencia en la
hipótesis h dada la evidencia e
• MD[h,e] – incremento en la no-creencia en
la hipótesis h dada la evidencia e
• Se pueden combinar en una sola medida, el
factor de certeza: CF = MB – MD
0  MB,MD  1  CF : [-1, +1]
Incertidumbre - T.A., L.E. Sucar
10
MYCIN define un Factor de Certeza que se
asocia a cada regla y cada evidencia, y se
definen un conjunto de reglas para combinar
estos factores.
Incertidumbre - T.A., L.E. Sucar
11
Redes de Inferencia
• Un conjunto de reglas se pueden ver como una
“red de inferencia”
• Por ejemplo:
–
–
–
–
R1: si A y B entonces C
R2: si C entonces D
R3: si F entonces D
R4: si D entonces H
A
C
B
D
H
F
Incertidumbre - T.A., L.E. Sucar
12
Redes de Inferencia
• Tipos de combinaciones:
– Conjunción/disjunción
A
C
B
– Serie C
D
H
C
– Paralelo
F
Incertidumbre - T.A., L.E. Sucar
13
Reglas de combinación
1. Propagación (fprop) o reglas en serie:
2. AND (conjunción), OR (disjunción) de evidencias:
Incertidumbre - T.A., L.E. Sucar
14
3. Co-Conclusión (fco) o reglas en paralelo:
Incertidumbre - T.A., L.E. Sucar
15
Ejemplo
R1: IF A and (B or C) Then H cf 0.8
R2: If D and F Then B cf 0.6
R3: If F or G Then H cf 0.4
R4: If A Then D cf 0.75
R5: If I Then G cf 0.3 Se conoce:
CF(A,Ev) = 1,
CF(C,Ev) = 0.5,
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
Incertidumbre - T.A., L.E. Sucar
16
CF(A,Ev) = 1,
Ejemplo CF
CF(C,Ev) = 0.5,
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
0.75
D
0.6
I
G
0.3
C
B
F
A
H-1
0.8
H-2
H
0.4
Incertidumbre - T.A., L.E. Sucar
17
CF(A,Ev) = 1,
Ejemplo CF
CF(C,Ev) = 0.5,
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
0.75
D
0.6
I
G
0.3x0=0
C
B
F
A
H-1
0.8
H-2
H
0.4
Incertidumbre - T.A., L.E. Sucar
18
CF(A,Ev) = 1,
Ejemplo CF
CF(C,Ev) = 0.5,
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
0.75
D
0.6
0 G
C
B
0.7 F
A
H-1
0.8
H-2
H
0.4
Max[0.7,0]x0.4=0.28
Incertidumbre - T.A., L.E. Sucar
19
CF(A,Ev) = 1,
Ejemplo CF
CF(C,Ev) = 0.5,
CF(F,Ev) = 0.7,
0.75x1=0.75
0.75
CF(I,Ev) = -0.4
D
0.7 F
0.6
A
C
B
H-1
0.8
0.28 H-2
Incertidumbre - T.A., L.E. Sucar
H
20
CF(A,Ev) = 1,
CF(C,Ev) = 0.5,
Ejemplo CF
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
0.75 D
A
0.6
C
B
0.7 F
Min[0.75,0.7]x0.6=0.42
0.28 H-2
H-1
0.8
Incertidumbre - T.A., L.E. Sucar
H
21
CF(A,Ev) = 1,
CF(C,Ev) = 0.5,
Ejemplo CF
CF(F,Ev) = 0.7,
CF(I,Ev) = -0.4
min[1,max[0.5,0.42]]x0.8=0.4
A
C
H-1
0.8
0.42 B
0.28 H-2
Incertidumbre - T.A., L.E. Sucar
H
22
CF(A,Ev) = 1,
CF(C,Ev) = 0.5,
Ejemplo CF
CF(F,Ev) = 0.7,
0.4 H-1
CF(I,Ev) = -0.4
0.28 H-2
H
0.4+0.28-(0.4)(0.28)=0.568
Incertidumbre - T.A., L.E. Sucar
23
Aplicación - MYCIN
• Ejemplo de regla de MYCIN:
SI la clase de organismo es gram positivo
& la morfología del organismo es coco
& la forma de crecimiento es cadenas
ENTONCES
la identidad del organismo es
estreptococo (CF=0.7)
Incertidumbre - T.A., L.E. Sucar
24
Ventajas
• Modularidad
• Simplicidad computacional
• Resultados comparables con expertos en
aplicación médica (MYCIN)
• Poco sensitivo a los valores de los CF´s
(variación de +/- 0.2)
Incertidumbre - T.A., L.E. Sucar
25
Desventajas:
Aunque pretendía apartarse de
probabilidad, se ha demostrado [Heckerman
86] que la técnica de MYCIN corresponde a
un subconjunto de probabilidad con una
serie de suposiciones implícitas:
Incertidumbre - T.A., L.E. Sucar
26
• La evidencia es condicionalmente
independiente de la hipótesis y su negación.
• La red de inferencia debe corresponder a un
árbol para que los resultados sean
coherentes.
• Las fórmulas para conjunción y disjunción
(min y max ) sólo son válidas si uno de los
términos es subconjunto del otro.
Incertidumbre - T.A., L.E. Sucar
27
Estas suposiciones no son válidas
en muchas aplicaciones por lo que
el método de MYCIN no se puede
generalizar.
Incertidumbre - T.A., L.E. Sucar
28
Teoría de Dempster-Shafer
Antecedentes
Teoría para representar y combinar “grados de
creencia”.
Esta teoría se desarrollo básicamente como una
alternativa (extensión) a teoría de probabilidad ya que
los autores consideraban que ciertas situaciones no eran
representadas adecuadamente con dicha teoría. En
especial dos aspectos:
• Representación de ''ignorancia"
• Representación de creencia NO asignada
Incertidumbre - T.A., L.E. Sucar
30
Ejemplo
•
Se tiene una moneda y dos situaciones distintas:
1. La moneda es “normal” por lo que tiene la misma
probabilidad de cada lado
2. Se sabe que la moneda esta cargada con una mayor
probabilidad de uno de los lados, pero no se sabe cual
ni cuanto
•
Con probabilidades ambas situaciones se
representan igual – P=0.5, no hay forma de
distinguir ignorancia de igual probabilidad
Incertidumbre - T.A., L.E. Sucar
31
Diferencias con Probabilidad
La teoría de DS difiere en dos aspectos básicos de la
teoría clásica de probabilidad:
• Los grados de creencia se asignan a
subconjuntos en lugar de a elementos
individuales del dominio de referencia.
• El axioma de aditividad no se forza, sino se
substituye por una desigualdad.
Incertidumbre - T.A., L.E. Sucar
32
Diferencias con Probabilidad
Estas diferencias tiene dos importantes
implicaciones:
1.- La creencia en una proposición y su
complemento NO necesariamente suman “1”.
2.- Se diferencia ignorancia de probabilidades
iguales, dando la creencia no asignada al conjunto
de todas las hipótesis.
Incertidumbre - T.A., L.E. Sucar
33
Fundamentos Teóricos
La teoría de DS requiere de un conjunto de
hipótesis exclusivas y exhaustivas:
Θ - marco de dicernimiento
2Θ - conjunto de todos los subconjuntos de Θ
En base a esto se definen dos medidas:
– asignación básica de probabilidad (bpa)
– función de creencia (Bel)
Incertidumbre - T.A., L.E. Sucar
34
Asignación básica de probabilidad (bpa)
• Representa la porción de creencia asignada
exactamente a un elemento A (subconjunto de Θ),
sin incluir la creencia asignada sus subconjuntos.
bpa=m(A): 2Θ ->[0,1]
• Debe satisfacer las siguientes propiedades:
1 >= m(A) >= 0 (1)
m(ø) = 0
(2)
Σm(A)=1
(3)
Incertidumbre - T.A., L.E. Sucar
35
Ejemplo
• Para el ejemplo de la moneda
Θ = {águila, sol}
2Θ = [ {águila,sol}, {águila}, {sol},  ]
• Caso 1: igual probabilidad
m({águila}) = 0.5, m({sol}) = 0.5
• Caso 2: completa ignoranica
m({águila,sol}) = 1
Incertidumbre - T.A., L.E. Sucar
36
Función de creencia (Bel)
• Es la creencia total en el conjunto A, incluyendo la
creencia asignada propiamente a A, así como la de
todos sus subconjuntos:
Bel(A)=Σm(B), B  A
• Se puede demostrar que Bel satisface las siguientes
propiedades:
Bel(ø) = 0
Bel(Θ) = 1
Bel(A1A2) >= Bel(A1) + Bel(A2) - Bel(A1A2)
Incertidumbre - T.A., L.E. Sucar
37
Función de creencia (Bel)
• Para una hipótesis sencilla (un solo elemento) se tiene
que:
Bel(A)=m(A)
• Para el ejemplo de la moneda:
– Caso 1:
• Bel({águila,sol}) = 0.5 + 0.5 = 1
• Bel({águila}) = m({águila}) = 0.5
Incertidumbre - T.A., L.E. Sucar
38
Regla de Dempster
• Para combinar distintas evidencias se calcula su suma
ortogonal, aplicando lo que se conoce como la regla de
Dempster, y obteniendo un nuevo grado de creencia (m)
basado en la evidencia combinada:
m1  m2 A   m1 Ai m2 B j 
AiBj  A
• Esta formula la podemos interpretar de la siguiente forma:
– La evidencia E1 asigna la creencia ml al subconjunto Al
– La evidencia E2 asigna la creencia m2 al subconjunto B1
– Entonces el producto de ambas (ml * m2) nos da la creencia en su
intersección - A
Incertidumbre - T.A., L.E. Sucar
39
Regla de Dempster
• La creencia total en A es simplemente la suma de las
creencia asignadas de esta forma, es decir, la suma de la
creencia de todas la intersecciones entre los conjunto Ai y
Bj que den como resultado A.
• Surge un problema si alguna de las intersecciones de el
conjunto vacío, ya que no se puede asignar creencia a
dicho conjunto (implicaría que la suma de bpa no sea l).
Para resolver este caso hay que normalizar los bpa, es
decir, inflar las creencias de los demás subconjuntos en
forma proporcional a la creencia asignada al conjunto
vacío.
Incertidumbre - T.A., L.E. Sucar
40
Regla de Dempster
• Entonces la regla de Dempster en su forma general
es:
m1  Ai m2 B j 
m1  m2  A  
,A
Ai Bj  A
1 k
donde:
K
 m  A m B 
Ai Bj 
1
i
2
j
• Los nuevos valores de Bel para cada hipótesis son
calculados de la misma forma, sumando los bpa's.
Incertidumbre - T.A., L.E. Sucar
41
Ejemplo
• Si hubiera dos evidencias (expertos lanza
monedas) respecto a la moneda cargada:
– m1(A) = 0.7, m1(Θ) = 0.3
– m2(S) = 0.6, m2 (Θ) = 04
• Entonces:
m2 \
m1 {A} 0.7
{S} 0.6
{} 0.42
{Θ} 0.4
{A} 0.28
Incertidumbre - T.A., L.E. Sucar
{Θ} 0.3
{S} 0.18
{Θ} 0.12
42
Ejemplo
• Normalizando:
– k = 0.42  1-k = 0.58
• Entonces:
– m1  m2({S}) = 0.18 / 0.58 = 0.31
– m1 m2({A}) 0.28 / 0.58 = 0.483
– m1 m2({Θ}) 0.12 / 0.58 = 0.207
Incertidumbre - T.A., L.E. Sucar
43
Posibilidad
• Mientras que Bel nos da la cantidad de creencia en cierta
hipótesis, otra medida denominada la posibilidad
(plausibility – Pl) indica la máxima creencia que pudiera
asignarse a la hipótesis. La posibilidad se define como:
P1(A) = 1-Bel(~A)
• Bel da la creencia mínima y P1 la creencia máxima. Ambas
definen un intervalo de creencia:
[Bel(A), P1(A)]
Incertidumbre - T.A., L.E. Sucar
44
Posibilidad
• El rango dentro del cual estaría la creencia en A de
acuerdo a la evidencia conocida. La diferencia
entre Bel y Pl nos indica la ignorancia, es decir, la
creencia que NO ha sido asignada ni a la hipótesis
ni a su complemento (o demás hipótesis).
Incertidumbre - T.A., L.E. Sucar
45
Ejemplo
• Para el caso anterior:
– Pl({A}) = 1 – 0.310 = 0.690
– Pl({S}) = 1 – 0.483 = 0.517
• Entonces:
– A: [0.483 0.690]
– S: [0.310 0.517]
Incertidumbre - T.A., L.E. Sucar
46
Otro Ejemplo
• Consideremos una aplicación médica en la
que hay cuatro posibles enfermedades
(hipótesis):
–
–
–
–
Hepatitis (h/hep)
Cirrosis (c/cirr)
Cálculos en la vesícula (v/gall)
Pancreatitis (p/pan)
Incertidumbre - T.A., L.E. Sucar
47
Ejemplo Médico
• Marco de dicernimiento (hipótesis) - jerarquía:
Incertidumbre - T.A., L.E. Sucar
48
Ejemplo Médico - subconjuntos
Incertidumbre - T.A., L.E. Sucar
49
Ejemplo Médico
• Evidencia 1:
intrahepática – 0.6
• Evidencia 2:
no hepatitis – 0.7
Incertidumbre - T.A., L.E. Sucar
50
Ejemplo Médico
• A partir de las bpa se puede calcular el
grado de creencia – Bel, por ejemplo:
Bel(intrahepática) = Bel({hep,cerr}) =
m(hep,cerr) + m(hep) + m(cerr) =
0.18 + 0 + 0.42 = 0.60
Incertidumbre - T.A., L.E. Sucar
51
Ejemplo Médico
• Evidencia 3:
hepatitis – 0.8
- pizarrón -
Incertidumbre - T.A., L.E. Sucar
52
Ejemplo Médico
• Cálculo de bpa:
k = 0.336+0.224 = 0.56, 1-k = 0.44
m(hep) = (0.144+0.096)/0.44 = 0.545
m(cirr) = 0.084/0.44 = 0.191
m(hep,cirr) = 0.036/0.44 = 0.082
m(cirr,gall,pan) = 0.056/0.44 = 0.127
m(Θ) = 0.024/0.44 = 0.055
Incertidumbre - T.A., L.E. Sucar
53
Aplicaciones
•
En sistemas basado en reglas, cada una se
considera como una fuente de evidencia, y
asigna un bpa a una o un conjunto de hipótesis.
•
Los grados de creencia (m) de cada regla son
asignados por el experto.
•
Los grados de creencia de cada regla son
combinados aplicando la regla de Dempster.
Luego se calcula Bel y Pl para cada hipótesis,
obteniendo así su intervalo de creencia.
Incertidumbre - T.A., L.E. Sucar
54
Ventajas
• Intervalo de creencia
• Representación de ignorancia
• Representa “la forma en que los expertos usan la
evidencia”
• Modular
Incertidumbre - T.A., L.E. Sucar
55
Desventajas
• Asume fuentes de evidencia independientes
• Interpretación de los valores finales (Bel)
• Bel no se puede interpretar como frecuencias
• Complejidad computacional (hipótesis sencillas,
redes)
Incertidumbre - T.A., L.E. Sucar
56
Referencias
• Lucas & Van Der Gaag, Principles of Expert Systems,
Addison-Wesley, 1991 – Cap. 5
• Buchanan & Shortliffe, Ruled-Based Expert Systems,
Addison-Weslev, 1984 - Cap 10-13.
• D. Heckerman, Probabilistic interpretations for MYCIN´s
certainty factors, UAI, 1986
• Shafer, A Mathematical Theory of Evidence, Princeton Univ.
Press. 1976.
Incertidumbre - T.A., L.E. Sucar
57
Actividades
• Hacer ejercicios de técnicas alternativas
Incertidumbre - T.A., L.E. Sucar
58
Descargar

Razonamiento con Incertidumbre