Table Of Content1
Aprobaci´on de Borrador de Tesis
Obtenci´on de Conjuntos Aproximados
Mediante
Algoritmos Gen´eticos
________________________
Javier Trejos Zelaya, Ph.D.
Profesor Asesor (Visto Bueno)
________________________
Carlos Gonz´alez, Ph.D.
Director Maestr´ıa (Visto Bueno)
2
A Veracruz, por su comprensi´on,
a Viviana y Sebasti´an, mis fuentes de inspiraci´on.
3
Todo lo que ocurre una vez
puede que no ocurra nunca ms.
Pero todo lo que ocurre dos veces
ocurrir ciertamente una tercera.
P. Coelho
4
Chapter 1
Conjuntos aproximados
Teniendo un conjunto de objetos sobre los que se ha medido una serie de caracter´ısticas o
atributos cualitativos, se llaman conjuntos aproximados a combinaciones de esos atributos
que describan lo mejor posible al conjunto de objetos. En muchas ocasiones se tiene adem´as
una partici´on o clasificaci´on previa de los objetos y lo que se pretende es dar una caracter-
izaci´on de las clases de esa partici´on mediante los atributos observados ([23], [33]). Este es
un objetivo muy similar al de la discriminaci´on en estad´ıstica ([7]).
1.1 Introducci´on
En t´erminos generales, la teor´ıa de conjuntos aproximados, propuesta por Pawlak ([22]),
consiste en explorar las particiones asociadas a las relaciones de equivalencia generadas por
cada subconjunto de los atributos observados, calculando un ´ındice que indique la medida
en que ´estas coincidan con la clasificaci´on conocida de los datos. Tal exploraci´on tiene una
complejidad computacional m´as elevada que la de los m´etodos cl´asicos de discriminaci´on,
pues el espacio de bu´squeda de soluciones tiene una cardinalidad muy alta y en ocasiones,
ante la dificultad de hacer un reco- rrido exhaustivo de todas las posibilidades, el usuario
tiene que conformarse con una soluci´on no ´optima del criterio. Los algoritmos gen´eticos
tienen la cualidad, en diversos problemas, de aproximar bastante bien las soluciones ´optimas.
La importancia que tienen los conjuntos aproximados en el tratamiento estad´ıstico de
5
6
datos es que permiten, por un lado, eliminar informaci´on superflua y, por tanto, la posible
omisi´on de mediciones innecesarias que se hacen de algunos atributos definidos sobre los
datos, con el correspondiente ahorro de tiempo y la disminuci´on de costos. Por otro lado,
las tablas de datos reducidas est´an m´as cerca de lo que puede ser una base de conocimiento
para la generaci´on de sistemas expertos.
Los conjuntos aproximados (CA) fueron introducidos por Pawlak ([22]) en los an˜os
ochenta. Su estudio se ubica dentro del campo de la inteligencia artificial que tiene que
ver con la vaguedad de datos imprecisos, tratando de descubrir relaciones entre ´estos ([23]).
Desdeelpunto devista matem´atico, elenfoquedeconjuntos aproximados esbastantesimple,
puess´olorequieredelmanejodeconjuntosfinitos,cardinalidadesyrelacionesdeequivalencia.
Su fortaleza est´a en que constituye una herramienta para la simplificaci´on de la informaci´on
y para que los datos concretos se hagan m´as discernibles.
Esta teor´ıa tiene mucho en comu´n con lo que se realiza en algunos m´etodos estad´ısticos,
especialmente con el an´alisis discriminante en el que, a grandes rasgos, se tiene cierta canti-
daddevariablesmedidas sobreuna colecci´on finita deobjetos; una deesasvariables (variable
a explicar) depende de las otras (variables explicativas) y se calcula la medida en que tal
dependencia ocurre y las que m´as aportan a tal dependencia. Pero el enfoque de conjuntos
aproximados est´a especialmente justificado en el caso de que el conjunto de datos experi-
mentales sea muy pequen˜o, en los que no tiene suficiente validez la aplicaci´on de m´etodos
estad´ısticos est´andar ([32]).
1.2 Conceptos b´asicos
Como punto de partida, se tiene un conjunto Ω = {ω ,ω ,...,ω } de n observaciones o datos
1 2 n
sobre los que se han medido p atributos cualitativos. Adem´as, los datos est´an previamente
clasificados en k clases o categor´ıas Y , Y ,...,Y , siendo Ω la uni´on disjunta de estas clases.
1 2 k
Si uno o m´as de los atributos es cuantitativo puede usarse un algoritmo conocido como
7
Algoritmo de Fisher para hacer una recodificaci´on de tales atributos, de forma que todos los
atributos sean cualitativos ([8]) y tenga sentido aplicar la teor´ıa de conjuntos aproximados
a la tabla resultante. Otro caso que puede darse es que en la tabla de datos haya datos
faltantes; en [32] se proponen formas de analizar este problema, pero este caso no estuvo
contemplado en la investigaci´on de tesis realizada.
Dada la clase Y , ´esta puede verse como uno de los conceptos que han servido para cat-
j
egorizar a los individuos; lo que se busca es un suconjunto de atributos (la menor cantidad
posible) que caractericen totalmente a una buena aproximaci´on Y0 de Y . La aproximaci´on
j j
Y0 se construye v´ıa una relaci´on de equivalencia definida sobre Ω. Se pretende encontrar una
j
relaci´on definida por un subconjunto P del conjunto de atributos en la que haya la mayor
cantidad posible de individuos de Y0 relacionados con otros de Y .
j j
EstetipodeaproximacionesdeY permiteeliminaratributosyobservacionesredundantes
j
para Y en la caracterizaci´on de este conjunto. La eliminaci´on de atributos permite obtener
j
un modelo para Y al crear un conjunto m´ınimo de variables que expliquen suficientemente
j
el concepto Y .
j
Un CA es un modelo matem´atico para la clasificaci´on aproximada que hace uso de sub-
conjuntos de Ω llamados aproximaci´on inferior y aproximaci´on superior que se calculan
respecto a un subconjunto del conjunto de atributos.
Si X = {x1,x2,...,xp} es el conjunto de atributos, xj(ω ) denota el valor del atributo xj
i
en la observaci´on w . Dado P ⊆ X, P 6= ∅, se define la relaci´on ℘:
i
∀xj ∈ P, ω ℘ω ⇐⇒ xj(ω ) = xj(ω ).
i h i h
Esta relaci´on ℘ definida sobre Ω, e inducida por P, es llamada relaci´on de indiscernibili-
dad pues cualesquiera dos objetos que se relacionen son indiscernibles respecto a las variables
presentes en P. Es sencillo verificar que ℘ es una relaci´on de equi- valencia y por tanto, pro-
duce una partici´on de Ω, Ω/℘, formada por sus clases de equivalencia [ω] , ∀ ω ∈ Ω .
℘
8
Para cada una de las categor´ıas Y se definen los conjuntos:
j
I(Y ) = {ω ∈ Ω : [ω] ⊆ Y }
j ℘ j
S(Y ) = {ω ∈ Ω : [ω] ∩Y 6= ∅}.
j ℘ j
I(Y ) y S(Y ) son, respectivamente, la aproximaci´on inferior y superior de Y . Es claro
j j j
que I(Y ) ⊆ S(Y ). El conjunto Fr(Y ) = S(Y )−I(Y ) es la frontera de la aproximaci´on y
j j j j j
es una regi´on de duda.
1.2.1 Medidas de calidad de la aproximaci´on
Para cada Y , y para todo P ⊆ X, con P 6= ∅, se define la calidad de la aproximaci´on del
j
conjunto Y como el´ındice
j
card I(Y )
j
W = .
j
card S(Y )
j
Tambi´en se define la calidad de la aproximaci´on de la clasificaci´on como el´ındice
k
card I(Y )
W = i=1 i
C Pk card S(Y )
i=1 i
P
y el siguiente´ındice sirve para medir la exactitud de la aproximaci´on de la clasificaci´on
k
card I(Y )
W = i=1 i .
e
P card Ω
La suma inferior es S = k card I(Y )
i=1 i
P
La suma superior es S = k card S(Y )
i=1 i
P
De los tres´ındices (W , W y W )1, que son los que usualmente aparecen en la literatura
j C e
de conjuntos aproximados, el primero es espec´ıfico para medir la calidad con que la partici´on
1Para no recargar la notacio´n se han escrito de esta forma, pero debe recalcarse que todos dependen del
subconjunto de atributosP, por lo que una notacio´n m´as acorde con tal dependencia ser´ıa: W (P), W (P)
j C
y W (P), respectivamente.
e
9
inducida por el conjunto P est´a aproximando a la categor´ıa Y ; en cambio, los dos u´ltimos
j
son globales. Puede observarse que al calcular cualquiera de estos´ındices, el resultado est´a
en el intervalo [0,1] y, en cualquiera de los tres, un buen subconjunto P de atributos se ve
reflejado en un valor del ´ındice igual o cercano a uno; contrariamente, cuando el resutado
del´ındice est´a cerca de cero, P da una aproximaci´on muy pobre.
1.2.2 Ejemplo
Consid´erese la siguiente tabla de datos, que consiste en los valores de cuatro atributos x1,
x2, x3 y x4, medidos en nueve individuos representados en las filas. La u´ltima columna se
refiere a la categor´ıa (Y o Y ) en que viene clasificado cada individuo.
1 2
Individuo x1 x2 x3 x4 Clase
1 0 1 1 0 1
2 2 1 0 1 1
3 0 0 0 1 1
4 1 0 2 0 1
5 0 1 1 0 1
6 2 1 0 1 2
7 0 1 1 0 2
8 1 0 2 1 2
9 0 0 0 1 2
De acuerdo con la u´ltima columna de la tabla, las categor´ıas que forman la clasificaci´on
del conjunto de datos son
Y = {1,2,3,4,5},
1
Y = {6,7,8,9}.
2
Dado el subconjunto de atributos P = {x2,x4}, ´este induce la siguiente partici´on sobre
Ω:
10
Ω/℘ = {{1,5,7},{2,6},{3,8,9},{4}}
Al calcular los´ındices presentados anteriormente, se tienen los siguientes valores:
1 1
• W = =
1
3+2+3+1 9
0
• W = = 0
2
2+3+3
1+0 1
• W = S/S = =
C
3+2+3+1+2+3+3 17
1
• W = S/9 =
e
9
Pueden interpretarse los´ındices calculados como sigue: La partici´on Ω/℘ aproxima a la
1
clase Y con un ´ındice de calidad W = , lo cual refleja que el subconjunto de atributos
1 1 9
{x2,x4} representan muy mal a la clase Y y, de paso, que la regi´on de duda es grande. Algo
1
similar ocurre con la clase Y , pues W = 0, por lo que ni un solo elemento de Y queda
2 2 2
1
bien clasificado usando esos dos atributos. Por otro lado, la calidad global W = es muy
C
17
baja y es la proporci´on global que hay entre las aproximaciones inferiores y superiores, con-
1
sideradas en forma global. Finalmente el ´ındice de exactitud W = indica la proporci´on
e
9
de individuos de Ω que quedan bien clasificados en Y o en Y mediante los dos atributos
1 2
considerados.
1.2.3 Otros ´ındices de calidad propuestos
Otros´ındices globales de calidad que podr´ıan estudiarse y que dependen de un subconjunto
P de atributos, son los siguientes:
1. El promedio ponderado de las calidades de aproximaci´on de los conjuntos Y :
j
k
card(Y )
j
W = W .
j
card(Ω)
Xj=1
f
Description:o más capas ocultas, como la de la figura 1.2, con conexiones sólo entre neuronas si j pertenece a una capa oculta, INRIA, Francia, capıtulo 1.