Story Transcript
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
Examen Final Abril 2012 Esta hoja se recogerá 15 minutos después de iniciado el examen APELLIDOS: NOMBRE: Test (3 puntos) Conteste a las siguientes preguntas marcando en la tabla que se encuentra al final la respuesta que considere correcta, teniendo en cuenta que para cada una de ellas hay una y sólo una respuesta correcta. Las preguntas no marcadas en la tabla se consideran no contestadas. La contestación correcta de cada pregunta puntúa +0.3 puntos, las contestaciones incorrectas puntúan -0.1 puntos, y no contestar a una pregunta no puntúa ni positiva ni negativamente. 1) ¿Cuál de las siguientes afirmaciones es correcta? a. Un Sistema Basado en el Conocimiento está formado por el Motor de Inferencia y la Base de Hechos b. La Ingeniería del Conocimiento es a los Sistemas Basados en el Conocimiento lo que la Ingeniería del Software es a los tradicionales c. El ingeniero del conocimiento sólo se encarga de la fase de implementación de prototipos d. Ninguna de las anteriores 2) ¿Cuál de las siguientes afirmaciones es cierta? a. La programación algorítmica es más próxima al razonamiento humano que la declarativa b. La programación declarativa es más próxima al razonamiento humano que la algorítmica c. La programación declarativa suele ser más eficiente que la algorítmica d. Ninguna de las anteriores 3) ¿Cuál de las siguientes afirmaciones es correcta? a. RETE es una red o algoritmo que se utiliza para seleccionar qué instancia del conjunto conflicto es la siguiente en dispararse b. En CLIPS se puede seleccionar la estrategia de resolución del conjunto conflicto entre varias que proporciona el sistema c. CLIPS funciona con encadenamiento hacia detrás d. Ninguna de las anteriores 4) Dados la base de reglas y el contenido de la memoria de trabajo de la figura ¿Cuántos elementos tendrá el conjunto conflicto suponiendo que todavía no se ha disparado ninguna regla? a. 1 BR: MT: b. 2 (defrule R f-0 (initial-fact) (dia ?d1 ?a) f-1 (dia M IC) c. 4 (dia ?d2 ?a) f-2 (dia X IC) d. Ninguna de las anteriores => )
5) ¿Cuál de las siguientes afirmaciones es falsa? a. En RDFS se puede especificar el dominio de una propiedad b. En OWL se puede definir una clase A ´ C t D c. En RDFS se puede definir una clase A ´ C t D d. Alguna de las anteriores es falsa1
1
Obsérvese que si las alternativas anteriores son ciertas entonces ésta es la respuesta a marcar 1/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
6) ¿Cuál de las siguientes afirmaciones es correcta? a. ∀r.> v ∀r.C b. ∃r.C v ∀r.C c. ∀r.> ´ > d. Ninguna de las anteriores
7) Sea el siguiente sistema MYCIN ¿Cuál de los siguientes es el factor de certeza de D? FC(A) = 0.4 R1(FC = +0.5): A ∨ B à D FC(B) = - 0.1 R2(FC = +0.4): C à D FC(C) = 0.5 a. 0.16 b. 0.2 c. 0.36 d. Ninguna de las anteriores 8) ¿Cuál de las siguientes afirmaciones es cierta respecto MYCIN? Siendo FC = Factor de Certeza a. FC(h) + FC(¬h) = 1 b. FC(h) + FC(¬h) = 0 c. FC(¬h) = FC(1 – h) d. Ninguna de las anteriores 9) ¿Cuál de las siguientes afirmaciones es cierta respecto al modelo de redes bayesianas de Perl? a. La red puede tener ciclos b. Si Z es causa de Y, e Y es causa de X, entonces P(X | Y, Z) = P(X | Y) c. Si Z es efecto de Y, e Y es efecto de X, entonces P(X | Y, Z) = P(X | Y) d. Ninguna de las anteriores 10) ¿Cuál de las siguientes afirmaciones es verdadera respecto a la lógica borrosa? a. Toda t-norma T es menor o igual a la función mínimo b. La función mínimo es menor o igual que cualquier t-norma c. La función máximo es mayor o igual que cualquier t-conorma d. Ninguna de las anteriores
Pregunta 1) 2) 3) 4) 5) 6) 7) 8) 9) 10)
a
b x x x
c
d
x x x x x x x
2/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
Examen Final Abril 2012 Normas: • • •
La duración de esta parte del examen es de 2 horas y 30 minutos. No está permitido levantarse del asiento salvo para entregar el examen. Si quiere realizar alguna pregunta avise al profesor. No se admiten apuntes ni móviles. Sí se puede usar calculadora.
Ejercicio 1 (2 puntos) Dados los siguientes conceptos atómicos: Coche, Rueda, Millonario, Persona, Casa, Caro, Ferrari y Porsche, y el rol atómico tiene, representar el siguiente conocimiento en lógica de descripciones ALC y en lógica de primer orden. 1) 2) 3) 4) 5)
Los coches tienen ruedas Los millonarios son personas que tienen alguna casa cara y algún coche caro Los Ferraris y los Porsches son coches caros Quien tiene un Ferrari y un Porsche es millonario Las personas que sólo tienen cosas caras son millonarias
SOLUCIÓN 1) Los coches tienen ruedas Coche v 9tiene.Rueda ∀x(Coche(x) → ∃y(tiene(x,y) ∧ Rueda(y))) 2) Los millonarios son personas que tienen alguna casa cara y algún coche caro Millonario v Persona u 9tiene.(Casa u Caro) u 9tiene.(Coche u Caro) ∀x(Millonario(x) → Persona(x) ∧ ∃y(tiene(x,y) ∧ Casa(y) ∧ Caro(y)) ∧ ∃z(tiene(x,z) ∧ Coche(z) ∧ Caro(z)) ) 3) Los Ferraris y los Porsches son coches caros (Ferrari t Porsche) v Coche u Caro ∀x(Ferrari(x) ∨ Porsche(x) → Coche(x) ∧ Caro(x)) Otra: Ferrari v Coche u Caro Porsche v Coche u Caro ∀x(Ferrari(x) → Coche(x) ∧ Caro(x)) ∀x(Porsche(x) → Coche(x) ∧ Caro(x)) 4) Quien tiene un Ferrari y un Porsche es millonario 9tiene.Ferrari u 9tiene.Porsche v Millonario ∀x(∃y(tiene(x,y) ∧ Ferrari(y)) ∧ ∃z(tiene(x,z) ∧ Porsche (z)) → Millonario(x) ) 5) Las personas que sólo tienen cosas caras son millonarias Persona u ∀tiene.Caro u ∃tiene. Caro v Millonario ∀x(Persona(x) ∧ ∀y(tiene(x,y) → Caro(y)) ∧ ∃y(tiene(x,y) ∧ Caro(y)) → Millonario(x))
3/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
Ejercicio 2 (1 puntos) La fuente de datos LinkedMDB contiene información sobre películas de cine. Escribir una consulta SPARQL que permita obtener los títulos de películas españolas, su fecha y el nombre del director, sabiendo que: Las películas son instancias de http://data.linkedmdb.org/resource/movie/film Las películas (http://data.linkedmdb.org/resource/movie/film) tienen las siguientes propiedades: -
-
http://data.linkedmdb.org/resource/movie/country http://purl.org/dc/terms/title http://purl.org/dc/terms/date http://data.linkedmdb.org/resource/movie/director
El nombre del director está representado como el valor de una propiedad http://data.linkedmdb.org/resource/movie/director_name (cuyo dominio es el valor de la propiedad http://data.linkedmdb.org/resource/movie/director). España está representada por http://data.linkedmdb.org/resource/country/ES Si recuerdan algunos prefijos típicos por si fueran de interés: PREFIX rdf: PREFIX rdfs: PREFIX owl:
SOLUCIÓN PREFIX PREFIX PREFIX PREFIX
country: movie: rdf: dc:
SELECT ?titulo ?fecha ?director WHERE { ?peli rdf:type movie:film. ?peli movie:country country:ES. ?peli dc:title ?titulo. ?peli dc:date ?fecha. ?peli movie:director ?dir. ?dir movie:director_name ?director. }
4/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
Ejercicio 3 (2 puntos) Un vehículo inteligente incluye un sistema basado en el conocimiento para predecir la probabilidad de llegar tarde a un destino habitual cuando se va conduciendo en función de determinadas condiciones del tráfico. En concreto tiene en cuenta la velocidad media del tráfico, el número de vehículos en una sección de la carretera y el porcentaje de camiones. El retraso se clasifica en poco probable, probable y seguro. La siguiente tabla indica las reglas que forman la base de conocimiento para dicho cálculo. Por ejemplo, la regla R6 indica: SI Velocidad media = Baja Y Número de vehículos = Bajo Y % camiones = Alto ENTONCES el retraso es Probable. Reglas R1 R2 R3 R4 R5 R6
Velocidad media Normal Baja Baja Baja Baja Baja
Número de vehículos
% camiones
Medio Alto Alto Bajo Bajo
Bajo Alto Bajo Alto
Retraso Poco probable Probable Probable Seguro Poco probable Probable
En este problema se trata de construir un sistema basado en reglas CLIPS para calcular la clasificación del retraso. El vehículo está dotado de diferentes medios para la adquisición de los datos. Supongamos en este problema que el número de vehículos y el porcentaje de camiones están disponibles de forma numérica mediante hechos similares a estos: (num_vehiculos 40) (porcentaje_camiones 30)
En cambio, en el caso de la velocidad, se dispone de datos de varios sensores (número no determinado) que proporcionan la velocidad en km/h, siendo necesario calcular su valor medio. Los datos se encuentran representados mediante hechos utilizando la siguiente plantilla: (deftemplate medida_velocidad (slot sensor) (slot valor) )
Por ejemplo: (medida_velocidad (sensor s001) (valor 27)) (medida_velocidad (sensor s005) (valor 32)) ... ... (medida_velocidad (sensor s011) (valor 31))
La velocidad media se considera Baja entre 0-90 km/h y Normal si es mayor de 90 km/h. En el caso del número de vehículos, se considera Bajo de 0-35, Medio de 36-65 y Alto si es mayor de 65. En cuanto al % de camiones, es Bajo de 0-20 y Alto de 21-100. El objetivo del sistema es almacenar en la memoria de trabajo un hecho que indique la probabilidad de retraso esperada, por ejemplo: (retraso probable)
NOTAS: • el sistema debe funcionar con las estrategias tanto de anchura como profundidad. • si es necesario escribir varias reglas similares con pequeñas modificaciones es suficiente con indicar dichos cambios
5/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
SOLUCIÓN ; *******
Cálculo de velocidad media
(defrule IniciaContadores (not (numerosensores ?x)) => (assert (numerosensores 0)) (assert (sumavelocidad 0)) ) (defrule SumaSensor ?hn ?v 90)) => (assert (velocidad_media normal)) ) ; *******
Abstracción número de vehículos
(defrule VehiculosBajo (num_vehiculos ?n) (test ( (assert (vehiculos bajo)) ) (defrule VehiculosMedio (num_vehiculos ?n) (test (and (> ?n 35)( (assert (vehiculos medio)) ) (defrule VehiculosAlto (num_vehiculos ?n) (test (> ?n 65)) => (assert (vehiculos alto)) ) ; *******
Abstracción camiones
(defrule CamionesBajo (porcentaje_camiones ?p) (test ( (assert (camiones bajo)) ) (defrule CamionesAlto (porcentaje_camiones ?p) (test (> ?p 20)) => (assert (camiones alto)) )
6/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
; *******
Reglas Retraso
(defrule R1 (velocidad_media normal) => (assert (retraso poco_probable)) ) (defrule R2 (velocidad_media baja) (vehiculos medio) => (assert (retraso probable)) ) (defrule R3 (velocidad_media baja) (vehiculos alto) (camiones bajo) => (assert (retraso probable)) ) (defrule R4 (velocidad_media baja) (vehiculos alto) (camiones alto) => (assert (retraso seguro)) ) (defrule R5 (velocidad_media baja) (vehiculos bajo) (camiones bajo) => (assert (retraso poco_probable)) ) (defrule R6 (velocidad_media baja) (vehiculos bajo) (camiones alto) => (assert (retraso probable)) )
7/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
Ejercicio 4 (2 puntos) Un vehículo inteligente incluye un sistema basado en el conocimiento para predecir la probabilidad de llegar tarde a un destino habitual cuando se va conduciendo en función de determinadas condiciones del tráfico. En concreto tiene en cuenta la velocidad media (V) del tráfico, el número de vehículos (NV) en una sección de la carretera y el porcentaje de camiones (%C). El retraso se clasifica en poco probable, probable y seguro. La siguiente tabla indica las reglas que forman la base de conocimiento para dicho cálculo. Por ejemplo, la regla R6 indica: SI Velocidad media = Baja Y Número de vehículos = Bajo Y % camiones = Alto ENTONCES el retraso es Probable. Reglas R1 R2 R3 R4 R5 R6
Velocidad media Normal Baja Baja Baja Baja Baja
Número de vehículos
% camiones
Medio Alto Alto Bajo Bajo
Bajo Alto Bajo Alto
Retraso Poco probable Probable Probable Seguro Poco probable Probable
En este problema se decide construir un sistema de inferencia borroso que permita obtener en una escala de 0 a 1 el grado con el que se espera que se llegará con retraso al destino. A continuación se muestran los conjuntos borrosos definidos para cada uno de los valores de las variables que intervienen.
Número de vehículos
Velocidad media Baja
Bajo
Normal
1
Medio
Alto
1
km/h
0
0
80
100
150
0
30
40
60
70
100
Retraso
Porcentaje de camiones Bajo
Poco probable
Probable
Seguro
1
Alto
1
0
0
10
30
100
%
0
0
0.2
0.3
0.7
0.8
1
Aplicar el modelo de inferencia de Mamdani para obtener una estimación nítida de la estimación del retraso para los siguientes datos: • Velocidad media = 50 km/h • Número de vehículos (NV*) y % de camiones (%C*): datos aproximados, detallados en las siguientes figuras 1
veh
0 50
55
60
65
% camiones
1
Nº vehículos
70
75
80
%
0 0
5
10
15
20
25
30
35
40
45
50
8/11
vehículos
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
SOLUCIÓN R1: SI V = Normal ENTONCES R = Poco Probable El nivel de ajuste de esta regla es: NAV=Normal = µNormal(50) = 0 R2: SI V = Baja ∧ NV = Medio ENTONCES R = Probable NAV=Baja = µBaja(50) = 1 NANV=Medio: Al tratarse NV* de un valor borroso, el NA se calcula el máximo del mínimo de las funciones. Número de vehículos Bajo
Medio
NV*
Alto
1
0
30
40
60
70
100
vehículos
El punto de corte de las rectas Medio y NV* se calcula igualando las ecuaciones de sus respectivas rectas: y = –x/10 + 7 (Medio) y = x/5 – 12 (NV*) –x/10 + 7 = x/5 – 12 x = 190/3 y = 2/3 NANV=Medio = 2/3 El nivel de ajuste de la regla es: NAR2 = Mín(NAV=Baja, NANV=Medio) = Mín(1, 2/3) = 2/3 Obteniendo como conjunto resultado de la regla: Retraso 1
2/3
0
0
0.2
0.3
0.7
0.8
1
R3: SI V = Baja ∧ NV = Alto ∧ %C = Bajo ENTONCES R = Probable NAV=Baja = 1 NANV=Alto = 2/3 (simétrico a NANV=Medio) NA%C=Bajo: Al tratarse %C* de un valor borroso, el NA se calcula el máximo del mínimo de las funciones. Porcentaje de camiones Bajo
%C*
1
0
0
10
20
30
100
%
9/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
El punto de corte de las rectas Bajo y %C* se calcula igualando las ecuaciones de sus respectivas rectas: y = (30 – x)/20 (Bajo) y = (x – 20)/5 (%C*) (30 – x)/20 = (x – 20)/5 x = 22 y = 0.4 NA%C=Bajo = 0.4 El nivel de ajuste de la regla es: NAR3 = Mín(NAV=Baja, NANV=Alto, NA%C=Bajo) = Mín(1, 2/3, 0.4) = 0.4 Obteniendo como conjunto resultado de la regla: Retraso 1
0.4
0
0
0.2
0.3
0.7
0.8
1
R4: SI V = Baja ∧ NV = Alto ∧ %C = Alto ENTONCES R = Seguro NAV=Baja = 1 NANV=Alto = 2/3 NA%C=Alto: Al tratarse %C* de un valor borroso, el NA se calcula el máximo del mínimo de las funciones. Porcentaje de camiones %C*
Alto
1
0
10
0
20 25
30
100
%
El punto de corte de las rectas Alto y %C* se calcula igualando las ecuaciones de sus respectivas rectas: y = (x – 10)/20 (Alto) y = (30 – x)/5 (%C*) (x – 10)/20 = (30 – x)/5 x = 26 y = 0.8 NA%C=Alto = 0.8 El nivel de ajuste de la regla es: NAR4 = Mín(NAV=Baja, NANV=Alto, NA%C=Alto) = Mín(1, 2/3, 0.8) = 2/3 Obteniendo como conjunto resultado de la regla: Retraso 1
2/3
0
0
0.2
0.3
0.7
0.8
1
10/11
Ingeniería Informática
Ingeniería del Conocimiento 18 de abril de 2012
R5: SI V = Baja ∧ NV = Bajo ∧ %C = Bajo ENTONCES R = Poco Probable R6: SI V = Baja ∧ NV = Bajo ∧ %C = Alto ENTONCES R = Probable En estas dos reglas el nivel de ajuste es 0 ya que NANV=Bajo = 0
Se obtiene el conjunto borroso resultado como el mín(NA, Distancia) y la unión de todas ellas quedando el conjunto borroso de la siguiente figura Retraso 1
2/3
0
0
0.2
0.3
0.7
0.8
1
Finalmente se desborrosifica para obtener el valor nítido resultado. Para ello se calcula el centro de gravedad. Se puede calcularlo dividiendo la figura en formas cuyos centros de gravedad y áreas sean sencillos de calcular. En particular se pueden identificar las 3 partes mostradas en la figura. Retraso 1
2/3
A2
A1 0
0
0.2
0.3
0.7
0.8
1
cg1 = 2/3*0.2 = 0.133 A1 = 2/3*0.2/2 = 0.067 cg2 = (0.2 + 1) / 2 = 0.6 A2 = 0.8 * 2/3 = 0.53
cg =
∑ cg * A ∑A i
i
i
=
0.133 * 0.067 + 0.6 * 0.53 0.55 = 0.067 + 0.53
Por tanto, la estimación de certeza de que habrá retraso es de 0.55.
11/11