DEPARTAMENTO DE INTELIGENCIA ARTIFICIAL

Asignatura: Introducción a la Inteligencia Artificial

 
>> Introducción a la Inteligencia Artificial >> Bibliografía básica >> Programa
 

PROGRAMA DE LA ASIGNATURA

  1. Desarrollo del programa
  2. Contenidos del programa
  3. Referencias

Desarrollo del Programa

La organización del temario se va a dividir en unidades temáticas compuestas por bloques autónomos denominados temas. Cada una de estos bloques se va a subdividir en tres apartados. En el primero se resumirán los objetivos básicos del capítulo, resaltando sus conexiones con el resto de la estructura del programa. En el segundo se concretará el contenido del tema por apartados. Finalmente, una vez presentado el esquema del contenido, en el tercer apartado se propondrá una bibliografía básica y una serie de textos complementarios sobre el contenido del bloque en cuestión. Considerando las recomendaciones de la metodología de enseñanza a distancia en este aspecto, estimamos oportuno restringir drásticamente la cantidad de textos propuestos. Así, proponemos utilizar un texto básico teórico y otro texto básico de problemas. Los textos complementarios se dividen en textos de propósito general y textos específicos sobre la materia de que se trate.


Contenidos del programa

El programa de Introducción a la IA incluye las siguientes unidades temáticas:

  1. Perspectiva Histórico-Conceptual y Metodología.
  2. Búsqueda como tarea genérica en IA.
  3. Representación Computacional del Conocimiento.

Aunque el programa propuesto sea relativamente extenso, los alumnos sólo deben considerar como materia de evaluación los temas de búsqueda (capítulos 3 y 4) y representación computacional del conocimiento (capítulos 4 al 8). Los temas 1 y 2, que son los que constituyen la primera unidad temática, deberán estudiarse a nivel cualitativo, dejando para el curso siguiente la profundización necesaria para comprender el desarrollo de los sistemas basados en el conocimiento, las redes neuronales y los procesos de aprendizaje, distinguiendo claramente el contenido computacional del nivel simbólico y conexionista de su descripción en el nivel del conocimiento.



I. PERSPECTIVA HISTÓRICO-CONCEPTUAL Y METODOLOGÍA

Esta unidad temática está compuesta por los siguientes temas:


TEMA 1. PERSPECTIVA HISTÓRICA Y CONCEPTUAL

Objetivos y desarrollo:

En este primer tema introducimos el concepto de Inteligencia Artificial (IA), estableciendo la distinción entre las perspectivas de "Ciencia de lo Natural" (análisis) y "Ciencia de lo Artificial" (síntesis). La distinción entre la perspectiva conexionista y la simbólica se establecerá en el siguiente tema. La IA, que nació conexionista, se convirtió en simbólica en la década de los sesenta y ha vuelto a considerar a las redes neuronales como un complemento necesario a partir de la década de los ochenta.

Consideramos las distintas etapas históricas (neurocibernética, computación previa a la IA, heurística y micromundos, énfasis en el conocimiento, aprendizaje y conexionismo) con el fin de ofrecer una visión amplia del campo que justifique su estado actual. Hacemos énfasis en aquellos hechos que nos han parecido más significativos por proximidad conceptual. Por otro lado, aprovechamos la evolución histórica para introducir y comentar superficialmente el contenido del resto de los temas dedicados a la representación computacional del conocimiento y al estudio de los sistemas expertos, el aprendizaje simbólico y las redes neuronales. Finalmente, al comentar las distintas aportaciones históricas, introducimos el test de Turing como método experimental de acumular inferencia inductiva sobre el grado de conocimiento codificado en un programa de IA.

Este tema pretende cubrir un doble objetivo: introducir al alumno en la materia y proporcionar una visión global e integradora de la misma. Por ello, se aconseja realizar una doble lectura del mismo en el texto base. Una inicial, introductoria, en la que el lector no debe preocuparse si no conoce con precisión el significado de todos los términos (sistema experto, conexionismo, heurística, red semántica, etc...). Al análisis de estos términos se dedicarán temas enteros y es después del estudio de éstos cuando tiene sentido volver a realizar una segunda lectura de este tema inicial para dar coherencia al nuevo conocimiento adquirido e integrarlo en la idea global de IA que aquí se pretende transmitir.

Contenido:

  • 1.1 CONCEPTO DE INTELIGENCIA ARTIFICIAL
  • 1.2 IDEA INTUITIVA DEL COMPORTAMIENTO ARTIFICIAL
  • 1.3 PERSPECTIVA HISTÓRICA DE LA INTELIGENCIA ARTIFICIAL
  • 1.3.1 Neurocibernética
  • 1.3.2 Computación: de Platón a Turing
  • 1.3.3 Búsqueda Heurística y Dominios Formales
  • 1.3.4 Énfasis en el Conocimiento (197x-198x)
  • 1.3.5 Aprendizaje y Renacimiento del Conexionismo
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Borrajo D., Juristo N., Martínez V, y Pazos J. "Inteligencia Artificial: Métodos y Técnicas". Centro de Estudios Ramón Areces. Madrid, 1993.

    Pazos J. "Inteligencia Artificial". Paraninfo, Madrid, 1987.

    Barr, A., and Feigenbaum, E.A., "The Handbook of Artificial Intelligence", Vol. I. William Kaufmann, Los Altos, Calif., 1981.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Minsky M. "The society of mind". Simon and Schuster Inc., New York, YN, 1986. En los dos primeros capítulos (pp. 11-54) se propone una visión bastante completa de la historia de la IA hasta mediados de los años 80.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition. En el artículo firmado por el propio Shapiro (pp. 54-57) se analiza el concepto de IA y se repasan brevemente las etapas históricas.

    Wasserman, P.D., "Neural Computing: Theory and Practice", Van Nostrand Reinhold, New York, 1989. En el capítulo de introducción se repasa la historia de las redes neuronales (pp. 1-10).


    TEMA 2. ASPECTOS METODOLÓGICOS EN IA

    Objetivos y desarrollo:

    En el primer tema proponíamos una revisión histórico-conceptual del contenido de la IA como ciencia y como tecnología. A partir del tema tercero vamos a entrar en el desarrollo de contenidos específicos. En este segundo tema abordamos algunos aspectos metodológicos a los que usualmente no se les dedica mucha atención pero que nosotros consideramos esenciales para el avance de la IA como ciencia y como tecnología.

    Tendríamos una visión diezmada de la IA si no analizáramos los aspectos metodológicos propios de la tecnología a la que ha dado lugar. La relativa juventud del campo hace que todavía nos encontremos en el estadio en el cual empiezan a cuajar las primeras propuestas metodológicas (KADS), inspiradas en los métodos aplicados en otros campos de la ingería del software.

    En este tema repasaremos los fundamentos en los que se apoya este análisis metodológico. Introduciremos la taxonomía de niveles de computación debida a David Marr (teoría, algoritmo e implementación) y el nivel de conocimiento, propuesto por Allen Newell en 1981, con lo que se completa una primera visión metodológica de la IA a través de la distinción de distintos niveles de computación. Se hace cierto énfasis en los problemas asociados al primer salto de nivel, a la reducción del nivel de conocimiento al nivel simbólico y al paso inverso de interpretación.

    El siguiente paso metodológico procede de la Física y de la Biología y consiste en introducir la figura del observador y la distinción a cualquier nivel de dos dominios (el propio del nivel y el del observador). En particular, comentamos el hecho evidente, aunque no siempre explícito, de la inyección de conocimiento siempre presente en la reducción e interpretación de los procesos del nivel simbólico en el dominio del observador.

    El tercer aspecto metodológico que se aborda en este tema es la distinción y posterior integración de las perspectivas simbólica y conexionista (redes neuronales) en la IA, en particular en el caso de las redes basadas en el conocimiento.

    Aunque se harán algunas referencias al tema de las estructuras de tareas genéricas y al procedimiento de desarrollo de sistemas basados en el conocimiento, el grueso de los comentarios se aplaza hasta el tema 9, dedicado al estudio de los Sistemas Expertos. Entonces ya habremos estudiado los distintos métodos de representación y los mecanismos de inferencia y, por consiguiente, dispondremos de bases más sólidas para comentar los aspectos metodológicos.

    Al igual que en el tema anterior los contenidos de éste también aconsejan una doble lectura: la primera para captar los aspectos básicos y la segunda para integrar contenidos y comprobar en dominios concretos cuál es el significado de los distintos niveles de computación, el conocimiento inyectado, la teoría de los dos dominios y la complementariedad o equivalencia entre las perspectivas simbólica y conexionista.

    Contenido:

  • 2.1 NIVELES DE COMPUTACIÓN
  • 2.2 EL NIVEL DE CONOCIMIENTO DE ALLEN NEWELL
  • 2.3 EL AGENTE OBSERVADOR Y LOS DOS DOMINIOS DE DESCRIPCIÓN
  • 2.4 ESTRUCTURA DE TAREAS GENÉRICAS PARA MODELAR CONOCIMIENTO EN EL DOMINIO OBSERVADOR
  • 2.4.1 La Clasificación como Tarea Genérica
  • 2.4.2 La Metodología KADS
  • 2.5 IA SIMBÓLICA VERSUS IA CONEXIONISTA
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Boticario, J.G. "Contribuciones a la teoría computacional del aprendizaje: ejemplos de aplicación". Tesis doctoral, Dpto. Informática y Automática, UNED, 1994.

    Utiliza la perspectiva metodológica explicada en el capítulo para proporcionar una visión integradora de los procesos del aprendizaje simbólico, tanto a nivel del conocimiento como en su desarrollo computacional.

    Tansley, D.S.W., and Hayball, C.C., "Knowledge-Based Systems Analysis and Design: A KADS Developer's Handbook". Prentice-Hall, 1993.

    Explicación detallada de la metodología KADS a través de los procesos de análisis y diseño de una aplicación.

    Textos específicos:

    Anderson, J.R. "A theory of the origins of human knowledge". Artificial Intelligence, 40 (1989) 313-351. Desarrollo teórico y computacional de un modelo general de inferencia del conocimiento basado en tres niveles de descripción: conocimiento, algoritmo e implementación.

    Boticario, J.G., and Mira J., "Some methodological aspects of machine learning". Cybernetics and Systems, 25 (1994), pp. 233-258. Aproximación metodológica a los procesos de inferencia del aprendizaje simbólico.

    Chandrasekaran, B., Johnson, T.R., and Smith, J.W., "Task-structure analysis for knowledge modeling". Communications of the ACM, 35 (1992) 124-137. La estructura de tarea genérica como base del modelado del conocimiento.

    Clancey, W.J., "Heuristic Classification". Artificial Intelligence, 27(1985) 289-350. Descripción del modelo de inferencia de la tarea de clasificación.

    Marr, D., "Vision", Freeman, New York, 1982. Introducción de los tres niveles de computación en una teoría computacional de la percepción visual.

    Newell, A., "The Knowledge Level". AI Magazine, summer (1981) 1-20. Propuesta del Nivel del Conocimiento.

    O'Hara, K., and Shadbolt, N.,, "AI models as a variety of psychological explanation". In Proceedings of the IJCAI-93, Chambery, France, 1993. Revisión de la propuesta de tareas genéricas de Chandrasekaran.

    Van de Velde, W., Duursma, C., Schreiber, G., Terpstra, P., Schrooten, R., Golinopulos, V., Olsson, O., Sundin, U., and Gustavsson, M. "Design model and process". KADS-II: Deliverable D.M.7, version 2.1, October 1994. Describe la parte final de generación de código de KADS (KADS-II), con el fin de completar el ciclo de desarrollo de las aplicaciones basadas en el conocimiento.



    II. BÚSQUEDA COMO TAREA GENÉRICA EN IA

    Esta unidad temática está compuesta por los siguientes temas:


    TEMA 3. FUNDAMENTOS Y TÉCNICAS BÁSICAS DE BÚSQUEDA

    Objetivos y desarrollo:

    Históricamente, fueron los problemas de búsqueda los que primero acapararon mayor interés y desarrollo. Este dato, la sencillez y claridad de su formulación, y la estructura elegida por todos los libros recientes de la materia, nos ha decidido a comenzar la docencia de los métodos de la materia por el tema de búsqueda.

    En los bloques previos se ha presentado una visión de las características que definen la IA como ciencia y como tecnología. También se han presentado diferentes niveles de clasificación del tipo de problemas abordados. En un primer nivel se han distinguido problemas de percepción, razonamiento, aprendizaje, planificación y decisión. Tareas como clasificación, representación y búsqueda, pertenecen a un segundo nivel, ya que cada una de ellas pueden aparecer como tareas concretas en la resolución de las del primer nivel. A partir de ahora en éste y en los temas siguientes nos vamos a centrar en describir las principales técnicas desarrolladas en este campo y los dominios en los que se han aplicado.

    Una de las aportaciones de la IA a la solución general de problemas ha sido reconocer la importancia del conocimiento del dominio. Un objetivo docente en esta materia debe ser poner de manifiesto las ventajas derivadas de su uso. Con este fin, dividiremos las estrategias de búsqueda en dos bloques autónomos: en este primer tema se estudiarán las que no tienen en cuenta el conocimiento del dominio y en el siguiente las que se aprovechan de su aplicación.

    Pretendemos mantener una coherencia con la perspectiva metodológica introducida en el segundo tema; por ello, proponemos un planteamiento de los problemas de búsqueda como una tarea de propósito genérico. Distinguiremos los elementos de entrada conocidos de antemano y los de salida el objetivo de la tarea que definen la estructura de dicha tarea. Partiendo de este esquema básico, realizamos un estudio estructurado de las principales estrategias de control (una de las entradas del planteamiento genérico de la búsqueda) que determinan el comportamiento del solucionador de la tarea. Los aspectos que definen la estructura de análisis de cada estrategia son: descripción, algoritmo, observaciones, ejemplo (el mismo caso para diferentes estrategias), estudio de complejidades (temporal y espacial), y análisis de ventajas y desventajas con respecto al resto de las estrategias.

    Con este esquema perseguimos un objetivo adicional: ayudar a que el alumno se acostumbre a identificar el modelo que más conviene aplicar a partir de la descripción de un problema. La capacidad de abstracción es básica para afrontar la resolución de los problemas propios de la IA.

    Una vez estudiado el planteamiento básico del problema, denominado espacio de estados, introduciremos una distinción en la estructura del modelo: ¿qué ocurre si de un estado se derivan varios?. Esta modificación estructural nos da pie para plantear un esquema alternativo, denominado reducción del problema, de indudable trascendencia como método general de solucionar problemas.

    Finalizaremos con la introducción de un procedimiento general de búsqueda en grafos con un doble propósito: anticipar el contenido del siguiente bloque y mostrar las modificaciones necesarias para generalizar el planteamiento visto en este tema.

    Contenido:

  • 3.1 PLANTEAMIENTO DEL PROBLEMA
  • 3.2 ESPACIOS DE REPRESENTACIÓN
  • 3.2.1 Nociones Básicas sobre Grafos
  • 3.2.2 Representación de los Problemas de Búsqueda
  • 3.2.3 Cómo Limitar el Espacio de Búsqueda
  • 3.3 BÚSQUEDA EN INTEGRACIÓN SIMBÓLICA
  • 3.3.1 Descripción General del Sistema
  • 3.3.2 Lenguaje de Descripciones
  • 3.3.3 Lenguaje de Operadores
  • 3.3.4 Equiparación de Descripciones
  • 3.3.5 Solucionador
  • 3.4 BÚSQUEDA SIN INFORMACIÓN DEL DOMINIO
  • 3.4.1 Búsqueda en Amplitud
  • 3.4.2 Búsqueda en Profundidad
  • 3.4.3 Búsqueda con Retroceso
  • 3.4.4 Otros Métodos Derivados
  • 3.5 REDUCCIÓN DEL PROBLEMA
  • 3.6 ALGORITMO GENERAL DE BÚSQUEDA EN GRAFOS
  • 3.7 DISCUSIÓN
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Borrajo D., Juristo N., Martínez V, y Pazos J. "Inteligencia Artificial: Métodos y Técnicas". Centro de Estudios Ramón Areces. Madrid, 1993.

    Pazos J. "Inteligencia Artificial". Paraninfo, Madrid, 1987.

    Barr, A., and Feigenbaum, E.A., "The Handbook of Artificial Intelligence", Vol. I. William Kaufmann, Los Altos, Calif., 1981.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Boticario, J.G., "SAM: Construcción de un sistema de aprendizaje automático para integración simbólica basado en la inducción". Trabajo fin de carrera No. 87/88-052. Facultad de Informática, Universidad Politécnica de Madrid, 1988. Desarrollo detallado e implementación del ejemplo utilizado como base en la explicación de diferentes estrategias de búsqueda.

    Pearl, J., "Heuristics: Intelligent search strategies for computer problem solving". Addison-Wesley Publishing, 1984. Aunque es un texto especialmente dedicado a los métodos informados de búsqueda, introduce con claridad los métodos analizados en este tema.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.

    Simon H. A. "Why should machines learn?." In R. S. Michalski, J. G. Carbonell, & T. M. Mitchell Eds., Machine Learning: An artificial intelligence approach. Los Altos, CA: Morgan Kaufmann, pp. 25-37. 1983. Resulta muy clarificador desde el punto de vista metodológico ya que compara el paradigma de búsqueda con el del razonamiento en lógica.


    TEMA 4. BÚSQUEDA HEURÍSTICA

    Objetivos y desarrollo:

    El contenido de este tema es la continuación natural del anterior. Allí vimos la búsqueda sin información del dominio y aquí vamos a estudiar la búsqueda basada en conocimiento. El principal problema de las estrategias de búsqueda estudiadas en el bloque previo es su carácter exhaustivo: tratan de llegar a la solución del problema recorriendo todos los nodos del espacio de búsqueda según un criterio de ordenación independiente del problema que se esté intentando resolver.

    Analizaremos la mejora derivada del uso del conocimiento del dominio manteniendo la perspectiva metodológica del tema anterior. Para ello, después de insistir en las limitaciones de las técnicas vistas, introduciremos la idea de conocimiento de control heurístico. Los métodos que veremos, conocidos como estrategias de búsqueda heurística, utilizan criterios dependientes del dominio para guiar el proceso de búsqueda. Desde el punto de vista estructural, la utilización de dichos criterios se materializa en la aplicación de las llamadas funciones de evaluación, que realizan una estimación de la bondad de un estado en el proceso de búsqueda. Estudiaremos las distintas estrategias de búsqueda informada ordenándolas según sus capacidades, con la intención de aclarar la mejora que cada método introduce en relación con los anteriores. Para analizar las distintas opciones utilizaremos un esquema de descripción semejante al del tema anterior (descripción, procedimiento, observaciones, ejemplo y análisis). Ilustraremos la mejora que se deriva del nuevo planteamiento en el ejemplo utilizado como base de descripción de las estrategias exhaustivas.

    La búsqueda heurística es una de las contribuciones clave de la IA a la solución eficiente de problemas. Por su propia naturaleza (elementos perfectamente conocidos), el campo de la teoría de juegos es un dominio especialmente apto para comprobar dicha afirmación. Los métodos utilizados en los juegos son muy interesantes por diversos motivos: por razones históricas, este área ha recibido un gran interés en la IA dado que en su planteamiento se pueden apreciar comportamientos inteligentes; por razones experimentales, los juegos ofrecen un marco sencillo de actuación en el que pueden analizarse metodologías complejas de resolver problemas, de planificación y de la teoría de la decisión, que pueden ser útiles en campos tan diversos como el mundo de los negocios o el de la experimentación científica; por razones formales, las decisiones de un juego pueden evaluarse en modelos perfectamente definidos en los que, además, pueden contraponerse las respuestas del sistema con las respuestas de origen humano.

    Una vez hayamos revisado las estrategias básicas de juego, terminaremos este tema mostrando un método general de resolución de problemas que utiliza el conocimiento dependiente del dominio. El planteamiento es bastante intuitivo y responde a modelos de actuación provenientes del campo de la psicología cognitiva; consiste, básicamente, en saber dónde se está, compararlo con aquello que se quiere alcanzar, y buscar maneras de reducir las diferencias entre ambos. En el llamado análisis de medios-fines se realiza un salto cualitativo con respecto al esquema general de búsqueda utilizado hasta este momento: se determina una nueva estrategia de control que está por encima de dicho esquema. Ya no sólo se accede a los elementos del modelo de forma independiente (operadores, estados, metas y decisiones locales), sino que se tiene consciencia de la estructura del modelo y de su funcionamiento. Se distingue el objetivo general del modelo: encontrar una secuencia de operadores que conduzca desde un estado inicial a uno meta. También se percibe el objetivo local: encontrar una secuencia de operadores que conduzcan desde un estado dado a otro desde el cual se pueda llegar a la meta.

    Una vez estudiados los métodos de búsqueda heurística, podemos afirmar con mayor motivo, que la utilización efectiva del conocimiento relevante del dominio es una condición básica para la solución de los problemas de IA. Esta argumentación se verá apoyada a lo largo del resto del temario, según se vayan presentando los diferentes mecanismos existentes para resolver los problemas de representación e inferencia en cualquier sistema.

    Contenido:

  • 4.1 ELEMENTOS IMPLICADOS
  • 4.1.1 Conocimiento de Control
  • 4.1.2 Planteamiento del Problema
  • 4.2 UNA ESTRATEGIA IRREVOCABLE
  • 4.3 ESTRATEGIAS DE EXPLORACIÓN DE ALTERNATIVAS
  • 4.3.1 Búsqueda Primero el Mejor
  • 4.3.2 Algoritmo A*
  • 4.3.3 Búsqueda Heurística en Integración Simbólica
  • 4.3.4 Método AO*
  • 4.4 BÚSQUEDA CON ADVERSARIOS
  • 4.4.1 Estrategia MINIMAX
  • 4.4.2 Estrategia de Poda -
  • 4.5 ANÁLISIS DE MEDIOS-FINES
  • 4.6 COMENTARIO
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Borrajo D., Juristo N., Martínez V, y Pazos J. "Inteligencia Artificial: Métodos y Técnicas". Centro de Estudios Ramón Areces. Madrid, 1993.

    Pazos J. "Inteligencia Artificial". Paraninfo, Madrid, 1987.

    Barr, A., and Feigenbaum, E.A., "The Handbook of Artificial Intelligence", Vol. I. William Kaufmann, Los Altos, Calif., 1981.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Boticario, J.G., "SAM: Construcción de un sistema de aprendizaje automático para integración simbólica basado en la inducción". Trabajo fin de carrera No. 87/88-052. Facultad de Informática, Universidad Politécnica de Madrid, 1988. Explicación detallada de un método heurístico de búsqueda dentro del marco de un sistema de aprendizaje.

    Hayes, J.R., "The complete problem solver". Second edition, Lawrence Erlbaum Associates, 1989. Estudio de los problemas de búsqueda desde una perspectiva psicológica (pp. 35, 67).

    Pearl, J., "Heuristics: Intelligent search strategies for computer problem solving". Addison-Wesley Publishing, 1984. Es un texto especialmente dedicado a los métodos informados de búsqueda.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.

    Simon H. A. "Why should machines learn?." In R. S. Michalski, J. G. Carbonell, & T. M. Mitchell Eds., Machine Learning: An artificial intelligence approach. Los Altos, CA: Morgan Kaufmann, pp. 25-37. 1983. Resulta muy clarificador desde el punto de vista metodológico ya que compara el paradigma de búsqueda con el del razonamiento en lógica, incluyendo los métodos informados.



    III. REPRESENTACIÓN COMPUTACIONAL DEL CONOCIMIENTO

    Esta unidad temática está compuesta por los siguientes temas:


    TEMA 5. LÓGICA

    Objetivos y desarrollo:

    En los temas previos hemos abordado cuestiones de tipo metodológico y planteamientos generales válidos para problemas perfectamente definidos (podría decirse, "de laboratorio"). A partir de ahora nos vamos a centrar en analizar las técnicas básicas de representación del conocimiento y su uso en inferencia para resolver los problemas del mundo real. Empezaremos describiendo la lógica, uno de los primeros dominios donde se aplicó la IA.

    Para determinar las metas docentes de este tema debemos recordar el contexto académico de la asignatura. Se supone que la mayoría de los alumnos ya han tenido la oportunidad de familiarizarse con los distintos métodos de demostración de esta doctrina en al asignatura obligatoria de primer curso Lógica Matemática. Por ello, debemos insistir ahora en su capacidad expresiva e inferencial, más que en el desarrollo de los procesos de cálculo de las distintas formulaciones.

    Uno de los objetivos principales de la IA es el procesamiento del conocimiento. Quizás la forma más intuitiva de afrontar dicho problema es analizar el medio más utilizado para expresarlo, es decir, el lenguaje. La lógica tiene como objeto de estudio los procesos de razonamiento expresados a través del lenguaje.

    La lógica como ciencia ha pasado por diversas etapas. En un principio desde su origen en los tiempos de Aristóteles (denominada lógica clásica) se dedicó principalmente a la identificación de las formas de razonamiento humano. En una segunda etapa se definieron un conjunto de cálculos formales, sobre todo a raíz de la formulación matemática de Boole y Fregge, inspirada en el planteamiento de Leibniz de formalizar la lógica como un cálculo para manipular ideas, que finalmente culminó en los Principia Mathematica de Whitehead y Russell en 1913. El estudio de las limitaciones del cálculo (Gödel en 1936 demostró la incompletitud del enfoque axiomático) produjo un cierto desencanto hasta que la aparición de los ordenadores, junto con el abandono de los objetivos de formulación universal de la matemática, ha incentivado nuevos avances en las formulaciones existentes. De entre ellas destacamos dados los objetivos del presente programa la regla universal de resolución y el tratamiento de la incertidumbre realizado en la lógica difusa o borrosa .

    Vamos a presentar en este tema la lógica no como una ciencia, sino como un formalismo básico de representación e inferencia en los problemas de IA. Para ello, repasaremos las distintas formulaciones en orden creciente de capacidad expresiva e inferencial. Aprovecharemos el conocimiento explicado en los dos temas anteriores para formular aquí el método de resolución (el tema fundamental de la mencionada asignatura del primer curso) como un caso de aplicación de la tarea de búsqueda (un método sistemático de búsqueda para comprobar la validez de un razonamiento). Esta nueva perspectiva nos permite introducir en este curso estrategias de búsqueda alternativas desconocidas por el alumno (destinadas a limitar el número de cláusulas consideradas en dicho espacio o bien a dirigir el proceso de búsqueda en el mismo).

    En este recorrido sobre las capacidades expresivas e inferenciales de los distintos formalismos, consideraremos las principales extensiones de la lógica clásica, tales como: Lógica Modal , que trata los conceptos de necesidad y posibilidad y se ha aplicado, por ejemplo, en el razonamiento temporal (a través de la idea de mundos); Lógica Difusa, que trata la imprecisión y se ha utilizado, por ejemplo, en aplicaciones de lenguaje natural (representa la imprecisión propia de la valoración semántica de una sentencia); y Lógicas No Monótonas, que tratan la inconsistencia y se han aplicado, especialmente, para formular el razonamiento basado en el sentido común (Minsky introdujo el término "no monótono" precisamente en este contexto), entre las que destacaremos: lógica no-monótona propiamente dicha, lógica por defecto, y la circunscripción de predicados.

    Finalmente, queremos aclarar que el objetivo de este tema no ha sido entrar en el debate clásico sobre la conveniencia o no de utilizar la lógica como herramienta básica para la representación del conocimiento y para la inferencia. La complejidad inherente a muchos de los sistemas de IA hace aconsejable combinar las técnicas vistas en este tema con otras que analizaremos más adelante. Sin embargo, existen ejemplos de sistemas guiados por principios exclusivamente lógicos. De cualquier forma, en la mayoría de los casos, la lógica viene a ser para la IA lo que la teoría de circuitos para la Informática. Es algo que esta ahí y podemos utilizarlo sin necesidad de sentirnos limitados por su uso.

    Contenido:

  • 5.1 EL USO DE LA LÓGICA EN LA REPRESENTACIÓN DEL CONOCIMIENTO
  • 5.2 LÓGICA DE PROPOSICIONES
  • 5.3 LÓGICA DE PREDICADOS
  • 5.3.1 Ampliaciones de la Lógica de Predicados
  • 5.4 DEDUCCIÓN AUTOMÁTICA: RESOLUCIÓN
  • 5.4.1 Forma Clausulada
  • 5.4.2 Unificación
  • 5.4.3 Método General de Resolución
  • 5.5 EXTENSIONES DE LA LÓGICA CLÁSICA
  • CE="Book Antiqua">5.5.1 Lógica Modal
  • 5.5.2 Lógica Difusa
  • 5.5.3 Lógicas No Monótonas
  • 5.6 CONCLUSIONES
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Borrajo D., Juristo N., Martínez V, y Pazos J. "Inteligencia Artificial: Métodos y Técnicas". Centro de Estudios Ramón Areces. Madrid, 1993.

    Pazos J. "Inteligencia Artificial". Paraninfo, Madrid, 1987.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Brewka, G.,"Nonmonotonic reasoning: Logical foundations of commonsense". Cambridge University Press, NY, 1991. Un análisis muy completo sobre las distintas formulaciones para el razonamiento no monótono.

    Cuena, J. "Lógica Informática". Alianza Editorial, 1985. Realiza un estudio detallado de los fundamentos de los métodos sistemáticos del razonamiento.

    Chang, C-L., and Lee, R.C-T., "Symbolic logic and mechanical theorem proving", Academic Press, 1973. Estudio de los métodos lógicos desde una perspectiva simbólica orientada al desarrollo de programas.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.


    TEMA 6. REGLAS

    Objetivos y desarrollo:

    Ya hemos introducido las reglas en el contexto de los problemas de búsqueda: se utilizan para generar nuevos estados. También hemos estudiado la importancia de las mismas como modelo básico de actuación en la estrategia general de búsqueda análisis de medios-fines, inspirada en el comportamiento humano. Podemos mencionar el origen de su uso en la teoría de autómatas y lenguajes formales, en el que cada gramática viene definida por un conjunto de reglas de reescritura capaces de generar todo un lenguaje, por lo que se conocen también como reglas de producción. Pero, donde realmente adquieren su valor como mecanismo básico de representación del conocimiento es en los llamados sistemas basados en reglas (SBR), conocidos también como sistemas expertos, ya que se han utilizado muy frecuentemente para codificar el conocimiento que un experto tiene para solucionar problemas en un dominio concreto. El programa DENDRAL fue el primer sistema experto basado en este formalismo. Las reglas de producción se utilizaban para generar las estructuras químicas que pudieran explicar los resultados espectrográficos.

    La utilización de las reglas, tal como las conocemos hoy en día, surge en el proyecto MYCIN. Las reglas se utilizan para examinar un conjunto de datos y solicitar nueva información hasta llegar a un diagnóstico. La esencia de este modelo consiste en suponer que el conocimiento es algo "parcelable", formado por relaciones sencillas de causalidad o de secuencialidad, expresadas como "Si tal Entonces cual", o si se prefiere, "Cuando situación entonces acción", que pueden recuperarse cuando son necesarias cuando se pregunta por tal o por cual. El razonamiento realizado consiste en enlazar los fragmentos que tengan tales ("encadenamiento hacia adelante") o cuales ("encadenamiento hacia atrás") coincidentes (en realidad la coincidencia puede ser parcial; por ejemplo, que ambos pertenezcan a una misma categoría de datos). Sobre este esquema básico, y para que el sistema sea eficiente, se agrupan dichos fragmentos por temas (conjuntos de reglas); se ordenan los fragmentos aplicables por diferentes criterios (p.ej. los patrocinadores en GoldWorks); se crean redes que permiten apuntar casi instantáneamente a los tales que dependen de los cuales o viceversa (p.ej. RETE en OPS5), para así evitar tener que recorrer numerosas veces el almacén de todos los fragmentos; se crean fragmentos que hacen referencia a otros fragmentos (metarreglas en TEIRESIAS), en lugar de apuntar al conocimiento del dominio; se escogen los fragmentos que tengan que ver con los últimos tales o cuales generados (p.ej., mecanismos de "actualidad" en OPS5); se prefieren los fragmentos que tengan un mayor número de tales o cuales semejantes a los tales y cuales de la pregunta formulada (p.ej., mecanismos de "especificidad" en OPS5); etc. En los sistemas que utilizan este modelo se distinguen una serie de componentes: la parte del sistema encargada de gestionar y enlazar todos estos fragmentos se denomina Motor de Inferencias; el conjunto de fragmentos se denomina Base de Conocimientos; y los procesos que hacen posible la interacción entre el usuario y el sistema se agrupan en la Interfaz de Usuario.

    A pesar de que los diferentes sistemas basados en reglas coinciden en los puntos esenciales, existen también diferencias importantes entre ellos. La visión que vamos a ofrecer en este capítulo intentará ser lo suficientemente genérica como para abordar todos los aspectos importantes sin restringirnos a un único modelo, y a la vez suficientemente concreta como para que resulte útil a quien vaya a trabajar algún día con una de estas herramientas.

    Contenido:

  • 6.1 INTRODUCCIÓN
  • 6.1.1 Componentes básicos de los sistemas basados en reglas
  • 6.1.2 Herramientas para la construcción de sistemas basados en reglas
  • 6.2 ESTRUCTURA DE LAS REGLAS
  • 6.2.1 Antecedente y consecuente
  • 6.2.2 Uso de variables en las reglas
  • 6.2.3 Comentarios
  • 6.3 COMPARACIÓN DE PATRONES
  • 6.4 TIPOS DE ENCADENAMIENTO
  • 6.4.1 Dependencia reversible e irreversible
  • 6.5 CONTROL DEL RAZONAMIENTO
  • 6.5.1 Control de las agendas
  • 6.5.2 Metarreglas
  • 6.5.3 Otros mecanismos
  • 6.6 EXPLICACIÓN DEL RAZONAMIENTO
  • 6.7 TRATAMIENTO DE LA INCERTIDUMBRE
  • 6.8 EJEMPLOS
  • 6.9 VALORACIÓN
  • 6.9.1 Comparación con los programas basados en comandos
  • 6.9.2 Comparación con la lógica de predicados
  • 6.9.3 Crítica de los sistemas basados en reglas
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Borrajo D., Juristo N., Martínez V, y Pazos J. "Inteligencia Artificial: Métodos y Técnicas". Centro de Estudios Ramón Areces. Madrid, 1993.

    Pazos J. "Inteligencia Artificial". Paraninfo, Madrid, 1987.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Buchanan, B.G., and Shorliffe, E.H., "Rule-Based Expert Systems: The MYCIN Experiments of the Stanford Heuristic Programming Project". Addison-Wesley, Reading, MA, 1984. Explicación completa del proyecto MYCIN y sus derivados. En cada capítulo se analiza una versión corregida y actualizada de los artículos originales aparecidos en las revistas.

    Waterman, D.A., Lenat, D.B. and Hayes-Roth, B. "Building Expert Systems". Addison-Wesley. Reading, MA, 1983. Describe los pasos para construir un sistema experto utilizando el modelo de los SBR.

    Waterman, D.A., "A Guide to Expert Systems". Addison-Wesley. Reading, MA, 1986. Es una colección de 10 artículos que describen las técnicas de desarrollo de diferentes sistemas expertos de Rand Corporation, herramientas para construirlos, y cuestiones relacionadas con su aplicación.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.


    TEMA 7. REDES ASOCIATIVAS

    Objetivos y desarrollo:

    La búsqueda nos ha permitido establecer una estructura general para abordar problemas, pero los métodos aplicados carecían del soporte para representar el conocimiento del dominio que no fuera conocimiento de control. Las reglas nos han proporcionado una estructura general para representar el conocimiento "parcelable" del dominio. Sin embargo, el conocimiento depende esencialmente del contexto y de las relaciones con otros conocimientos. Con el propósito de representar dichas relaciones e inferir las consecuencias que de ellas se derivan, se desarrollaron distintas formulaciones que hoy agrupamos bajo el término redes asociativas, y que son el objeto de estudio del presente tema. En su sentido más amplio, una red está formada por un conjunto de nodos unidos entre sí por cierto tipo de enlaces. Este concepto tiene aplicación en otros muchos campos que escapan a nuestro análisis. Dentro de la informática existen muchos tipos de redes, de naturaleza muy diferente. En algunos casos se trata de sistemas físicos conectados entre sí, tales como las redes de ordenadores. Los trabajos sobre redes neuronales, por poner otro ejemplo, suponen que cada neurona va a ser implementada por un procesador físico, aunque en la práctica la mayor parte de los estudios se realizan sobre simulaciones mediante ordenador. Nosotros vamos a estudiar las redes como modelos teóricos que permiten representar el conocimiento y realizar determinados tipos de inferencias.

    Para evitar problemas de comprensión de los contenidos de este tema, comenzaremos recordando las "Nociones sobre grafos". El concepto de red es casi sinónimo de grafo, aunque este último término posee un significado matemático preciso, mientras que el concepto de red es más amplio. La diferencia principal entre ambos es que en las redes puede haber diferentes tipos de enlaces, e incluso enlaces que unen más de dos nodos. (En redes suele hablarse de enlaces y en grafos de arcos).

    En las redes asociativas, cada nodo representa un concepto (en algunos modelos puede representar también una proposición) y los enlaces corresponden generalmente a relaciones de inclusión, pertenencia, causalidad, o a categorías gramaticales, como verbo principal, sujeto, objeto, complementos, etc. Entre ellas, se conocen como redes semánticas las destinadas a representar o a comprender el lenguaje natural. Veremos más adelante que en la mayor parte de los modelos de redes semánticas, a diferencia de otros modelos de redes asociativas, hay varias clases diferentes de arcos, que se identifican mediante etiquetas o -en la representación gráfica- mediante distintos tipos de flechas.

    Además de las redes semánticas, vamos a estudiar las redes de clasificación y las redes causales. Conviene señalar que en cada uno de estos tres grandes apartados existen varios modelos muy diferentes entre sí, a la vez un fuerte solapamiento entre redes semánticas y redes de clasificación, como iremos viendo en las secciones correspondientes. Por ello, y a pesar de los diferentes criterios propuestos en la literatura, la clasificación de estos modelos sigue siendo difícil.

    Algunos de los formalismos introducidos en este tema han tenido una gran trascendencia en la evolución histórica reciente de la IA. Los grafos de dependencia conceptual son el antecedente de las estructuras de representación utilizadas por otras técnicas que analizaremos en el próximo tema y que han alcanzado una gran divulgación (guiones y razonamiento basado en casos). Las redes causales, más concretamente, las redes bayesianas, son uno de los campos que actualmente reciben mayor interés, por su capacidad de generar predicciones y decisiones correctas, incluso cuando se han omitido elementos importantes de información.

    Pretendemos proporcionar una visión clarificadora e integradora del concepto de red y de sus múltiples aplicaciones, antes que entrar en las discusiones frecuentes sobre las diversas clasificaciones en las que se han agrupado.

    Contenido:

  • 7.1 INTRODUCCIÓN
  • 7.1.1 Concepto de red
  • 7.2 GRAFOS RELACIONALES
  • 7.2.1 Modelo de memoria semántica, de Quillian
  • 7.2.2 Sistema SCHOLAR, de Carbonell
  • 7.2.3 Grafos de dependencia conceptual, de Schank
  • 7.2.4 Problemas de los grafos relacionales
  • 7.3 REDES PROPOSICIONALES
  • 7.3.1 Redes de Shapiro
  • 7.3.2 Representación mediante grafos de Sowa
  • 7.3.3 Inferencia en grafos de Sowa
  • 7.4 REDES DE CLASIFICACIÓN
  • 7.4.1 Extensión e intensión
  • 7.4.2 Jerarquía de conceptos
  • 7.4.3 Mecanismos de herencia
  • 7.4.4 Sistemas taxonómicos / sistemas asertivos
  • 7.5 REDES CAUSALES
  • 7.5.1 CASNET
  • 7.5.2 Redes bayesianas
  • 7.5.3 Ventajas y limitaciones de las redes causales
  • 7.6 COMENTARIOS FINALES
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Nilsson, N.J., "Principles of Artificial Intelligence". Tioga, Palo Alto, CA, 1980. Traducción española: Principios de Inteligencia Artificial. Díaz de Santos, Madrid, 1987.

    Textos específicos:

    Brachman, R.J., and Levesque, H.J., "Readings in Knowledge Representation". Morgan Kaufmann, San Mateo, CA, 1985. Reproduce algunos de los trabajos más importantes de la época. También incluye artículos sobre herencia, razonamiento por defecto, y sobre la relación entre lógica y redes semánticas.

    Díez Vegas, F.J., "Sistema Experto Bayesiano para Ecocardiografía". Tesis doctoral, Dpto. Informática y Automática, UNED, 1994. Tesis doctoral sobre un sistema experto para ecocardiografía basado en redes bayesianas.

    Findler, N.V. (Ed.), "Associative Networks: Representation and Use of Knowledge by Computers". Academic Press, New York, 1979. Reúne los principales estudios sobre redes asociativas

    Neapolitan, R.E., "Probabilistic Reasoning in Expert Systems: Theory and Algorithms". Wiley-Interscience, New York, 1990. Dedicado a las redes bayesianas.

    Pearl, J., "Probabilistic reasoning in iIntelligent systems: networks of plausible inference". Morgan Kaufmann, San Mateo, CA, 1988. Publicación corregida en 1991. Libro clásico sobre redes bayesianas.

    Schank, R.C., "Conceptual information processing". North Holland, Amsterdam, The Netherlands, 1975. Describe los grafos de dependencia contextual en los procesos de comprensión del lenguaje.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.

    Sowa, J.F. "Conceptual Structures: Information Processing in Mind and Machine". Addison-Wesley, Reading, MA, 1984. Analiza los grafos de Sowa como estructuras básicas de representación del conocimiento.

    Sowa, J.F. (Ed.), "Principles of Semantic Networks: Explorations in the Representation of Knowledge", Morgan Kaufmann, San Mateo, CA, 1991. Incluye algunos trabajos recientes sobre este campo.


    TEMA 8. REPRESENTACIÓN DEL CONOCIMIENTO ESTRUCTURADO

    Objetivos y desarrollo:

    En este recorrido que estamos haciendo sobre las diferentes técnicas de representación del conocimiento, hemos estudiado la representación del conocimiento "parcelable" mediante reglas, hemos utilizado las redes para representar las relaciones entre elementos simples de conocimiento: palabras, conceptos, proposiciones, clases, y entre causas y efectos. Vamos a estudiar ahora como relacionar elementos quizás sea más claro decir paquetes estructurados de conocimiento.

    Marcos y Guiones son estructuras de representación del conocimiento estructurado que se utilizan para generar predicciones basadas en regularidades vistas en el pasado (este concepto fue descrito mucho antes en los esquemas del campo de la psicología cognitiva) Los marcos fueron propuestos para superar las limitaciones de la lógica a la hora de abordar problemas como la visión artificial, la comprensión del lenguaje natural o el razonamiento basado en el sentido común; precisamente por que todos estos problemas requieren identificar estructuras complejas de conocimiento que representan una situación conocida. En cuanto a su composición, los marcos recogen un conjunto de información estructurada mediante campos en torno a un elemento de conocimiento. En lo que se refiere a la inferencia, los marcos se organizan en una red cuyos elementos se pretende que se activen cuando convenga. Al contrario que las reglas o la lógica, los marcos son unidades de almacenamiento suficientemente grandes como para imponer una estructura en el análisis de una situación. Nuestro objetivo es mostrar la idea original de marco, para estudiar después algunas de las aplicaciones concretas que se han desarrollado a partir de ella. Hablaremos de PIP, el primer sistema experto basado en marcos, del lenguaje KRL y de las herramientas que utilizan marcos. También comentaremos algunos lenguajes de programación orientada a objetos que incorporan algunas de las ideas propias de este paradigma de representación.

    Por otra parte, los guiones, que surgieron para ampliar las capacidades inferenciales de los grafos de dependencia conceptual (gdc) en la comprensión del lenguaje natural, tienen, al igual que los marcos, una estructura suficiente para contener la descripción de situaciones estereotipadas (una frase necesita analizarse en un contexto). La diferencia estriba en que, en este caso, la composición de dicha estructura está predeterminada. Un guión está compuesto por una sucesión de escenas o eventos que describen el devenir esperado de los acontecimientos en una determinada situación; por ejemplo, comer en un restaurante. Nuestro objetivo es estudiarlos desde una perspectiva doble. Como estructura de representación, analizaremos todos sus elementos: escenas, cabeceras, roles y objetos; especificando la representación interna de estos (p.ej., cada escena se corresponde con un gdc). Como mecanismo de inferencia, veremos los procesos de activación o invocación, selección, y reconocimiento. Una vez completado este estudio podremos analizar sus principales ventajas e inconvenientes.

    La constatación de la rigidez impuesta en la estructura de los guiones, donde se establece una secuencia de episodios con una estructura fija de escenas almacenada en un sólo bloque, nos permite introducir una nueva técnica de representación del conocimiento: los MOPS (memory organization paquets). Los paquetes de organización de memoria son unidades primarias de almacenamiento de una memoria dinámica que sirven para detectar las partes comunes de las experiencias contenidas en distintos episodios. A diferencia de los guiones, los MOPS reúnen, mediante enlaces creados dinámicamente, las escenas y los diferentes elementos de conocimiento que son relevantes para interpretar una determinada situación. Estos enlaces cambian continuamente, en función del descubrimiento de nuevas semejanzas o diferencias que se consideran más significativas para la tarea en cuestión. Este modelo dinámico de memoria pretende integrar conocimiento a partir de episodios específicos con conocimiento generalizado extraído de los mismos episodios, es decir, sirve al mismo tiempo de soporte para el aprendizaje de conocimiento generalizado. Este funcionamiento se apoya en la suposición de que no es posible realizar comprensión sin aprendizaje.

    Los MOPS son la estructura básica de almacenamiento utilizada en el Razonamiento Basado en Casos (RBC). El razonamiento basado en la experiencia aparece hoy en día como una alternativa a las limitaciones observadas en el razonamiento basado en reglas. En este tema de introducción (será objeto de estudio de la asignatura de tercer curso Sistemas Basados en el Conocimiento I) pretendemos ilustrar como los casos se organizan en una red en la que existen enlaces de abstracción y especialización, formando una jerarquía de abstracciones. Estos enlaces juegan un papel esencial ya que determinan qué información y cuándo está disponible. Los casos están formados por conocimientos acerca de las experiencias con las que nos enfrentamos. El RBC tiene como proceso básico de actuación la capacidad de recordar. En este breve análisis comentaremos algunas de sus principales aplicaciones: diagnósticos (CASEY), diseños (CYCLOPS), recetas culinarias (CHEF), disputas laborales (PERSUADER), soluciones de problemas construidas por analogía (PRODIGY), etc.

    Finalmente, para terminar con este último tema sobre las técnicas básicas de representación del conocimiento, después de resaltar las ventajas e inconvenientes de los distintos paradigmas, haremos un pequeño repaso sobre las tendencias actuales de representación, en las que se observa el predominio de una visión descentralizada y flexible del conocimiento con una gran cantidad de elementos organizados en redes (simbólicas, conexionistas o numéricas).

    Contenido:

  • 8.1 CONCEPTO DE MARCO
  • 8.1.1 La propuesta de Minsky
  • 8.1.2 El sistema experto PIP
  • 8.1.3 El lenguaje KRL
  • 8.1.4 Herramientas basadas en marcos
  • 8.2 INFERENCIA EN MARCOS
  • 8.2.1 Facetas
  • 8.2.2 Demonios
  • 8.2.3 Puntos de vista
  • 8.2.4 Paradigmas en la Utilización de los Marcos
  • 8.2.5 Lenguajes de programación orientada a objetos
  • 8.3 GUIONES
  • 8.3.1 Planteamiento del problema
  • 8.3.2 Representación del conocimiento
  • 8.3.3 Inferencia mediante guiones
  • 8.3.4 Ventajas e inconvenientes
  • 8.4 Episodios generalizados: MOPS
  • 8.4.1 Organización dinámica de la memoria
  • 8.4.2 Estructura y tipos de enlaces
  • 8.4.3 Generalización e inferencia
  • 8.5 Fundamentos del razonamiento basado en casos
  • 8.5.1 Objetivos
  • 8.5.2 Memoria de casos
  • 8.5.3 Procesos básicos y ciclo de funcionamiento
  • 8.5.4 Aplicaciones
  • 8.6 COMENTARIOS
  • 8.6.1 Comparaciones entre los distintos paradigmas
  • 8.6.2 Tendencias actuales
  • Bibliografía básica:

    Teoría:

    Mira J., Delgado A.E., Boticario J.G. y Díez F.J. " Aspectos Básicos de la Inteligencia Artificial". Sanz y Torres. Madrid, 1995.

    Ejercicios:

    Galán S.F., Boticario J.G. y Mira J. " Problemas Resueltos de Inteligencia Artificial Aplicada: Búsqueda y Representación". Addison-Wesley. Madrid, 1998.


    Bibliografía complementaria:

    Textos generales:

    Russell, S., and Norvig, P., "Artificial intelligence: A modern approach". Prentice-Hall International, Inc., 1995.

    Rich, E., and Knight, K.,"Artificial Intelligence". McGraw Hill, 1991. Traducción española: Inteligencia Artificial. Segunda Edición. McGraw-Hill, 1994.

    Ginsberg, M., "Essentials of artificial intelligence". Morgan Kaufmann Publishers, 1993.

    Barr, A., and Feigenbaum, E.A., "The Handbook of Artificial Intelligence", Vol. I. William Kaufmann, Los Altos, Calif., 1981.

    Textos específicos:

    Bobrow, D.G., and Winograd, T., "An overview of KRL, a knowledge representation language", Cognitive Science, 1 (1977) 3-46. Describe el lenguaje KRL, llevando a la práctica la propuesta teórica de Minsky sobre los marcos del año anterior.

    Brachman, R.J., and Levesque, H.J., "Readings in Knowledge Representation". Morgan Kaufmann, San Mateo, CA, 1985. En esta colección de artículos sobre técnicas de representación del conocimiento se recoge alguna crítica temprana de los marcos frente a la lógica.

    Kolodner, J. L. "Case-based reasoning". Morgan Kaufmann, 1993. Un análisis actualizado dedicado por entero a analizar el RBC.

    Minsky, M.L. "A framework for representing Knowledge". In: Winston, P. (Ed.), The Psychology of Computer Vision, McGraw-Hill, New York, 1975. Propuesta de los marcos. Es una descripción muy genérica sobre los diversos propósitos que pretendían cubrirse con este tipo de representación.

    Riesbeck, K.C., and Schank, R.C., "Inside Case-Based Reasoning". Lawrence Erlbaum Associates, Hillsdale, NJ, 1989. Proporciona una panorámica general sobre el RBC, incluyendo una descripción breve sobre algunas de las principales aplicaciones del campo.

    Schank, R.C., "Dynamic Memory: a theory of learning in computers and people". Cambridge University Press, Cambridge, 1982. Desarrolla la teoría de MOPS como base para la organización dinámica de la memoria requerida en los procesos de comprensión. Proporciona una descripción de los procesos computacionales apoyada en modelos cognitivos.

    Shapiro, S.C. (Ed.), "Encyclopedia of Artificial Intelligence". John Wiley & Sons, New York, 1992, 2nd edition.