IA Modelo experto
El modelo experto (si se prefiere, el paradigma de sistema experto o "expert system paradigm") fue el paradigma de desarrollo de la IA en los años 70-80 (para algunos, hasta inicios 90). Este modelo se basa en la emulación explícita del conocimiento humano, concretamente de los procedimientos con los que los expertos resuelven problemas propios de su área de conocimiento, aplicando reglas de decisión. En esto se diferencia radicalmente de la IA generativa (modelo actualmente predominante) que se basa en el (auto)aprendizaje de patrones (machine learning).
El modelo experto es un enfoque de IA simbólica que tuvo su auge en los años 70-80 con sistemas como MYCIN (para el diagnóstico de infecciones bacterianas) o DENDRAL (para el análisis de estructuras químicas). Se basa en la premisa de que si podemos capturar el conocimiento declarativo y procedimental de un experto, podremos representarlo formalmente, por lo que una máquina puede reproducir su capacidad de decisión en ese dominio.
Para que un modelo experto funcione se requieren tres componentes:
- A. Una base de conocimientos o repositorio de hechos y reglas de tipo "Si... entonces..." (IF-THEN). No se trata de datos brutos, sino conocimiento estructurado. Esta base de conocimientos contiene: hechos (o datos sobre el dominio), reglas de producción (de tipo *SI condición → ENTONCES conclusión) y, en algunos casos, marcos (frames) u ontologías. Ejemplo simplificado: SI fiebre = alta Y infección = probable -> ENTONCES prescribir antibiótico tipo X
- B. Un motor de inferencias, o mecanismo de razonamiento que aplica las reglas lógicas a los hecho conocidos para deducir nuevas conclusiones. Opera mediante el encadenamiento hacia adelante (data-driven), el encadenamiento hacia atrás (goal-driven) y la lógica proposicional, lógica de predicados o esquemas probabilísticos (ej., factores de certeza en MYCIN).
- C. Una interfaz de usuario, que es el medio mediante el cual el sistema hace preguntas al usuario y entrega una solución o explicación.
En el proceso de creación intervienen dos figuras principales: el experto, que provee de los conocimientos temáticos, y el ingeniero informático, que traduce ese conocimiento a código lógico que la máquina pueda entender.
Dada la naturaleza de la lógica subyacente, estos sistemas son capaces de justificar sus conclusiones: “Recomendé X porque se cumplen las reglas A, B y C”. Esto constituye una ventaja respecto a muchos de los sistemas actuales de aprendizaje profundo (deep learning), que no son capaces de informar de su proceso de toma de decisiones.
El modelo experto no pretende simular conciencia o comprensión profunda, sólo la capacidad decisional especializada mediante:
- Inteligencia simbólica
- Razonamiento explícito
- Conocimiento formalizado y estructurado
- Competencia estrecha (narrow AI)
El modelo experto presenta como puntos fuertes:
- Una alta precisión en dominios acotados
- Capacidad de explicar sus decisiones (trazabilidad del razonamiento), lo que constituye una ventaja crítica en entornos basados en regulaciones y en entornos clínicos.
- Posibilidad de control lógico del sistema
- Economía y estabilidad, ya que no exige ni depende de grandes volúmenes de datos.
Por el contrario, presenta también una serie de debilidades o limitaciones críticas que explican el predominio actual de los modelos IA de tipo Machine Learning.
1 - Limitaciones derivadas del cuello de botella que representa el conocimiento humano (knowledge acquisition bottleneck), dado que extraer conocimiento de expertos humanos es lento, costoso y parcial, dado que mucho conocimiento experto es intuitivo, tácito y no explícito.
2 - Rigidez y falta de capacidad de generalización. Esto modelos son deterministas y rígidos, funcionan bien sólo en el dominio para el que fueron diseñados, pero ni transfieren conocimiento ni aprenden por experiencia, salvo que se reprogramen reglas.
3 - Escalabilidad limitada. Al aumentar el número de reglas crece exponencialmente su complejidad, aparecen conflictos entre unas reglas y otras y el mantenimiento se vuelve problemático. Además, cada actualización requiere de la intervención humana.
4 - Incapacidad para manejar el contexto y la ambigüedad compleja. Dado que el mundo real es incierto, borroso y no completamente formalizable, los sistemas expertos clásicos presentan dificultades para enfrentarse a esta realidad, ya que operan mejor en entornos con variables discretas, ontologías claras y criterios normativos bien definidos.
5 - No capturan aprendizaje estadístico implícito. A diferencia del enfoque IA actual (IA generativa), basado en redes neuronales, el modelo experto no aprende de grandes corpus de datos, no infiere patrones latentes ni construye representaciones distribuidas. Su conocimiento es explícito, no emergente.
RESUMEN COMPARATIVO
| Característica | Modelo Experto (Simbólico) | IA Moderna (Redes Neuronales) |
|---|---|---|
| Origen del conocimiento | Basado en reglas. Ingenieros programando reglas | Basado en datos. Datos y entrenamiento autónomo |
| Tipo de conocimiento | Conocimiento explícito | Representaciones implícitas |
| Aprendizaje | No aprende solo | Aprende por entrenamiento |
| Explicabilidad | Alta (puedes ver la regla que aplicó) | Baja ("caja negra") |
| Flexibilidad | De dominio estrecho. Muy baja, es rígido. | Generalización estadísticas. Muy alta, se adapta a nuevos datos |
| Uso ideal | Tareas con reglas fijas y claras | Areas complejas (visión, lenguaje) |
Consultas
Además de IA Gemini - IA ChatGPT (ambas versión gratuita), consultar...