Tipos de contenido textual
Cuando nos planteamos qué [tipología documental] se podía ajustar mejor al objetivo de automatización, diferenciamos entre los documentos basados en textos (organizados en párrafos) y los documentos basados en tablas. Esta diferenciación resultó positiva en cuanto nos permitió plantear procedimientos específicos para automatizar uno y otro tipo de documento. Pero ha sido suficiente habernos interesado por estas diferenciaciones para darnos cuenta de una cuestión muy interesante; me refiero al contenido textual que podemos observar en ambos tipos de documentos.
Debido a ello, he considerado conveniente tratar esta cuestión (aquí no se agota este tratamiento, claro está) antes de desarrollar una nueva sección (Seguimientos) que se basa precisamente en ese tipo de documentos. De esta forma cuando la abordemos estaremos en condiciones de plantear mayor variedad y complejidad de opciones (aunque no se agoten todas en esta sección en concreto).
Entrado en materia, diré que cuando nos planteamos automatizar un documento, en cualquiera de ellos, y más cuanto más texto contengan, es posible diferenciar varios tipos de contenido. Paso a enumerarlos ahora, aunque no descarto que en versiones posteriores de esta misma entrada (tampoco descarto que esto sea necesario) o en otros abordajes de la cuestión, no tenga que modificar el listado actual (que resulta ser, por tanto, provisional):
- Texto fijo, que podemos considerar constantes de tipo string.
- Texto variable, que asociamos a variables también de tipo string.
Pero dentro de las variables es posible diferenciar, al menos, tres subtipos:
- Las variables que podemos asociar a los datos que introduce el usuario en la fase input mediante algún tipo de interface. El procedimiento más simple en OOo Basic es, como sabemos, asignando a una variable una función InputBox(), mediante la cual el usuario aporta al script el dato que se le solicita.
Llamaré variable-input a este tipo de contenido.
- Las variables asociadas a la concordancia gramatical de género, número y tiempo verbal (al menos estas tres), destacando por su incidencia en la documentación generada el efecto de la concordancia de género, claramente asociada a una variable-input muy concreta como es el género gramatical del sujeto objeto de referencia en el documento. En principio el tratamiento de esta variable requiere una condicionalidad previa que concretamos mediante la estructura If...Then...Else...End If, que requiere dos expresiones gramaticales (género masculino vs. género femenino) como contenido diferenciado de la variable.
Llamaré variable-gramatical a este tercer tipo de contenido.
- Y finalmente (aunque de forma provisional), podemos identificar un tercer tipo de variable, procedente ésta del procesamiento interno de los datos, en primera instancia de los datos aportados por el usuario. Aunque comparte origen con el tipo anterior, en este caso no se trata de implicaciones gramaticales sino de implicaciones de caracterización, categorización, cuantificación...; esto es, de procedimientos de mayor complejidad que requieren un planteamiento que podemos resumir como de árbol de decisiones.
Aquí caben múltiples posibilidades y diferentes niveles de complejidad, por lo que no resulta sencillo plantear soluciones universales o tipologías de soluciones que hagan posible automatizar cualquier texto de forma sencilla. Llamaré a este cuarto tipo de contenido variable-condicionada, a sabiendas de que esta denominación da pie a desarrollo posteriores, ya que es este el objetivo que me planteo ahora.




No hay comentarios:
Publicar un comentario
Comenta esta entrada