jueves, 17 de julio de 2025

Textos. Procedimientos

Creación de la matriz-base (II)


La segunda parte de esta fase consiste en identificar la tipología a la que pertenece cada segmento, algo necesario para el desarrollo de las fases que restan a este procedimiento de automatización.


Anoto de nuevo que es necesario revisar las entradas sobre la [tipología textual] y su concreción empírica; también es conveniente haber leído [la que precede] a ésta, ya que ambos son complementarios, incluso en su expresión como script (1).

La segunda parte de la creación de la matriz-base consiste, como se espera, en identificar la tipología de cada uno de los segmentos identificados al inicio del procedimiento [en el texto-base], concretando dicha identificación mediante su codificación. En teoría, los siguientes:
  • tf para los segmentos invariables o de texto fijo
  • vi para los segmentos de cuyo contenido informa el usuario (variable-input)
  • vg para los segmentos gramaticalmente condicionados
  • vc para los segmentos condicionados causalmente
Y digo en teoría por ser lo que se espera, pero son posibles unas, y necesarias otras, diversas simplificaciones y cambios respecto a este guion; algunas de ellas ya adelantamos en su momento. 

Como modificación podemos considerar el tratamiento de determinados aspectos formales del texto, como son los saltos de línea (fin de párrafo) y de determinadas condiciones de uso de los signos de puntuación (2), que conllevan la inclusión de las categorías sl y sp.

Como simplificación tenemos lo que deriva de la personalización del documento, lo que afecta a nivel cuantitativo, pero también a nivel estructural (3). Además debo plantear ahora la consecuencia también simplificadora (en este caso a nivel tipológico) de una seria limitación que tiene repercusiones en la categorización de los segmentos textuales: desgraciadamente tampoco ahora estamos en condiciones de automatizar sistemáticamente la cumplimentación de los segmentos causales, así que, salvo las excepciones que se indicará en su momento (4), de momento, estos segmentos serán tratadas como vi, lo que implica que se solicitarán los datos al profesional-usuario de este soporte (5).

Dado que tampoco disponemos de herramientas para automatizar la categorización de los segmentos textuales, ésta será realizada personalmente por el profesional que genera el procedimiento, ayudándose de código OOo Basic, concretamente mediante del tratamiento de los datos mediante un bucle For y el uso de la función InputBox(). Muestro el código a continuación (6)

Dim mTipos(n) As String
For i = LBound(mSegmentos()) To UBound(mSegmentos())
mTipos(i) = InputBox(mSegmentos(i),"Categorización de los segmentos textuales","tf-vi-vg-sl-sp")
Next

Una vez etiquetado cada segmento (7) es cuando corresponde trasladar el contenido de ambas matrices a la hoja MatrizBase (8)...

For i = LBound(mTipos()) To UBound (mTipos())
oTextoMatriz = oHojaMatrizBase.getCellRangeByName( "B" & i+1 )
oTextoMatriz.setString(mTipos(i))
Next

... con el que finalizamos la creación de la matriz-base, pero que no la fase preparatoria, de la que aún quedan cuestiones importantes por abordar.


NOTAS.

(1) Recuerdo que el script expuesto en la entrada anterior se modifica en su formulación final tras lo que se explica en esta entrada. Ya se avisó en su momento de esta posibilidad.
(2) Como ya adelanté en esta misma entrada, [ver esta temática aquí].
(3) En [esta entrada] se desarrolla el tema de la personalización del documento y sus implicaciones
(4) En una entrada pendiente de escribir sobre la causalidad y sus tratamientos simplificadores.
(5) Para que no queden dudas, esto supone que, por el momento, y concretamente en éste, no se empleará la categoría vc.
(6) Recordar que éste complementa y modifica el que se muestra [en esta entrada]. Además es posible formularlo de manera que se simplifique la identificación de las categorías mediante el uso de estructuras condicionales. Esto es especialmente útil para identificar las categorías sl y sp, que además pueden pasar desapercibidos. 
(7) Incluyendo sl y sp, por los motivos ya expuestos.
(8) Lo que modifica de nuevo el script presentado  [en la entrada precedente].

No hay comentarios:

Publicar un comentario

Comenta esta entrada