ESTRUCTURA DEL TESAURO: LAS UNIDADES LÉXICAS

1. NOCIÓN DE Campo semántico


El tesauro consta básicamente un conjunto de términos de un determinado sector científico o técnico, dotados de una estructura, cuyo fin es ayudar a la recuperación de información, a través de facilitar la correcta indización de documentos y de consultas.

Van Slype define campo semántico como “un conjunto de unidades léxicas, ligadas por una estructura de relaciones de significado que permite precisar la significación de cada una de estas unidades”. Maniez, lo explica como “conjunto de términos unidos entre sí por relaciones de parentesco de significado”. Pero aporta un nuevo matiz: distingue, dentro de los campos semánticos: a) los campos léxicos: que agrupan el conjunto de palabras de una lengua relativas a un dominio; b) los campos conceptuales: que agrupan los conceptos de un campo y sus relaciones semánticas. De este modo, distingue entre el nivel verbal y el nivel conceptual de los lenguajes documentales.

En un determinado campo semántico, el significado de un término viene definido o concretado por el significado del resto de los términos y por las relaciones que lo enlazan con otros, de forma que no hay que definirlos, ni aclarar su significado.

Todos los conceptos presentes en cada campo semántico que abarque el tesauro deberán estar reflejados en éste a través de los descriptores que se van a utilizar en la indización. Cada concepto deberá estar representado por un solo término, y cada término debe representar un solo concepto: es el principio de univocidad semántica.

La estructura del tesauro está basada en dos tipos de elementos: unidades léxicas y relaciones semánticas entre ellas. De ambos elementos, es la estructuración semántica la característica que más individualiza al tesauro: ninguno de los otros lenguajes postcoordinados la posee en la misma forma. En cambio, las unidades léxicas forman parte de todos los lenguajes documentales.

2. LAS UNIDADES LÉXICAS

Un tesauro está formado por unidades léxicas. Estas se pueden clasificar en dos tipos que están presentes en todos los tesauros: descriptores y no descriptores.
Algunos autores afirman que existen otros tipos de unidades léxicas: grupos de descriptores y descriptores auxiliares. Chaumier introduce, como una unidad léxica más, lo que denomina infraconceptos. Blanca Gil nombra estos infraconceptos, pero como un tipo de descriptor cuando estos se clasifican según su carga informativa.

2.1. DESCRIPTORES:

2.1.1. DEFINICIÓN
También se denominan términos preferentes.
La AFNOR define descriptor como: “palabra o grupo de palabras incluidas en un tesauro y escogidas de entre un conjunto de términos sinónimos para representar sin ambigüedad un concepto contenido en un documento”. Son palabras simples o expresiones, tomadas del lenguaje natural, que escoge quien construye el tesauro -basándose, en el mayor uso y en su especificidad dentro de la literatura del campo científico al que pertenecen, y en las necesidades de la mayoría de los usuarios – de entre un conjunto de sinónimos. Estas palabras son las que se van a utilizar en la indización de documentos y de consultas.
2.1.2. ORIGEN DEL TÉRMINO
El origen de la palabra descriptor es el latín, y se ha mantenido en nuestra lengua a través del verbo “describir”, que significa, según el diccionario de Casares Quiroga “dibujar o representar una cosa”. Según García Gutiérrez implica dos elementos en los descriptores: deben representar una realidad, y dar una idea de integridad en la representación de esa realidad.
El primer autor que utilizó esta palabra fue Mooers a finales de los años 50, para referirse al primer producto de la indización basada en conceptos. Debemos tener en cuenta que el término descriptor se utiliza para designar las unidades léxicas que estamos tratando.
El término descriptor sólo debe usarse en el contexto del tesauro; sin no es así, debería llamarse “término de indización” o “palabra clave”. García Gutiérrez afirma que un descriptor es toda palabra clave controlada, es decir, una palabra clave extraída para y por la indización, de un vocabulario documental establecido en lengua natural.
Los descriptores se basan en los conceptos que subyacen a ellos, y proceden de la terminología específica de un campo científico o técnico, mediante la que éstos son representados. Esto último supone un beneficio para el usuario.
2.1.1.3. UNIVOCIDAD DEL DESCRIPTOR
Una característica esencial del descriptor, en el tesauro, es su univocidad semántica. Según M. Hudon, “se dice del descriptor que es unívoco puesto que no debe representar más que un solo concepto; recíprocamente, un concepto no debe ser representado más que por un solo descriptor”.

Para eliminar la ambigüedad de los descriptores, Van Slype reseña varios recursos:

▪Las relaciones de equivalencia eliminan la sinonimia.

Para elegir un descriptor, han de contemplarse previamente todas las palabras sinónimas que sirven para denominar un mismo concepto; y de ellas, escoger sólo una, que será la destinada a representarlo; las demás quedan invalidadas para esa función, pero continúan prestando un servicio en el tesauro, reenviando al término preferente.
La polisemia se elimina mediante:
-Relaciones de pertenencia a un grupo semántico
-Relaciones de jerarquía
-Descriptores sintagmáticos o compuestos
-Añadir una explicación al descriptor, de cuatro formas: Un modificador,
que es una palabra que se añade entre paréntesis y fija el significado concreto de ese descriptor. Éste queda constituido por ambos: término y modificador. Naturalmente, el modificador se utiliza si el significado del término no queda suficientemente aclarado por otros medios de los que aquí se citan.
– Una nota explicativa o definición, que no formará parte de su enunciado, y precisa la significación del término en un contexto determinado.
– Una nota de aplicación, destinada a precisar la utilización que se va a hacer de ese descriptor
– Una nota histórica, que indica desde cuándo se utiliza y recuerda el/los descriptores que se utilizaban antes.
2.1.1.4. NORMALIZACIÓN DEL DESCRIPTOR
Los descriptores son términos normalizados, están sometidos a unas normas o reglas que imponen su forma, género, número, grafía, etc. Dichas normas pueden variar dependiendo de los países o instituciones que elaboren el tesauro.

En España existen dos normas UNE para la elaboración de tesauros, que especifican cómo deben establecerse los descriptores.

2.1.1.5. TIPOLOGÍA DE DESCRIPTORES
Se puede establecer una tipología de descriptores según distintos criterios. Por ejemplo:

Por su composición:


-Unitérminos o simples:
representan conceptos mediante una sola palabra. Se utilizan cuando tienen un significado unívoco. Según Hudon, en un principio los descriptores eran unitérminos, pero se permite un cierto grado de precoordinación, en ciertas circunstancias.

-Sintagmáticos o compuestos: representan un concepto utilizando un sintagma nominal o preposicional. Se utilizan cuando el concepto necesita de varias palabras para ser expresado. Cada vez es más común el uso de estos descriptores sintagmáticos para eliminar la ambigüedad característica de algunos descriptores unitérminos, y también por la necesidad de especificar más los conceptos.
En relación con la utilización de términos simples o compuestos, por regla general, los descriptores deben representar en la medida de lo posible términos simples. Así lo especifica la norma une 50-106-90: Directrices para el establecimiento y desarrollo de tesauros monolingües, que además especifica en qué casos un término debe ser compuesto, y en cuáles deben mantenerse los términos simples.

Por su cobertura temática

-Onomásticos: representan un nombre de persona, de institución, etc. Son fáciles de detectar y de recuperar en un texto determinado.
-Geográficos: o territoriales.
Abarcan todo tipo de conceptos vinculados con lugares y sitios. También son fáciles de detectar, pero hay que seleccionar entre los coyunturales y los no relevantes.
Temáticos: o de materias. Son los más difíciles de controlar y valorar, y también los más importantes. Representan cualquier contenido disciplinar.
Cronológicos: Representan fechas, periodos históricos, etc.

2.2. NO DESCRIPTORES:

Reciben también los nombres de términos no preferentes y términos equivalentes. Son los sinónimos o cuasisinónimos de los descriptores, que no han sido escogidos para representar el concepto que subyace a todos ellos, dentro de un tesauro.
No pueden ser utilizados para indizar documentos ni para formular consultas, pero cada uno de ellos reenvía a uno (o más) descriptores. Son puntos de acceso o pasarelas que facilitan el paso del lenguaje natural al lenguaje documental.

La existencia de no descriptores es resultado del deseo de univocidad semántica que se pretende en los descriptores del tesauro: si de un conjunto de palabras sinónimas escogemos solo una de ellas para designar el concepto, las demás quedan invalidadas para dicha función. La aportación del tesauro en este sentido es que no se desechan, no se inutilizan estos términos a efectos prácticos, sino que también pasan a formar parte del lenguaje documental como ayuda al usuario. De forma que, cuando se busca un determinado concepto a través de una palabra que es no descriptor, el usuario la encuentra incluida en el tesauro, y además le remite al término que debe ser utilizado en su lugar.
Términos sinónimos o cuasisinónimos: descriptor y no descriptores