1 de septiembre de 2015

Introducción

Marco teórico
  • Teoría / Trier
Problemas
  • Estructura del léxico / Jackson y Amvela
Objetivos
  • Objetivo / Hiperónimos
Hipótesis
  • Hipótesis / Cuéllar
Metodología
  • Método / Selección
Problema 1
  • Definición de los campos semánticos
Problema 2
  • Componentes de los campos semánticos
Problema 3
  • Estructura de los campos semánticos
Lexicología
  • Léxico universal
Lexicografía
  • Diccionario universal
Lingüística computacional
  • Lingüística computacional / Computador
------------------------------
Colección de palabras
Introducción

En Español Internacional encuentra los últimos adelantos de la lingüística, recopilados de cuatro lenguas modernas, españolfrancés, holandés e inglés, que pretenden dar respuesta a los interrogantes más importantes relacionados con el lenguaje y el pensamiento humano.
 
Pensamiento humano
  • Léxico / Palabras
  • Sintaxis / Orden
Lenguaje
 
El lenguaje es una habilidad natural del hombre que sirve para expresar el pensamiento organizado en frases.
 
Los dos componentes básicos del lenguaje son el léxico, o conjunto total de palabras, y la sintaxis, o conjunto de reglas para combinarlas y modificarles el sentido (gramática). Esto quiere decir que no significa lo mismo el hombre ataca al perro que el perro ataca al hombre, aunque sean exactamente las mismas cinco palabras.

La gramática se ha estudiado extensivamente desde Panini, gramático hindú (siglo V o IV a. C.), pero el léxico, que es el componente más importante de la lengua, es prácticamente desconocido. Por ejemplo, en el artículo del lenguaje de la Wikipedia brilla por su ausencia, aparece como un término más de la semántica.

Léxico

El léxico es el conjunto total de palabras de una lengua. Es un concepto abstracto porque es imposible conocerlo por completo.

La estructura del léxico refleja la estructura de la mente, como lo demuestra el orden consecutivo que tienen las definiciones, por ejemplo, oro, dorado, dorada, eldorado y no todo lo que brilla es oro.

Existen dos métodos para organizar las palabras. El primer método es el orden alfabético, que sirve para facilitar la búsqueda, como se usa en los diccionarios tradicionales.

Y el segundo sistema es el temático, que sirve para estimular la escritura porque las palabras están ordenadas según el contexto, como en los tesauros. Por ejemplo, en un artículo se agrupa el vocabulario de una carrera de caballos en un hipódromo, caballo, jockey, carrera, apuesta, veloz, etc. (Roget 1852).

Pero ninguno de estos dos sistemas permite conocer la estructura del léxico. El diccionario mental en el cerebro no tiene organizadas las palabras en orden alfabético porque la memoria funciona por asociación de ideas.
 
El mayor reto de la lingüística en el siglo XXI es descubrir la estructura del lenguaje natural para aplicarlo al lenguaje computacional. El léxico es el mayor obstáculo para la inteligencia artificial, falta mucho para que un robot entienda el significado de la palabra mano.

F. Cuéllar Moyano
Lingüista (U. de los Andes, 1997)
Máster en lengua y literatura española (U. de Ámsterdam, 2007)
Escritor (Bogotá 2012)
------------------------------
Marco teórico

Jost Trier
Según J. Trier, lingüista alemán (1894–1970), un campo semántico es un conjunto de palabras agrupadas por relaciones de significado, en un marco conceptual específico, que sirven para expresar una visión del mundo (1931).

Trier es el padre de la lexicología, el área de mayor desarrollo de la lingüística en el siglo XXI, a pesar del artículo escueto de la Wikipedia, que desconoce esta teoría por completo.

La teoría de los campos semánticos tiene diversas aplicaciones, aunque su mayor hito es haber sido la precursora de la lingüística cognitiva.
La teoría de Trier es la base de esta investigación que intenta determinar, delimitarordenar los campos semánticos, con el fin de establecer la estructura del léxico.
------------------------------ 
Problemas
¿Cuál es la estructura del léxico?
Llevamos 24 siglos haciéndonos la misma pregunta que sigue sin resolver.

La estructura del léxico siempre ha intrigado a los grandes pensadores. Desde Aristóteles, filósofo griego (384–322 a. C.), se ha tratado de encontrar la estructura del léxico pero la labor ha sido infructuosa debido al volumen, que comprende más de 80.000 palabras, con miles de acepciones o significados diferentes de la misma palabra. Por ejemplo, la palabra mano contiene 36 acepciones y unos 250 modismos, significa que podría estar presente en todos los campos semánticos, sin incluir las expresiones idiomáticas.
El lexicólogo que intente asignar a todas las palabras un campo semántico enfrenta tres problemas: definirlos, delimitarlos y ordenarlos. La existencia de estos problemas indica que el vocabulario no está hecho de campos semánticos bien definidos donde cada palabra tiene un lugar fijo (Jackson y Zé Amvela 2006).
 
Los tres problemas se podrían resumir de la siguiente manera:
  • Problema 1: ¿Cuáles son los campos semánticos?
  • Problema 2: ¿Cuáles son sus componentes?
  • Problema 3: ¿Cómo están estructurados?
------------------------------ 

Objetivo

El objetivo principal de esta investigación es establecer los hiperónimos de todos los campos semánticos con el fin de delimitar el léxico de cada una de las áreas del conocimiento humano.  
 
Estos tres problemas se podrían resolver de la siguiente manera:

  • Problema 1: Definir los campos semánticos
  • Problema 2: Delimitar los campos semánticos
  • Problema 3: Ordenar los campos semánticos

De acuerdo a esta teoría, la única forma de delimitar los campos semánticos es por medio de los hiperónimos. Para establecer los límites se asume que todas las palabras son objeto de estudio en un área del conocimiento humano, por ejemplo, las palabras basura, gracias, hueco y prostituta, son estudiadas por algún científico en su propia disciplina.

De esta manera cada palabra tiene un lugar fijo en el vocabulario y se determina el número exacto de sinónimos, hipónimos y cohipónimos.
------------------------------
Las palabras se almacenan por categorías
Hipótesis

La teoría de la semántica estructural es utilizada por Cuéllar como telón de fondo para formular su hipótesis sobre la estructura del léxico.

Esta investigación se basa en la hipótesis de que el léxico está estructurado en campos semánticos claramente definidos y delimitados, por tanto, todas las palabras tienen un lugar único y fijo dentro de la jerarquía del léxico.
  • Los campos semánticos están claramente definidos y delimitados.
  • Todas las palabras se pueden clasificar en algún campo semántico.
  • Los campos semánticos se ordenan por hiperónimos.
Los campos semánticos se ordenan dentro de una jerarquía léxica basada en la subordinación del significado.
La estructura del léxico no es subjetiva ni intuitiva, como se ha creido hasta ahora. Anteriormente, los lexicólogos ordenaban los campos semánticos a su parecer. El primer campo semántico para Roget (1852) es la ginecología, comienza con el parto (Medicina), y para Casares (1942), un siglo después, es Dios (Teología), que en la estructura de Cuéllar aparece de último por ser el más abstracto de todos.

No me parece lógico empezar a ordenar el léxico con un tema tan abstracto como la teología. Estoy seguro que esas no son las primeras palabras que aprende un niño.
------------------------------
Metodología

Muestra
Para esta investigación se desarrolló un método de análisis lexicológico porque no existe ninguno.

Las palabras se analizan desde el punto de vista léxico, de acuerdo a los diez campos semánticos establecidos.

Se hizo uso de la etimología para poder comparar el léxico de las lenguas romances y germánicas.

De ahora en adelante es posible cuantificar y ordenar de manera alfabética y cronológica cada campo semántico.
------------------------------
Problema 1

¿Cuáles son los campos semánticos?
El principal interrogante de la teoría de los campos semánticos es cuáles son los campos semánticos.

No existe una definición precisa de los campos semánticos, ni tampoco se han podido delimitar. Los autores que hablan de campos semánticos, como E. Coseriu, B. Pottier, J. Lyons y J. Greimas, han insistido en la necesidad metodológica de fijarles límites. Este es el mayor problema que todavía no sea resuelto de manera satisfactoria.

Aristóteles clasificó en el Organon el conocimiento humano en diez categorías, cada una asociada a una clase gramatical (sustantivo, adjetivo, verbo, adverbio). Él pensaba que la naturaleza de la mente determina que todos los seres humanos tengan las mismas experiencias conceptuales.

Así como Aristóteles escogió diez categorías, Cuéllar clasificó las palabras en diez campos semánticos, un número arbitrario que se basa en el volumen léxico establecido en esta investigación.

El léxico de una lengua se puede clasificar en diez campos semánticos.
Los campos semánticos se definen de acuerdo a los hiperónimos, por ejemplo, mueble es el hiperónimo del diseño industrial (interiorismo).

Estos son los 34 campos semánticos registrados en los diccionarios de la investigación. Algunos campos semánticos son inexistentes en los diccionarios de español, como el diseño textil o la cosmética, a pesar de que el volumen léxico es mayor al de la astronomía o la veterinaria.

Campos semánticos / Orden alfabético
Con los campos semánticos claramente delimitados se pueden analizar todas las palabras de una lengua desde el punto de vista lexicológico. Por ejemplo, el verbo escarbar pertenece a cuatro campos semánticos diferentes.
  • 1. Rayar o remover repetidamente la superficie de la tierra, ahondando algo en ella, según suelen hacerlo con las patas el toro, el caballo, la gallina, etc. (zoología)
  • 2. Mondar, limpiar los dientes o los oídos sacando la suciedad introducida en ellos. (medicina)
  • 3. Avivar la lumbre, moviéndola con la badila. (ingeniería)
  • 4. Inquirir curiosamente lo que está algo encubierto y oculto, hasta averiguarlo. (derecho)
 ------------------------------
Problema 2
¿Cuáles son sus componentes?
La principal dificultad radica en escoger las palabras fundamentales de cada campo semántico. El campo semántico de muchas palabras parece evasivo, no se sabe si el tomate debe ser asignado a la fruticultura o la horticultura, si el tractor pertenece a la ingeniería mecánica o a la agricultura o, finalmente, si el sabor es un término de la medicina o de la gastronomía.

Este problema se presenta porque las definiciones son inconsistentes y no siguen un patrón regular ni sistemático, algunas palabras se definen con sinónimos y otras con explicaciones. La definición de chimpancé no se parece a la de saraguate ni a las definiciones de los otros miembros del campo semántico de la primatología.

Además, las definiciones tienen errores de marca que ubican las palabras en los campos semánticos inapropiados, los países equivocados y el uso y la época desactualizados. Pueda ser que todos los miembros del campo semántico de la retórica estén marcados con el dominio, pero no ocurre lo mismo con la arqueología, la sociología o la antropología. Y es imposible esperar que los términos asociados al turismo, la cosmética o el folclor tengan una marca especial.

¿Cuáles son los hiperónimos del derecho?
Lista de hiperónimos

Para delimitar los diez campos semánticos se necesitan 105 hiperónimos. Esto quiere decir que cada palabra tiene únicamente un lugar dentro de la estructura del léxico.
Con los avances de la ciencia se podrá comprobar si esta jerarquía léxica corresponde con el mapa semántico en el área del lenguaje del cerebro.
------------------------------
Problema 3
¿Cómo se ordenan los campos semánticos?
Estructura del léxico
La estructura del léxico es completamente desconocida. Hasta ahora no se ha podido descubrir la jerarquía de los campos semánticos, por ejemplo, se desconoce si la zoología precede a la paleontología, o viceversa.
El orden de las palabras refleja la estructura del léxico. Las palabras se agrupan por relaciones de significado en grandes estructuras llamadas campos semánticos.
La jerarquía léxica es el orden en que se subordina un campo semántico respecto a otro por medio de un hiperónimo. Por ejemplo, para definir el campo semántico de la medicina es necesario definir primero la zoología, porque el hombre es una clase de animal.

Significado
Campo
Hiperónimo
Natural
Física
materia
 
Geografía
tierra
 
Biología
organismo
 
Medicina
hombre
Artificial
Gastronomía
alimento
 
Agronomía
cultivo
 
Ingeniería civil
camino
 
Ciencia política
gobierno
 
Arte
obra
 
Filosofía
doctrina
Hiperónimos

El léxico se ordena de acuerdo al significado del hiperónimo. En la estructura del léxico se ubican primero las palabras de significado más concreto, seguidas de las más abstractas.

Las palabras que definen la materia, como cosa, se encuentran en la cúspide del léxico, y al final se ubican las palabras que definen las ideas, como doctrina.
Todas las lenguas modernas comparten los mismos hiperónimos, por ejemplo, el campo semántico de la música se define con los hiperónimos canto, instrumento y baile.

¿La gastronomía es un arte o una ciencia?
El léxico de la gastronomía es básicamente concreto. Sin embargo, en la Wikipedia la gastronomía todavía figura entre las artes, aunque no se estudia en ninguna escuela de artes ni los gastrónomos son artistas.

Después de determinar la cantidad de campos semánticos se ordenan de acuerdo al significado, del campo semántico más concreto al más abstracto. La jerarquía está determinada por el hiperónimo materia.
------------------------------
Ciencias (Wikipedia) 

Léxico universal
 
Los campos semánticos son un reflejo de la realidad que corresponde a las áreas del conocimiento humano. La hipótesis de esta teoría formula que cada una de las palabras forma parte de la terminología de algún especialista.

Cuéllar propone la teoría del léxico universal, un vocabulario compuesto de préstamos léxicos comunes a todas las lenguas del mundo, como las palabras café, califa y camello, donde las palabras locales son meras creaciones de la etimología popular, como adelita, alaraco y caneisito.

El léxico universal es el léxico compuesto por los préstamos léxicos comunes a todas las lenguas, como las palabras melodía, piano o ballet, contrario al léxico local, que se compone de palabras que se usan exclusivamente en una lengua y tienen muy pocas probabilidades de pasar a otras lenguas, como los términos españoles tonada, guitarrazo o panderetólogo.

A partir de ahora se puede analizar el léxico de manera más eficiente porque se pueden predecir con certeza las palabras presentes en el léxico de las todas las lenguas modernas.
---------------------------

¿Se puede editar un diccionario universal?
Diccionario universal

Cuéllar propone la creación de un diccionario universal que contenga todos los préstamos léxicos comunes que forman parte del léxico universal, como los elementos de la tabla periódica, las unidades de medida en física, las eras geológicas o los periodos prehistóricos.

Estas palabras forman parte del patrimonio léxico universal, es necesario catalogarlas.

El diccionario universal es un diccionario etimológico que contiene todas las palabras del léxico universal, con una definición estándar y la fecha de registro en cada una de las lenguas.

Si un lexicógrafo quisiera compilar un diccionario universal, debería empezar con el adjetivo aarónico o con el sustantivo aaronita, que son las dos primeras palabras usadas por todas las lenguas del mundo para definir el vocabulario de la Biblia. Para Cuéllar estas son realmente las dos primeras palabras de la lengua universal.
  1. aarónico adj (al. / esp. / fr. / hol. / ing. 1821 / it.)
  2. aaronita m, f (al. / esp. / fr. / hol. / ing. / it.) 
No es un sueño imposible de alcanzar, el Diccionario etimológico de la zoología de Cuéllar tiene registrados todos los mamíferos ungulados, con nombre común y nombre científico. La misma metodología se puede aplicar al resto de los animales, a las plantas y a todos los componentes del léxico universal.
------------------------------ 
¿Se debe codificar el léxico?
Lingüística computacional

El léxico universal se compone de las palabras que están presentes en todas las lenguas del mundo, como las palabras camello, delfín, elefante, león y tigre. Estas palabras son patrimonio lingüístico de la humanidad, forman parte del léxico técnico de cualquier lengua donde se estudie zoología.

La próxima etapa es codificar cada una de las palabras recolectadas con un código de barras para que cualquier robot entienda sin confundirse por las acepciones. De esta manera, el robot interpreta un número en vez del significado de una idea.
En esta codificación se numera cada una de las acepciones con una letra minúscula y los nombres propios con una letra mayúscula.

Botánica
  • 3.1 botánica
  • 3.1 planta
  • 3.1.1 árbol
  • 3.1.11 abedul
  • 3.1.12 abeto
  • 3.1.41 planta textil
  • 3.1.411 abacá (Musa textilis) / planta
  • 3.1.411a abacá / fibra
  • 3.1.411b abacá / tejido
------------------------------------
Lingüística
------------------------------
Bibliografía
 
Cuéllar Moyano, F. Lexicología [en línea]. Bogotá: Español Internacional, 2009. Disponible en: http://espanolinternacional.blogspot.com/ [día de mes de 2015].

Este blog es personal, de carácter pedagógico, sin ánimo de lucro, todos los enlaces, fotos y videos son cortesía de la red.

Referencias

Guiraud, P. La semántica. Bogotá: Fondo de Cultura Económica, 1997.
Jackson, H. y E. Zé Amvela. Words, Meaning and Vocabulary, An Introduction to Modern English Lexicology. Londres: Continuum, 2006.

Kipfer, B. A. The Order of Things: Hierarchies, Structures, and Pecking Orders. Nueva York: Workman, 2008.

Martínez de Sousa, J. Diccionario de lexicografía práctica. Barcelona: Biblograf, 1995.
 
Moliner, M. Diccionario de uso del español, 2ª ed. Madrid: Gredos, 1998.
Mortureux, M-F. La lexicologie entre langue et discours, 2ª ed. París: Armand Colin, 2008.
Palmer, F. R. Semantics, 2ª ed. Cambridge (Inglaterra): Cambridge University Press, 2004.
© 2007 Español Internacional