Story Transcript
LENGUA H A B L A D A Y ESTRATO SOCIAL: U N ACERCAMIENTO
LEXICOESTADÍSTICO*
INTRODUCCIÓN
E l léxico es u n acervo q u e n o r m a l m e n t e se i n c r e m e n t a a l o l a r g o de t o d a la v i d a de u n i n d i v i d u o . U n v o c a b u l a r i o extenso supone — a s í sea p o t e n c i a l m e n t e , s i n considerar entre otros factores los de o r d e n psicológico y social y l a capacidad p a r a u s a r l o e f i c i e n t e m e n t e — u n a p o s i b i l i d a d m a y o r p a r a c o m p r e n d e r y expresarse. E n otros términos, u n v o c a b u l a r i o más r i c o i m p l i c a u n u n i v e r s o c o n c e p t u a l m a y o r y , en este sentido, u n a m a y o r c u l t u r a — s i n discriminación de l a c o m u n i d a d q u e l a p r o d u z c a — , en l a m e d i d a en que las p a l a b r a s son p o r t a d o r a s de c o n o c i m i e n t o s y los g e n e r a n . A p a r t i r de l o a n t e r i o r y d e l interés q u e p u e d a t e n e r l a e v a l u a ción estadística d e l v o c a b u l a r i o de la l e n g u a h a b l a d a , en esta i n vestigación e x p l o r o algunas posibilidades p a r a d e t e r m i n a r c u a n t i t a t i v a m e n t e el léxico d e l español h a b l a d o en M é x i c o p o r v a r i o s grupos sociales. M e p r o p o n g o establecer las diferencias e n t r e ellos c o n base e n tres índices a los cuales m e referiré in extenso más adel a n t e . P a r a esto m e a p o y o e n u n corpus léxico que se recogió de grabaciones realizadas e n t o d o el país c o n i n f o r m a n t e s de u n o y o t r o sexo, de d i s t i n t a e d a d y c o n d i c i ó n social, y n a t i v o s de d i v e r sas localidades.
Este artículo fue leído en versión menos extensa como ponencia en el V I I I Congreso I n t e r n a c i o n a l de la Asociación de Lingüística y Filología de la América L a t i n a , San M i g u e l de T u c u m á n , A r g e n t i n a , 7 al 11 de septiembre de 1987. NRFH,
X X X V I (1988), num. 1, 131-148
NRFH,
RAÚL ÁVILA
132
XXXVI
T E X T O S Y OORPUS L É X I C O
E l l é x i c o se o b t u v o de 205 textos q u e f u e r o n seleccionados p o r e l g r u p o de i n v e s t i g a d o r e s d e l D i c c i o n a r i o d e l E s p a ñ o l de M é x i c o t o m a n d o c o m o f u e n t e otras t a n t a s e n t r e v i s t a s g r a b a d a s q u e se h i c i e r o n p a r a e l p r o y e c t o de d e l i m i t a c i ó n de las zonas dialectales del país
1
y p a r a el estudio d e l h a b l a de l a c i u d a d de M é x i c o . L o s 2
t e x t o s f u e r o n p o s t e r i o r m e n t e procesados p o r c o m p u t a d o r a
3
e in-
c o r p o r a d o s a l corpus d e l D E M . M á s a d e l a n t e , tras r e v i s a r el cor4
pus m e n c i o n a d o
e n los a r c h i v o s de c o m p u t a d o r a , seleccioné d e l TABLA 1
Número y sexo de los informantes por texto Número de infs.
Sexo Mase
Fem
uno dos tres
83 11
82 15
Total
94
97
M y F*
Total
13 1
165 39 1
14
205
* Entrevistas con informantes de distinto sexo.
Las entrevistas fueron realizadas por el Seminario de Dialectología del C e n t r o de Estudios Lingüísticos y Literarios de E l Colegio de México. C f . , para esto, J . M . L O P E B L A N C H , " L a s zonas dialectales de M é x i c o : proyecto de delimitación", NRFH, 19 (1970), 1-11. F u e r o n hechas p o r el C e n t r o de Lingüística Hispánica de l a U n i v e r s i dad Nacional Autónoma de México y se p u b l i c a r o n en El habla de la ciudad de México. Materiales para su estudio, U N A M , M é x i c o , 1971. E l trabajo de computación se llevó a cabo en el C e n t r o de Procesamiento de Datos A r t u r o Rosenblueth de la Secretaría de Educación Pública. Para la delimitación, l a revisión y el análisis de m i corpus conté con la ayuda de A l e j a n d r o M e d e l y Héctor V á z q u e z , de la institución mencionada. También recibí el apoyo técnico y l a asesoría de la U n i d a d de C ó m p u t o de E l Colegio de M é x i c o . Véase L . F . L A R A y R . H A M C H A N D E , "Base estadística del Dicciona1
2
3
4
r i o del Español de M é x i c o " , en L . F. L A R A , R . H A M C H A N D E e I . G A R C Í A H I -
D A L G O , Investigaciones lingüisticas en lexicografía, E l Colegio de M é x i c o , M é x i c o , 1979, p p . 27 ss. T o m é también los informantes de c u l t u r a media y baja del corpus del D E M . C o m o señalan L A R A y H A M C H A N D E , su u n i d a d de muestreo seleccionada aleatoriamente es " e l párrafo, y u n texto tendrá tantos párrafos como se necesite para alcanzar l a extensión de aproximadamente 2 000 o c u r r e n c i a s " ( p . 31). E l art. cit. apareció originalmente en NRFH. 23 (1974), 245-267.
*
NRFH,
XXXVI
133
L E N G U A H A B L A D A Y ESTRATO SOCIAL
m i s m o los textos que f o r m a n l a base y l a u n i d a d estadística de m i investigación . C o m o puede verse en l a t a b l a 1 , las entrevistas f u e r o n r e a l i zadas e n su m a y o r p a r t e c o n u n solo i n f o r m a n t e ( 8 0 . 5 % ) ; h u b o t a m b i é n u n b u e n n ú m e r o de ellas c o n dos ( 1 9 % ) y u n a sola con tres personas ( 0 . 5 % ) . E n c u a n t o a l sexo de los p a r t i c i p a n t e s , si se c o n s i d e r a n los textos que f u e r o n p r o d u c i d o s p o r u n a o dos p e r sonas del m i s m o sexo, h u b o u n porcentaje bastante similar de h o m bres ( 4 5 . 9 % ) y de mujeres ( 4 7 . 3 % ) . F u e r o n m e n o s ( 6 . 8 % ) las entrevistas en las que p a r t i c i p a r o n dos o tres i n f o r m a n t e s de dist i n t o sexo. 5
E n lo referente a l estrato social o n i v e l c u l t u r a l de los i n f o r m a n t e s (tabla 2 ) , los porcentajes f u e r o n , p a r a el n i v e l alto, 2 2 . 9 % ; p a r a el m e d i o , 3 1 . 7 % ; y p a r a el b a j o , 4 5 . 4 % . C o n los datos recogidos en las entrevistas organicé siete g r u p o s , de acuerdo con l a e d a d de los p a r t i c i p a n t e s , c o n l a finalidad de a d v e r t i r c ó m o esta6
TABLA
2
Edad y nivel cultural de los informantes por texto Nivel
Edad en años 50-59 30-39 40-49
60-69
70-
Total
17-21
22-29
Alto Medio Bajo
0 13 12
10 16 19
8 14 21
14 12 17
7 6 15
4 4 6
4 0 3
47 65 93
Total
25
45
43
43
28
14
7
205
Nota: En los casos de dos o tres informantes se obtuvo la edad promed io.
T r a s formar el archivo mediante la selección de textos exclusivamente de lengua hablada, se revisaron los datos procesados por computadora y se reclasificaron los informantes de acuerdo con las características que menciono infra. Se recogió el texto completo —alrededor de 2 000 palabras, como i n d i qué en la nota a n t e r i o r — de cada una de las entrevistas. Cabe destacar, por o t r a parte, que los textos del D E M fueron codificados, en este caso, por entrevista y no se d e l i m i t a r o n las intervenciones de cada uno de los informantes. Por ese m o t i v o , cuando me refiero a informantes debe entenderse que los considero unitariamente por cada texto para fines estadísticos. E l nivel cultural fue determinado a p a r t i r de características tales como la escolaridad y la ocupación. U t i l i z o tanto esa expresión —empleada por quienes diseñaron las investigaciones originales— como estrato o nivel social con el m i s m o sentido. Personalmente realicé algunas grabaciones de entrevistas para el Atlas Lingüístico del Español de M é x i c o . Cf. notas 1 y 2 para referencias bibliográficas. 5
6
NRFH,
XXXVI
b a c o n s t i t u i d a l a m u e s t r a e n relación c o n esta v a r i a b l e .
Porcen-
134
RAÚL ÁVILA
7
t u a l m e n t e , los g r u p o s de e d a d v a n desde u n m í n i m o de 3 . 4 % r a el g r u p o de 70 o más años h a s t a el m á x i m o de 2 1 . 9 %
pa-
p a r a el
g r u p o de 22 a 29 años. L a z o n a — ú l t i m a v a r i a b l e de l a m u e s t r a — i n c l u y ó , p o r u n a p a r t e , l a c i u d a d de M é x i c o ( 4 3 . 4 % ) y p o r o t r a , las entrevistas hechas e n diferentes localidades del país ( 5 6 . 6 % ) . 8
D e l t o t a l de los t e x t o s procesados p o r c o m p u t a d o r a se f o r m ó u n corpus de 428 899 p a l a b r a s - o c u r r e n c i a o p a l a b r a s gráficas, exc l u y e n d o los n o m b r e s p r o p i o s y los n ú m e r o s escritos c o n
guaris-
m o s , los cuales n o f u e r o n r e g i s t r a d o s en los datos estadísticos q u e ofrezco más a d e l a n t e . D e ese corpus se o b t u v o , de n u e v o m e d i a n 9
te u n p r o g r a m a de c ó m p u t o , u n t o t a l de 23 504 p a l a b r a s d i f e r e n tes o tipos l é x i c o s . M á s 10
a d e l a n t e , después de r e v i s a r l a l i s t a de
t i p o s , los asociamos a los v o c a b l o s c o r r e s p o n d i e n t e s
11
y , tras ser
Para las entrevistas en las que intervenían dos o más informantes consideré la edad promedio de los mismos. E n ningún caso la diferencia de edad de los participantes fue de más de diez años. Las localidades se d i s t r i b u y e r o n prácticamente por todos los estados de la República, de acuerdo con u n a delimitación provisional de las zonas dialectales de México que propuso J . M . L O P E B L A N C H en su a r t . " E l léxico de la zona maya en el marco de la dialectología m e x i c a n a " , NRFH, 2 0 ( 1 9 7 1 ) , m a pa 2 7 y p p . 5 5 ss. Esta delimitación fue tomada en cuenta por quienes determ i n a r o n las fuentes — e n este caso de lengua h a b l a d a — del D E M . Las zonas y las localidades aparecen descritas en el documento de uso interno Manual de información para los miembros del Consejo Consultivo del DEM. Decidí, de acuerdo con mis fines, oponer únicamente dos zonas — l a ciudad de México y la p r o v i n c i a — porque las entrevistas que se hicieron en el interior del país y con las cuales se formó el archivo computado iban desde u n mínimo de 4 hasta u n máximo de 9 por localidad. Ese número de datos resulta n o r m a l m e n t e i n suficiente para obtener resultados estadísticos confiables. L a extensión de m i corpus resulta bastante adecuada para los fines que persigo, si se compara con el que emplearon A . J U I L L A N D y E. C H A N G R O D R Í G U E Z . Su Frequency dictionary of Spanish words, de acuerdo con la descripción de W I L L I A M T A Y L O R P A T T E R S O N , The lexical structure of Spanish, with special consideration for the genealogical and chronologicalproperties, tesis doctoral, Stanf o r d U n i v e r s i t y , 1 9 6 7 , p. 3 , "consists o f the 5 0 0 0 most frequently used words i n a scientifically selected corpus o f 5 0 0 0 0 0 words. These 5 0 0 0 basic words account for 9 7 % of the occurrences of any representative text o f the Spanish l a n g u a g e " . Véase infra (tabla 6 ) el número de vocablos que obtuve para los últimos dos deciles ( 9 0 y 1 0 0 % ) de m i corpus. L a delimitación del conjunto de textos de lengua hablada y la determinación de los tipos fueron hechas también en el Centro de Procesamiento de Datos A r t u r o Rosenblueth. Los programas correspondientes fueron diseñados asimismo por A . M e d e l y H . Vázquez. L a asociación se hizo en forma manual, de acuerdo con los criterios que se deducen del Diccionario de la lengua española de la Real Academia Española, 7
8
%
9
1 0
1 1
NRFH,
XXXVI
L E N G U A H A B L A D A Y ESTRATO SOCIAL
135
procesada esta información electrónicamente, se o b t u v o u n t o t a l de 9 309 vocablos.
ÍNDICES DE RIQUEZA LÉXICA
Es e v i d e n t e que l a c a n t i d a d de vocablos o de tipos q u e se o b t e n gan de u n texto estará e n relación c o n l a extensión d e l m i s m o . D e acuerdo c o n lo a n t e r i o r , se puede i n f e r i r q u e si u n t e x t o de extensión m e n o r p r o d u c e u n m a y o r n ú m e r o de u n i d a d e s léxicas q u e o t r o de extensión m a y o r , el p r i m e r o tiene m a y o r r i q u e z a q u e el s e g u n d o . Esto sucede si se c o m p a r a n los vocablos que o b t u ve p a r a los niveles m e d i o y b a j o , d o n d e el p r i m e r o resulta m á s r i c o pues t u v o u n m a y o r n ú m e r o de vocablos c o n u n c o n j u n t o de textos de extensión m e n o r q u e el segundo. E n c a m b i o , n o se p u e d e llegar a u n a conclusión segura c u a n d o se c o m p a r a u n c o n j u n t o de textos de m e n o r l o n g i t u d c o n o t r o de m a y o r t a m a ñ o y el p r i m e r o tiene u n m e n o r n ú m e r o de vocablos q u e el s e g u n d o , c o m o o c u r r e c o n los q u e se r e c o g i e r o n p a r a los niveles alto y m e dio (véase t a b l a 6 ) . L o s casos c o m o el a n t e r i o r h a n hecho necesario e m p l e a r o t r o s m é t o d o s p a r a p o d e r c o m p a r a r textos de diferente l o n g i t u d y eval u a r su r i q u e z a l é x i c a . E n esta investigación — c o m o he d i c h o — u t i l i z o tres índices p a r a d e t e r m i n a r las diferencias léxicas de las variables de l a m u e s t r a . E l p r i m e r o , l a d e n s i d a d léxica, se 1 2
13
14
2 0 e d . , Espasa-Calpe, M a d r i d , 1984. Dado que no nos fue posible r e c u r r i r a contextos, en los casos de h o m o n i m i a s que pudimos detectar optamos por asignar vocablos diferentes al m i s m o t i p o léxico. Para toda esta labor conté con la ayuda de Sara G i a m b r u n o del C e n t r o de Estudios Lingüísticos y L i t e rarios de E l Colegio de M é x i c o . Cf. PIERRE G U I R A U D , Problèmes et méthodes de la statistique linguistique, Presses Universitaires, Paris, 1960, p. 84: " p l u s u n texte est l o n g plus i l comporte de mots différents". Véase también C H A R L E S M U L L E R , Estadística lingüística, t r a d . A . Q u i i i s , Credos, M a d r i d , 1973, p p . 267 ss. Para decirlo en términos de M U L L E R (op. cit., p. 270), "se puede sistem a t i z a r este método de comparación, considerando dos textos A y B , l l a m a n do N a , N b sus extensiones respectivas, V a , V b la extensión de sus vocabularios. Se puede decir que el vocabulario de A es más rico que el de B si se tiene: bien N a < N b y V a > V b bien N a < N b y V a = V b " . a
1 2
1 3
1 4
Véanse por e j . , G U I R A U D , op. cit.,
p p . 85 ss.,
M U L L E R , op. cit.,
pp.
269
ss. y G U S T A V H E R D A N , The advanced theory of language choice and chance, S p r i n ger, B e r l i n - H e i d e l b e r g - N e w Y o r k , 1966, p p . 72 ss.
136
NRFH,
RAÚL ÁVILA
XXXVI
basa en l a e v a l u a c i ó n i n d i v i d u a l de cada u n o de los t e x t o s . E l
se-
g u n d o , las frecuencias a c u m u l a d a s p o r deciles, se a p l i c a a u n c o n j u n t o de textos de u n e s t r a t o social d e t e r m i n a d o . M e d i a n t e el t e r c e r o c o m p a r o el n ú m e r o de vocablos que se o b t i e n e n en s e g m e n tos extensos de i g u a l l o n g i t u d , los cuales se f o r m a n de n u e v o a p a r t i r de u n c o n j u n t o de
textos.
DENSIDAD LÉXICA
Este índice r e s u l t a de l a división del n ú m e r o de t i p o s léxicos que
T
se o b t i e n e n de u n s e g m e n t o de t e x t o de u n a l o n g i t u d d e t e r -
m i n a d a e n t r e el n ú m e r o N de p a l a b r a s d e l s e g m e n t o . E x p r e s a 1 5
TABLA 3
Densidad Rango 54.5 56.5 58.5 60.5 62.5 64.5 66.5 68.5 70.5 Total
léxica: ordenación por Frecuencia
rangos Porcentaje
4 10 32 35 50 36 27 9 2
2.0 4.9 15.6 17.1 24.4 17.6 13.2 4.4 1.0
205
100.0
Prom: 62.3 - Mediana y Moda: 62.5 - Desv est: 3.35 - Var: 11.2
E l procedimiento ha sido utilizado, entre otros, por P . L . B A L D I , " F a t t o r i sociali dell'abilitá lingüistica nella produzione scritta d i b a m b i n i d i novedieci a n n i " , S I L TA, 1(1974), p p . 335-471. Su índice, sin embargo, difiere del mío en la medida en que él considera sólo las palabras de contenido y no las de función, como yo hago. Véase también la investigación de J . U R E , q u i e n u t i l i z a el m i s m o índice (sólo con palabras de contenido) para el inglés (apud M . A . K . H A L L I D A Y , Language as social semiotics, E. A r n o l d , L o n d o n , 1978, p. 32). De acuerdo con los comentarios de H A L L I D A Y (ibid.) sobre el trabajo de U r e , parece evidente que la densidad está en relación con el medio (la lengua escrita tiene u n a densidad más alta que la hablada) y, dentro de éste, con la función social del lenguaje. E n este sentido, parto de la suposición de que los textos que analizo fueron grabados en u n a m i s m a situación comunicativa: la 1 5
e n t r e v i s t a . Se
refiere también a la densidad léxica H U M B E R T O L Ó P E Z M O R A -
LES, La enseñanza de la lengua materna, M a d r i d , 1984, p p . 56 y 9 1 . Y o m i s m o he u t i l i z a d o anteriormente el procedimiento para evaluar textos escritos por
XXXVI
NRFH,
137
L E N G U A H A B L A D A Y ESTRATO SOCIAL
d o en otros términos, D = T -s- N . P a r a u n a l o n g i t u d e n p a l a bras de N = 100, que es l a u t i l i z a d a en esta investigación, l a d e n s i d a d de u n t e x t o es el p r o m e d i o de las densidades de las u n i d a d e s de 100 palabras que contiene el t e x t o . P a r a el t o t a l de l a m u e s t r a se o b t u v o u n a d e n s i d a d p r o m e d i o m í n i m a de 54 y u n a m á x i m a de 71 (18 valores). 60 - T —
50
-
40
-
30
-
20
-
10
-
—
—
—
;
—i
< W O
w tí
fe
0
J
—i—1—1—i—1—'—i—1—1—t—1—1—i—1—1—i—1—1—i— 54.5
56.5
58.5
60.5
62.5
64.5
— i — —
66.5
68.5
r— 70.5
RANGOS Gráfica 1. Densidad léxica: ordenación por rangos
C o m o he i n d i c a d o supra, l a d e n s i d a d es u n v a l o r q u e se o b t i e ne de cada t e x t o c o n s i d e r a d o i n d i v i d u a l m e n t e . P o r l o m i s m o , es p o s i b l e observar el c o m p o r t a m i e n t o de l a m u e s t r a en su c o n j u n t o c o n a p o y o en esa v a r i a b l e . P a r a ese propósito, y c o n el fin de p o d e r hacer u n m a y o r n ú m e r o de observaciones, hice u n a r e a g r u p a c i ó n de acuerdo c o n u n p r i m e r n i v e l de r a n g o s , a s i g n a n d o a c a d a u n o de ellos el p r o m e d i o de d e n s i d a d de cada dos v a l o r e s . D e esta m a n e r a o b t u v e las frecuencias q u e aparecen en l a t a b l a 3 y q u e se i l u s t r a n e n l a gráfica 1. C o m o se desprende de l a t a b l a m e n c i o n a d a , el c o m p o r t a m i e n t o de l a m u e s t r a p a r a l a característ i c a q u e i n v e s t i g o se acerca b a s t a n t e a u n a c u r v a n o r m a l , lo q u e niños: véase m i a r t . ' ' L é x i c o i n f a n t i l de México: palabras, tipos, vocablos", A CIÉ A (2), p p . 512 ss.
138
NRFH,
RAÚL ÁVILA
XXXVI
p e r m i t e suponer a posteriori que los i n f o r m a n t e s f u e r o n b i e n seleccionados . P a r a d e c i d i r cuáles de las v a r i a b l e s se c o r r e l a c i o n a b a n c o n l a d e n s i d a d , reagrupé los datos en u n segundo n i v e l de rangos: el i n f e r i o r , el c e n t r a l y el s u p e r i o r . Estos tres valores se t o m a r o n c o m o v a r i a b l e lingüística i n d e p e n d i e n t e p a r a , a p a r t i r de ella, c o n siderar cuál o cuáles de las demás variables e r a n s i g n i f i c a t i v a s en c u a n t o a su p o s i b i l i d a d de e x p l i c a r l a m a y o r o m e n o r d e n s i d a d de los t e x t o s . E n otros términos, se trató de v e r q u é variables dependían de l a d e n s i d a d . D e acuerdo c o n los resultados, las v a r i a b l e s que m e n o s e x p l i c a n l a m a y o r o m e n o r d e n s i d a d son l a e d a d , el sexo y el n ú m e r o de i n f o r m a n t e s ; y las q u e más, l a zona y el n i v e l c u l t u r a l . E n c u a n t o a l p r i m e r g r u p o de v a r i a b l e s , n o obstante las pocas d i f e rencias observadas, se p u e d e n c o m e n t a r algunos aspectos, así sea en u n p l a n especulativo a p a r t i r de los i n d i c i o s q u e ofrecen los datos. Si se o b s e r v a n los g r u p o s de e d a d , puede pensarse q u e se sigue a p r e n d i e n d o l é x i c o , a u n q u e r e l a t i v a m e n t e p o c o , a lo l a r go de t o d a l a v i d a a d u l t a , pues l a d e n s i d a d a u m e n t a c o n f o r m e a u m e n t a l a e d a d . E n l o q u e toca a los g r u p o s p o r sexo y p o r 16
17
18
1 9
2 0
2 1
Para obtener los datos estadísticos por computadora se utilizó el Statistical Package for Social Sciences, reléase 1.1, versión para P C . E l programa fue aplicado por Javier Rodríguez de la U n i d a d de Cómputo de E l Colegio de M é xico, q u i e n también me ayudó a interpretar los resultados. A b a r c a r o n , respectivamente, las densidades 54 a 59, 60 a 65 y 66 a 7 1 . E n otros términos, cada uno de los rangos de este segundo nivel corresponde al promedio de cada tres rangos del p r i m e r o y a 6 promedios de densidad. Para esto se utilizó la prueba de x cuadrada. D e acuerdo con ella, se parte de la suposición, por ejemplo, de que el nivel c u l t u r a l y la densidad son independientes. Si los resultados contradicen esta llamada "hipótesis n u l a " , se comprueba que las variables están correlacionadas en m a y o r o menor grado de acuerdo con el m a y o r o menor valor de x . Véanse estos valores para las variables zona y nivel en las tablas 4 y 5 respectivamente. L a significación (sign en las tablas) se refiere a la hipótesis n u l a y a la p r o b a b i l i d a d de que se confirme. Se confirmó que la zona y el nivel cultural eran las variables de mayor peso en relación con la densidad incluso mediante desagregaciones de datos. Por ejemplo, se consideró separadamente cada grupo de la variable sexo y su densidad promedio por nivel cultural y se vio que las diferencias significativas aparecían en los niveles. Baso mis observaciones en los datos que obtuve mediante la reagrupación de los grupos de edad en tres rangos: de 17 a 29, de 30 a 49, y de 50 o más años. E n cambio, si se comparan estos resultados con los que obtuve para n i ños (art. c i t . , p. 514), las diferencias son m u y significativas: de u n a densidad 1 6
1 7
1 8
2
1 9
2 0
2 1
NRFH,
XXXVI
139
L E N G U A H A B L A D A Y ESTRATO SOCIAL
n ú m e r o de i n f o r m a n t e s , t a l parece que se emplea más léxico c u a n d o e n u n diálogo i n t e r v i e n e n h o m b r e s y m u j e r e s . E n relación con las v a r i a b l e s que sí r e s u l t a r o n tener u n a a l t a correlación c o n l a d e n s i d a d , p u e d e destacarse l o siguiente. E n c u a n t o a las zonas ( t a b l a 4 ) , el p o r c e n t a j e de textos d e l r a n g o s u p e r i o r ( R S ) p a r a l a c i u d a d de M é x i c o ( 6 8 . 4 % ) es 3 6 . 8 % más alto q u e el de las otras localidades ( 3 1 . 6 % ) . E n c a m b i o , en los rangos c e n t r a l ( R C ) e i n f e r i o r ( R I ) , los porcentajes correspondientes son m á s altos en l a p r o v i n c i a ( R C = 5 4 . 5 % , R I = 8 2 . 6 % ) que e n l a c i u d a d de M é x i c o ( R C = 4 5 . 5 % , R I = 1 7 . 4 % ) : h a y 9 . 0 % m á s textos en R C y 6 5 . 2 % más e n R I e n el i n t e r i o r d e l país q u e e n l a c a p i t a l . P o r o t r a p a r t e , si se a n a l i z a cada z o n a i n d e p e n d i e n t e m e n t e , se a d v i e r t e q u e en l a c i u d a d de M é x i c o es m a y o r el p o r c e n t a j e de textos de R S ( 2 9 . 2 % ) que de R I ( 9 . 0 % ) , m i e n t r a s q u e e n las otras localidades sucede l o c o n t r a r i o : son más los de R I ( 3 2 . 8 % ) que los de R S ( 1 0 . 3 % ) .
TABLA
Densidad
4
léxica: zona y rangos superior, central e inferior Zona Otras l.
o Ö
ai Oí
Cd. Méx.
Total
Gran tot.
Superior
12 31.6 10.3
26 68.4 29.2
38 100%
38 18.5%
Central
66 54.5 56.9
55 45.5 61.8
121 100%
121 59.0%
Inferior
38 82.6 32.8
8 17.4 9.0
46 100%
46 22.4%
Total Porcnt.
116 100%
89 100%
Gran tot. Porcnt.
116 56.6%
89 43.4%
205 100.0%
X = 22.56 - Sign = 0.0000 2
p r o m e d i o de 47 (edad promedio de 9 años) se pasa a otra de 62.3 (ambas para los respectivos corpas). Esto permitiría c o n f i r m a r la intuición de que el aprendizaje — e n este caso del léxico— es m u y alto entre la niñez y la edad adulta.
RAÚL
140
NRFH,
ÁVILA
XXXVI
L a c o m p a r a c i ó n de los niveles c u l t u r a l e s ( t a b l a 5 ) m u e s t r a asim i s m o diferencias i m p o r t a n t e s y c l a r a m e n t e s i g n i f i c a t i v a s . Si se c o n s i d e r a n de n u e v o cada u n o de los r a n g o s , d e l 100% de textos del R S , 4 7 . 4 % p r o v i e n e n del n i v e l alto, 3 6 . 8 % del m e d i o y 1 5 . 8 % d e l b a j o . E n t r e los niveles e x t r e m o s a l t o y b a j o h a y u n a d i f e r e n cia de 3 1 . 6 % más textos en el p r i m e r o q u e en el segundo. P o r o t r a p a r t e , los textos d e l n i v e l alto se r e p a r t e n e n 3 8 . 3 % p a r a R S , 5 3 . 2 % p a r a R C y 8 . 5 % p a r a R I . E n el n i v e l b a j o , en c a m b i o , se i n v i e r t e n las p r o p o r c i o n e s p a r a las categorías e x t r e m a s : 6.5 % de los textos aparecen en R S , 5 4 . 8 % en R C y 3 8 . 7 % e n R I . L a m a y o r d i f e r e n c i a se p r e s e n t a en R I e n t r e los niveles alto ( 8 . 7 % ) v b a j o ' 7 8 , 3 % } : el seeundo grupo p r o d u j o 69 6% m á s textos de ; . « l c :a/i¡.¿- q>¿t el ,/;;_. r
TABLA 5
Densidad
léxica: nivel cultural y rangos superior, central e inferior Nivel cultural Alto
o bß a a
Medio
Bajo
Total
Gran tot.
Superior
18 47.4 38.3
14 36.8 21.5
6 15.8 6.5
38 100%
38 18.5%
Central
25 20.7 53.2
45 37.2 69.2
51 42.1 54.8
121 100%
• 121 59.0%
Inferior
4 8.7 8.5
6 13.0 9.2
36 78.3 38.7
46 100%
46 22.4%
47 100%
65 100%
93 100%
Total
Porcnt. Gran tot. Porcnt.
47 22.9%
65 31.7%
93 45.4%
205 100.0%
x - 3 9 . 3 3 - Sign = 0.0000 2
F R E C U E N C I A S A C U M U L A D A S POR DECILES
C o m o he c o m e n t a d o supra, el índice de d e n s i d a d p r o v i e n e de cad a t e x t o considerado i n d i v i d u a l m e n t e . E n ellos el léxico se p r e senta en relación p r o p o r c i o n a l a su m a y o r o m e n o r f r e c u e n c i a . E n otras p a l a b r a s , en u n t e x t o se r e f l e j a n t a n t o las palabras de
XXXVI
NRFH,
141
L E N G U A H A B L A D A Y ESTRATO SOCIAL
frecuencia alta como las de media y las de baja, según sus respectivas probabilidades. En este sentido, la densidad evalúa el léxico que llamaré normal. Frente a lo anterior, para el análisis de frecuencias acumuladas me he basado en conjuntos de textos de diferente longitud. No obstante esto, el procedimiento permite evaluar comparativamente el vocabulario de los conjuntos, ya que la extensión de cada uno de ellos —sus respectivas frecuencias totales— no condiciona el número de vocablos que se obtienen en determinados deciles, como el 7 (70% de frecuencias) y el 8 (80%). Por otra parte, dado que se requiere ordenar los vocablos en orden descendente de frecuencias , las diferencias correspon22
o
o
23
d
í
-
v
i
Jr.„
•.u^o-iia * --át*s Eii
1 1
!c« i ] f \ ;