La fonética acústica se ocupa del estudio del mensaje o sea de la onda sonora que se transmite entre el emisor y el receptor. El conjunto de movimientos fisiológicos por parte del emisor tiene por objetivo la producción de una onda sonora que podrá transmitirse al receptor. El estudio de la fonética queda incompleto sin examinar esta segunda fase de la fonética, que es la transmisión del sonido, porque sin la onda sonora, no puede haber comunicación por vía oral. Este capítulo contiene una breve introducción al estudio de ondas, en particular de la onda sonora, para demostrar mejor cómo los movimientos articulatorios del emisor producen la onda sonora y cómo la onda sonora llega a los oídos del receptor.
Una onda es la transmisión de energía a través de un medio dado. Para entender esta definición mejor, vale examinar unos ejemplos. El primer ejemplo es el de una cuerda como se ve en la Fig. 6.1. Si se extiende la cuerda entre dos personas y una de las dos alza y baja el extremo suyo rápidamente, la energía resultante viaja en forma de onda a través de la cuerda hasta llegar al otro extremo.1 Es importante destacar que no es la cuerda misma lo que viaja entre las dos personas, sino la energía dirigida a la cuerda. La energía, ocasionada por el movimiento del brazo de la primera persona, viaja entre las dos personas por medio de la cuerda. Es de notarse que el movimiento de un punto específico de la cuerda ocurre en el eje vertical, mientras que la propagación de la onda en sí ocurre en el eje horizontal.
El segundo ejemplo es el de una piedra tirada al agua como se ve en la Fig. 6.2. Si se tira una piedra a un charco, se forman ondas que viajan en círculos concéntricos desde el punto de impacto hasta las orillas del charco.2 Otra vez es importante señalar que no es el agua lo que viaja desde el punto de impacto hasta las orillas, sino que es la energía dirigida al agua lo que viaja. Esto se puede comprobar al poner un barquito en el agua y observar que el barquito no viaja con las ondas a la orilla, sino que sube y baja en el eje vertical, mientras que la energía de la piedra tirada viaja en el eje horizontal a través del medio del agua.
El tercer ejemplo es el del péndulo. El movimiento del péndulo, representado en la Fig. 6.3, no presenta la misma imagen de una ondulación tan visible como en los primeros dos ejemplos. Sin embargo, el movimiento es una onda, pues representa la transferencia de energía a través de un medio. En la Fig. 6.3, se puede observar que al pasar por la posición de equilibrio (la posición 3), el péndulo pasa por la posición 4, decelerando hasta llegar a parar en la posición 5. De allí comienza a acelerarse, pasando de nuevo por la posición 4 hasta llegar de nuevo a la posición de equilibrio. De allí decelera por la posición 2 hasta pararse en la posición 1, de donde acelera de nuevo por la posición 2 hasta la posición de equilibrio.3 Al examinar el movimiento del péndulo más a fondo, se ve que de hecho es una onda, pues si se traza su movimiento en un gráfico, marcando el tiempo en el eje vertical y la distancia de desplazamiento de la posición de equilibrio en el eje horizontal, como se hizo en la Fig. 6.3, se ve claramente la forma de una onda.
El movimiento de un objeto se representa gráficamente en una forma de onda tal como la de la Fig. 6.4 que demuestra una onda sinusoidal. En el eje horizontal de la forma de onda, se representa el decurso del tiempo. En el eje vertical se representa la distancia de alejamiento del objeto de su posición de equilibrio. En esta representación gráfica se pueden medir dos aspectos muy importantes de la onda. El primero es la amplitud que se define como la distancia del máximo alejamiento del objeto de su posición de equilibrio y que se mide en el eje vertical. El segundo es el período que se define como el tiempo requerido para completar un ciclo y que se mide en el eje horizontal. El ciclo es la trayectoria de la transferencia de energía desde una posición de equilibrio a otra posición de equilibrio donde se vuelve a repetir el mismo patrón de movimiento.
El período se correlaciona con otro aspecto muy importante que es la frecuencia, que es el inverso del período y que se mide en ciclos por segundo (cps).
La frecuencia también se expresa en hertzios (Hz), una unidad equivalente al ciclo por segundo; es decir, 100 cps = 100 Hz. Por ejemplo, si se completa un ciclo en un centésimo de un segundo (1/100 de un segundo), la frecuencia será de 100 ciclos por segundo porque se pueden completar 100 ciclos en un segundo (100 cps).
Los ejemplos ya examinados son ondas simples; se representan mediante curvas sinusoidales en que la transferencia de energía ocurre regular y consistentemente. Las ondas simples o sinusoidales pueden combinarse para formar ondas compuestas. Las ondas se combinan sumando las amplitudes de las ondas a combinarse en cada momento temporal. En la Fig. 6.5, entonces, el combinar la onda simple A con la onda simple B produce una nueva onda compuesta C. En el gráfico de la Fig. 6.5, se puede observar que la onda compuesta todavía tiene su propia amplitud (el desplazamiento máximo desde la posición de equilibrio) y su propio período (el tiempo que se requiere para completar un ciclo).
Los ejemplos dados hasta ahora, tanto las ondas simples como las ondas compuestas, han sido de ondas armónicas o periódicas, pues han tenido un período, puesto que han tenido un ciclo, es decir, un patrón de movimiento repetido a través del tiempo. La Fig. 6.6 contiene otro ejemplo de una onda compuesta armónica donde se puede observar que el patrón del ciclo se repite. Por otro lado, las ondas inarmónicas o aperiódicas carecen de un patrón de movimiento repetitivo y así no tienen ni ciclo ni período como se puede observar en la Fig. 6.7.
La onda sonora es la transferencia de energía acústica a través de algún medio. La energía acústica resulta de la producción de cualquier sonido, como los ejemplos ya citados del silbido del árbitro o el chasquido lateral del vaquero como también la propia habla. En el contexto lingüístico, las ondas sonoras que se estudian se limitan a aquellas producidas por los movimientos articulatorios descritos en el Capítulo 5. El medio de transmisión es generalmente el aire, aunque el sonido también puede transmitirse a través de otros medios, como por ejemplo una puerta o una pared. La onda sonora difiere de los ejemplos ya citados porque es una onda longitudinal en que el movimiento del medio (en este caso las moléculas de aire) es paralelo a la propagación de la onda.
En el habla humana, los movimientos articulatorios tienen por motivo el poner en movimiento las moléculas de aire, cuyo movimiento se transmite desde la boca del emisor hasta el oído del receptor. En la Fig. 6.8, se puede ver la transmisión de energía por medio del aire a un nivel microscópico. Esa figura demuestra como se transmite de una molécula a otra el patrón de movimiento iniciado por los agentes fonadores. Los círculos representan la posición de las moléculas de aire a través del tiempo. Al examinar la gráfica de la Fig. 6.8, se puede ver que el movimiento de la molécula negra a través del tiempo es una vibración u oscilación alrededor de su posición de equilibrio. Se propaga la onda por el aire en la misma dirección de la propia vibración molecular y el patrón de vibración de una molécula se transmite a la molécula vecina.
A primera vista, ese patrón de movimiento molecular puede no parecer ser una onda, pero otra vez, si se representa el movimiento de la molécula negra en el gráfico, vemos que es análogo al movimiento del péndulo.
A un nivel macroscópico, esa transferencia molecular de energía resulta en la propagación de la onda, según la Fig. 6.9, en que los círculos otra vez representan moléculas de aire. En la naturaleza el número de moléculas se mide en moles (6.02 × 1023 moléculas). La Fig. 6.9 es una representación gráfica de cómo la onda se propaga por esa cantidad masiva de moléculas. La propagación de la onda a través del aire produce dos fases de transmisión: la fase de compresión, en que la distribución espacial de las moléculas es más densa, o sea, que la presión del aire es más alta y la fase de rarefacción, en que la distribución espacial de las moléculas es menos densa, es decir, que la presión del aire es más baja.
La forma de onda para una onda sonora representa el patrón de vibración de una sola molécula en su medio de transmisión. Si se examina la forma de onda de la Fig. 6.4, se nota una porción de la onda superior a la posición de equilibrio y una porción inferior a la posición de equilibrio. La porción superior corresponde a la fase de compresión y la porción inferior corresponde a la fase de rarefacción. A diferencia de las ondas en general, todas las ondas sonoras producidas por el ser humano son ondas compuestas.
Las ondas sonoras tienen las mismas propiedades que las ondas en general: la amplitud, el tono, la duración y el timbre.
La amplitud de la onda sonora se puede medir científicamente en decibelios, una medida física que indica el volumen relativo de un sonido. En la representación gráfica de la forma de onda, la amplitud se ve en el eje vertical. La amplitud corresponde a la percepción de la intensidad o volumen del sonido. Siendo así, cuanto más baja la amplitud, más bajo el sonido en términos de su volumen y cuanto más alta la amplitud, más alto el sonido en términos de su volumen. Esto se puede ver al comparar la amplitud de la forma de onda de la vocal [a] de volumen bajo con la de la vocal [a] de volumen alto que se ven en la Fig. 6.10.4
Las ondas sonoras armónicas presentan un período, que es el tiempo que se requiere para completar un ciclo. Como ya se ha expuesto, el período guarda una correlación con la frecuencia, siendo la frecuencia el inverso del período. La frecuencia, por su parte, es una medida física de la onda en ciclos por segundo que corresponde a la percepción del tono o de la nota musical del sonido. Siendo así, cuanto más baja la frecuencia, más bajo el tono o nota musical y cuanto más alta la frecuencia, más alto el tono o nota musical. Esto se puede ver en la Fig. 6.11 al comparar el período de dos producciones de la vocal [a], una de tono bajo y otro de tono alto.5 En la Fig. 6.11, el tono alto es una octava más alto que el tono bajo, lo cual quiere decir que la frecuencia del tono alto es el doble de la frecuencia del tono bajo. También quiere decir que el período del tono alto es la mitad del período del tono bajo. En el habla, la variación de la frecuencia de un sonido tiene repercusiones en la manifestación de la entonación y el acento fonético en el caso del inglés y del español, y hasta en la distinción léxica de otros idiomas como el chino o el navajo.
Las ondas sonoras armónicas también presentan un ciclo, que es un patrón de movimiento o patrón de vibración que se repite a lo largo del tiempo. El perfil de la forma de onda del ciclo es una representación física que corresponde a la percepción del timbre o cualidad del sonido. El timbre no tiene medida, pues resulta de los distintos patrones de vibración de las moléculas de aire, lo que se puede visualizar mediante las distinciones en la forma de onda. El patrón de vibración puede cambiar sin que cambie la frecuencia, lo que produce un sonido con una cualidad o timbre diferente. Si se producen las vocales [a] y [e] en la misma nota musical, se producen dos ondas que difieren en su ciclo o forma de onda, como se ve en la Fig. 6.12.6
Otro aspecto importante de la onda sonora es la duración, que se refiere simplemente al tiempo durante el cual se sostiene la producción de determinado sonido. Puesto que la producción de un sonido es muy rápida, la duración de un sonido se mide generalmente en milisegundos. Al comparar la duración de la vocal tónica [á] de azar y la vocal tónica alargada [á:] de azahar, se puede oír que la segunda [a] de azahar es de duración más larga que la segunda [a] de azar. En la Fig. 6.13 se puede ver que la única diferencia entre la vocal breve y la vocal larga es su duración.7
Las ondas armónicas o periódicas ocurren cuando hay una vibración u oscilación consistente, lo que produce una onda que tiene un ciclo que se repite. La onda es consecuentemente periódica porque se puede medir el período, que es el tiempo que se requiere para completar un ciclo. Acústicamente, la mayoría de las ondas producidas en la música son ondas armónicas o periódicas, puesto que hay algo que vibra en su producción. En el piano, la guitarra o el violín vibran las cuerdas; en el clarinete o el oboe vibran una o dos lengüetas; en la trompeta y el trombón vibran los labios del músico; en la flauta o el órgano vibra una columna de aire dentro de un tubo.
En el habla, los sonidos más frecuentes en español son las vocales, que se transmiten a través de ondas armónicas o periódicas. La fuente de todos los sonidos armónicos del habla humana es la vibración de las cuerdas vocales. En la Fig. 6.14 se ven las formas de onda de una muestra de unos instrumentos musicales y de las cinco vocales españolas [a e i o u].8
Para entender la naturaleza compuesta de una onda sonora, es útil examinar la acción que ocurre en una cuerda de guitarra cuando se toca. Al considerar el movimiento de la cuerda, lo que aparece es una bolsa de movimiento, como se ve en el siguiente dibujo:
Al examinar ese movimiento, se puede notar que los extremos de la cuerda no se mueven porque son fijos y que el alejamiento máximo ocurre en el medio de la cuerda. Al analizarlo más a fondo, se puede observar que su movimiento complejo resulta de la suma de varias ondas simples. Las ondas simples, la combinación de las cuales produce la onda compuesta, tienen una relación fija entre sí. Debido a que los extremos son fijos, todas las ondas simples que llegan a formar parte de la onda compuesta tienen frecuencias que son múltiplos íntegros de la frecuencia más baja, que se denomina el tono fundamental.
Las ondas simples más allá del tono fundamental se denominan armónicos. El tono fundamental por definición es el primer armónico. Los demás armónicos son los múltiplos íntegros del tono fundamental, teniendo así dos ciclos, tres ciclos, cuatro ciclos, etc., a lo largo de la cuerda, como se ve en la Fig. 6.15. La bolsa de movimiento, entonces se deriva de una onda compuesta por el tono fundamental y los demás armónicos.
En la voz humana, se puede alterar el tono fundamental o la nota musical en la que se produce un sonido al alterar la longitud y/o espesura de las cuerdas vocales. Esto tiene su paralelo con los instrumentos musicales. Las cuerdas más largas y/o más espesas producen tonos más bajos; las cuerdas más cortas y/o más delgadas producen tonos más altos.
La vibración regular de cualquier elemento (sea una cuerda, una lengüeta, los labios, una columna de aire o las propias cuerdas vocales) produce un tono fundamental. Es importante observar, que a pesar de que dos instrumentos diferentes produzcan un sonido con el mismo tono fundamental, el oyente puede distinguir entre los distintos sonidos. Por ejemplo, un violín y una trompeta pueden tocar la misma nota (i.e., do mayor) y aunque las dos ondas producidas tengan el mismo tono fundamental, el oyente puede distinguir entre las dos. Esto se debe a que la forma y materia del instrumento filtran o atenúan distintos armónicos, los cuales quedan absorbidos o disminuidos en su amplitud por el fenómeno de atenuación. Por otro lado se amplifican otros armónicos, que por el fenómeno de resonancia, se refuerzan en las cámaras de los distintos instrumentos. Debido a que la forma física del violín es distinta a la de la trompeta, se filtran y se refuerzan distintos armónicos. El sonido que percibimos, entonces, es una onda compuesta del tono fundamental más los armónicos: algunos filtrados o atenuados y otros reforzados o amplificados. Los instrumentos se diferencian, pues, por su timbre o cualidad sonora que resulta de las diferencias en la construcción y forma física del instrumento, que se reflejan en las distintas formas de onda producidas, como se ve en la Fig. 6.14. Una definición concisa de timbre será la cualidad del sonido o efecto acústico total que resulta de la conformación del tono fundamental más los armónicos que pasan por el proceso de filtración, algunos de ellos reforzados y otros atenuados. Esa filtración de armónicos es la consecuencia de la forma y de la materia de los distintos instrumentos empleados en la producción del sonido.
En el caso del habla, los ejemplos por excelencia de sonidos armónicos son las vocales, que en español se emplean casi sistemáticamente como núcleos silábicos. Es importante observar que un hablante puede producir la vocal [i] y la vocal [o] en una misma nota musical. Puesto que se producen en la misma nota musical, las dos ondas sonoras tienen el mismo tono fundamental, es decir, la misma frecuencia. La diferencia que se percibe entre los dos sonidos se debe al timbre, debido a que se cambia radicalmente la forma del instrumento (la posición de los labios, la abertura bucal, la posición de la lengua dentro de la boca como mínimo). Ese cambio físico cambia el patrón de filtración y resonancia de los armónicos que resultan de la vibración de las cuerdas vocales. Las distintas vocales se difieren en cuanto a su timbre o cualidad vocálica debido a un cambio fisiológico en la posición de los órganos y la conformación de las cavidades de resonancia del aparato fonador. Las diferencias físicas producen distintos patrones en las resultantes formas de onda como se ve también en la Fig. 6.14.
Las ondas inarmónicas o aperiódicas ocurren cuando no hay una vibración consistente, lo que produce una onda caótica, que no tiene ningún ciclo, ni período, ni patrón que se repita a lo largo del tiempo. En el campo de la música, unos instrumentos que producen ondas inarmónicas son los tambores, maracas o panderetas. Entre los sonidos que producen ondas inarmónicas en el campo del habla humana se encuentran las consonantes [f] y [s]. La Fig. 6.16 muestra las formas de onda de estos sonidos.
Puesto que no hay ningún patrón de vibración que se repita, la onda no tiene tono fundamental. Eso se puede comprobar con un pequeño experimento cantando la vocal [a] en dos notas musicales y luego tratando de cantar la consonante [s] en las mismas dos notas, lo cual resulta ser imposible porque la consonante [s] carece de tono fundamental. Eso se debe principalmente al hecho de que no vibran las cuerdas vocales durante la producción de la consonante [s].
La vibración o no vibración de las cuerdas vocales es un rasgo binario; es decir, según el estado de las cuerdas vocales, las mismas cuerdas simplemente vibran o no vibran; no existe fisiológicamente un término medio. Sin embargo, en cuanto a la periodicidad de la onda sonora, sí existe un continuo. Como ya se ha expuesto, las ondas sonoras de las vocales exhiben un alto grado de periodicidad; son, entonces, los mejores ejemplos de ondas armónicas en el habla. Las consonantes sordas, por otro lado, son los mejores ejemplos de sonidos con ondas inarmónicas en el habla, siendo que no existe en su forma de onda ningún elemento que se repita consistentemente. Sin embargo, ocurren otras dos categorías de sonidos que presentan características interesantes en cuanto a la periodicidad de sus ondas.
Al examinar el sonido [ѕ̮] de la palabra {mismo}, se observa que es una onda compuesta que proviene de dos fuentes. Una fuente es la vibración de las cuerdas vocales, que de por sí producen una onda armónica; la otra fuente es la turbulencia de aire que resulta de la fricación al forzar el aire por el estrechamiento formado entre la lámina de la lengua y los alvéolos, que de por sí produce una onda inarmónica. La combinación de una onda armónica con una onda inarmónica resulta en una onda todavía inarmónica, pero con cierta periodicidad. A este tipo de onda se le llama cuasiperiódica o cuasiarmónica. Como se puede ver al comparar la forma de onda de los sonidos [a], [ѕ̮] y [s] que se presentan en la Fig. 6.17, la forma de onda del sonido [ѕ̮] presenta dos cuasiciclos que tienen el mismo período.9 Sin embargo, los detalles de cada cuasiciclo son diferentes debido al componente inarmónico.
Hay otro grupo de consonantes, las nasales y las laterales, que también tienen ondas armónicas como las vocales. Debido a que las consonantes nasales y las consonantes laterales tienen ondas armónicas, las mismas se denominan sonorantes. Siguiendo el patrón de la lingüística general, las vibrantes del español suelen clasificarse también como sonorantes. Esa categorización, sin embargo, se examinará en más detalle en el Capítulo 16. Las formas de onda de las consonantes sonorantes son más armónicas que las de las consonantes sonoras, puesto que sus ondas sonoras tienen ciclos que se repiten como en las ondas sonoras de las vocales.
En términos de la periodicidad de la onda, el continuo va de las vocales y sonorantes (las más armónicas) a las consonantes sonoras, hasta las consonantes sordas (las más inarmónicas).
Puesto que la onda sonora es invisible, se necesitan instrumentos técnicos para poder estudiarla. Hay varios tipos de instrumentos que se han desarrollado a través de los años para el estudio de la onda sonora, que permiten analizar diferentes aspectos de la onda mediante distintas representaciones. Las representaciones más importantes y útiles de la onda sonora, que se examinarán aquí, son cuatro: 1) la forma de onda (que se ha tratado ya), 2) el espectrograma, 3) la sección espectrográfica y 4) la representación de amplitud y tono fundamental.
La forma de onda de una onda sonora, como ya se ha expuesto, representa el movimiento o vibración de una molécula (generalmente de aire) en la cadena de choques moleculares que resultan de la transmisión de un sonido. En la representación gráfica de la forma de onda, como ya se ha explicado antes, se mide la amplitud (que corresponde a la intensidad o al volumen del sonido) en decibelios en el eje vertical. El eje horizontal representa el decurso del tiempo. Se ven ejemplos de las formas de onda de varios sonidos en las Figuras 6.14, 6.16 y 6.17. Históricamente las primeras representaciones de la forma de onda se produjeron en un aparato llamado el osciloscopio (inventado en 1897 por el físico alemán Karl Ferdinand Braun); hoy día se hacen más comúnmente con diversos programas de computadora.
Aunque la forma de onda sirve muy bien para representar la amplitud de una onda y de diferenciar entre ondas armónicas e inarmónicas, resulta inefectivo para representar la onda sonora de una manera que facilite la diferenciación entre las distintas vocales y consonantes. El próximo paso tecnológico significativo para el estudio de la fonética acústica ocurrió con el invento del espectrógrafo en los años cuarenta del siglo pasado por Bell Telephone Laboratories. R. K. Potter lanzó la aplicación del espectrógrafo a la lingüística con la publicación de su libro Visible Speech. En ese libro, Potter y sus colegas describieron cómo es posible diferenciar entre los distintos sonidos y reconocerlos mediante el espectrograma de su onda sonora. Esa técnica de análisis lingüístico llegó a ser accesible a la comunidad lingüística con la producción del primer espectrógrafo comercial (el Sona-Graph) en 1951 por la compañía Kay Elemetrics.
El espectrógrafo esencialmente produce una imagen visual que descompone la onda compuesta, indicando dónde se encuentra la energía acústica en el espectro del sonido producido. La imagen visual que produce el espectrógrafo se conoce como un espectrograma o sonograma.
Para producir el sonograma, el espectrógrafo analiza la grabación de la onda sonora en cada momento de su decurso e indica en qué frecuencias y con qué amplitud se encuentra la energía acústica a través del tiempo. El sonograma presenta datos acústicos de la onda sonora en tres dimensiones. En el eje horizontal se mide el decurso del tiempo en milisegundos. En el eje vertical se mide la frecuencia de la energía acústica presente como componente de la onda sonora, la cual se mide en ciclos por segundo (cps) o hertzios (Hz). El sonograma típicamente representa una gama de frecuencias entre 0 cps y 8000 cps. La tercera dimensión acústica observable es la amplitud del componente acústico de cada frecuencia. La amplitud no se puede medir con exactitud en el sonograma, pero la amplitud sí se indica con la negrura de la representación de la energía acústica: cuanto más oscura la representación, más alta la amplitud de la energía acústica; cuanto más clara la representación, más baja la amplitud.
Los sonogramas se producen en varios formatos, siendo una de las distinciones la que existe entre los sonogramas de banda estrecha y de banda ancha. El ser estrecha o ancha depende de la gama del filtro que se emplee en el análisis espectrográfico. Tradicionalmente, el filtro de los sonogramas de banda estrecha ha sido de 75 Hz y el filtro de banda ancha ha sido de 300 Hz. La distinción entre el sonograma de banda estrecha y el de banda ancha es análoga a la vista de los estacionamientos de un recinto universitario desde la perspectiva de un helicóptero arriba del recinto en contraste con la vista desde la perspectiva de un avión en altitud muy alta. Desde el helicóptero se puede contar a simple vista el número de automóviles en todos los estacionamientos; desde un avión, tal vez simplemente el número de estacionamientos.
Los sonogramas de banda estrecha examinan la onda sonora desde una perspectiva más reducida o cercana. Son los más adecuados para ver los armónicos de una onda porque el tamaño del filtro es suficientemente estrecho para poder discriminar entre los armónicos, que se funden en un sonograma de banda ancha como se verá claramente a continuación. En la Fig. 6.18 se ve un sonograma de banda estrecha de la vocal española [a] que comienza en un tono y termina en otro, una octava más alta que el primero.
En el sonograma de banda estrecha en la Fig. 6.18 se pueden observar varios hechos muy importantes.
Los sonogramas de banda ancha son distintos de los de banda estrecha en que debido al tamaño del filtro no se distinguen más los armónicos individuales; es decir, los de banda ancha examinan la onda sonora desde una perspectiva más amplia o lejana. Lo que contrapone los dos tipos de sonograma no es ni la onda sonora ni el proceso mediante el cual se realiza el análisis, sino simplemente el tamaño del filtro que se emplea en el análisis, o sea, la perspectiva desde la cual se examina la onda.
En el sonograma de la Fig. 6.18 de banda estrecha, se ven más de cerca los detalles y se pueden distinguir y contar los armónicos. En el sonograma de la Fig. 6.19 de banda ancha, se ve el mismo trozo de habla desde otra perspectiva más distante. En el sonograma de banda ancha no se distinguen ya los armónicos, se ven solamente los grupos de armónicos que han sido reforzados o atenuados. Estos grupos o zonas de armónicos reforzados, que no han sido filtrados, se llaman formantes.
En el sonograma de banda ancha en la Fig. 6.19 se pueden observar varios hechos muy importantes.
Suele decirse que el sonograma tiene tres dimensiones: el tiempo en el eje horizontal (el eje x), la frecuencia en el eje vertical (el eje y) y la amplitud en el eje sobresaliente (el eje z). Mientras que los primeros dos ejes permiten medirse, el eje sobresaliente no permite medición, puesto que en el sonograma (que solo tiene dos dimensiones) la amplitud se representa con matices de negrura. La sección espectrográfica sí permite la medición de la amplitud, puesto que traza la frecuencia en el eje horizontal y la amplitud en el eje vertical de un momento determinado. En la Fig. 6.20, se presenta un sonograma de la vocal española [a] junto con una sección espectrográfica del momento indicado por la barra vertical en el sonograma.
El valor de la sección espectrográfica es que permite visualizar y medir mejor la amplitud. En efecto, la sección espectrográfica fija el tiempo para permitir una visión de los aspectos de la frecuencia y la amplitud en un momento dado.
Aunque se pueden medir la amplitud y la frecuencia de una onda sonora en el sonograma o en la sección espectrográfica, existen otros medios que permiten una medición más fácil y una visualización más clara de estos dos aspectos de la onda sonora. Como se ve en la Fig. 6.20, esos medios producen un despliegue sincronizado del tono y de la amplitud.
Conforme a lo presentado, se puede producir con programas acústicos un regis-tro de la amplitud y del tono fundamental sincronizados con la forma de onda. La Fig. 6.21 es una presentación de la frase “La fonética acústica es fascinante”.10 La representación del gráfico superior es de la amplitud, medida en decibelios. En general, las vocales y consonantes nasales tienen siempre una amplitud mayor que los demás sonidos. Se puede notar también el descenso marcado en las oclusivas sordas. La representación del gráfico del medio es del tono fundamental, medido en hertzios o ciclos por segundo. Es de notar que los sonidos sordos no registran ningún tono. También se debe observar que el tono desciende durante la última parte de la oración. La representación inferior es la forma de onda. Los gráficos están correlacionados temporalmente. El fonetista emplea tales representaciones para estudiar los fenómenos que dependen de la amplitud y del tono, como por ejemplo el acento y la entonación.
El hecho de que el receptor pueda diferenciar entre los distintos sonidos se debe a que la onda sonora en sí es diferente para cada sonido. Las diferencias físicas entre las ondas de los distintos sonidos se hacen visibles en el sonograma. Siendo así, es posible, con práctica y con paciencia, descifrar lo que se dijo mediante una interpretación del sonograma. El proceso de interpretación se lleva a cabo mediante un análisis de varias características acústicas que se correlacionan con los aspectos articulatorios ya descritos en los capítulos anteriores. Una de las características más importantes es la que permite distinguir entre vocales y consonantes.
Una de las primeras observaciones que se puede hacer de un sonograma se trata de la distinción que existe entre el espectro de una onda armónica y el de una onda inarmónica. En la Fig. 6.22 se ve un sonograma de banda estrecha y uno de banda ancha de la secuencia de sonidos españoles [si se sa so su].11 Al comparar los espectros del sonido [s] con los de las vocales [i e a o u], se nota que el espectro de las vocales se organiza en armónicos (en el sonograma de banda estrecha) y formantes (en el sonograma de banda ancha), mientras que el espectro de la consonante [s] presenta energía acústica intensa esparcida indistintamente por toda una gama de frecuencias entre aproximadamente 3200 cps y 8000 cps. Las ondas sonoras de las vocales, con sus armónicos bien definidos, son ondas armónicas prototípicas. Las ondas sonoras de la consonante sorda [s], con una ausencia total de armónicos, son ondas inarmónicas prototípicas.
La distinción entre las ondas armónicas y las inarmónicas, sin embargo, no es una dicotomía. Existen también sonidos de “término medio” que presentan matices de características de los dos prototipos. Como se ve en la Fig. 6.23, algunas consonantes, por ejemplo [l] o [n], presentan formantes, aunque atenuados y menos definidos que los de las vocales. Por tener formantes como las vocales, las consonantes [l] y [n] se llaman sonorantes, como ya se indicó antes. Las otras consonantes sonoras son aun más problemáticas. La onda sonora del sonido [s̬], por ejemplo, resulta de la composición de una onda armónica (procedente de la vibración de las cuerdas vocales) y de una onda inarmónica (resultante de la turbulencia de aire en la región alveolar). Como se ve también en la Fig. 6.23, el sonograma del sonido [s̬] no presenta formantes, a pesar de la vibración de las cuerdas vocales.
Conforme se puede ver en el sonograma de la Fig. 6.22, el patrón de los formantes de cada una de las vocales [i e a o u] es distintivo. Del sonograma se pueden medir los valores en cps de los formantes. Los más importantes en la identificación de cada vocal son el primero y el segundo formantes. Para medir el formante se calcula la frecuencia media del formante en el medio de su decurso temporal. En la Fig. 6.24 se representan gráficamente los valores de los primeros dos formantes de las vocales del español, sacados del sonograma de la Fig. 6.22.
Es interesante marcar los valores de los formantes en un gráfico, con los valores del primer formante (F1) en el eje vertical y los valores del segundo formante (F2) en el eje horizontal. En la Fig. 6.25, los valores más bajos se encuentran en el ángulo superior derecho. El colocar los valores de los formantes para cada vocal en el gráfico resulta en el llamado “triángulo vocálico”. En este caso, sin embargo, el posicionamiento de las vocales depende directamente de medidas acústicas científicas de características físicas de la propia onda sonora y no de rasgos articulatorios impresionistas.
Al examinar los patrones de los primeros dos formantes se pueden observar las siguientes correlaciones con el cuadro vocálico proveniente de los aspectos articulatorios de los sonidos vocálicos. El primer formante (F1) se correlaciona con la manera de articulación, o sea la abertura bucal; es decir, cuanto más alto el primer formante, más abierta la vocal y la abertura bucal; cuanto más bajo el primer formante, más cerrada la vocal y la abertura bucal. El segundo formante (F2) se correlaciona con el lugar de articulación de la vocal, o sea dónde ocurre el acercamiento máximo entre la lengua y el techo de la boca; es decir, cuanto más alto el segundo formante, más anterior la vocal y más anterior la aproximación de la lengua al techo de la boca; cuanto más bajo el segundo formante, más posterior la vocal y más posterior la aproximación de la lengua al techo de la boca.
La interpretación de las consonantes en el sonograma depende de una identificación de sus tres rasgos articulatorios: el modo de articulación, el lugar de articulación y el estado de las cuerdas vocales.
Es relativamente fácil identificar algunos modos de articulación; sin embargo, hay otros modos que son más difíciles de interpretar. La Fig. 6.26 presenta un sonograma de las secuencias [áta ása ácʃa áma ála áɾa ára], que contienen una consonante oclusiva, fricativa, africada, nasal, lateral, vibrante simple y vibrante múltiple.12 La oclusiva se destaca por su período de ausencia de energía acústica que corresponde al período en que no hay salida de aire. La fricativa se reconoce por su energía esparcida por toda una región, que corresponde a la turbulencia producida al forzar el aire por un estrechamiento. La africada, que es una combinación de oclusiva más fricativa, se distingue por tener esas dos etapas. La nasal y la lateral son consonantes que también se llaman sonorantes porque manifiestan formantes. Sin embargo, esos formantes son más débiles que los de las vocales. Hay que diferenciar entre los sonorantes por el patrón de formantes que presentan. La vibrante simple y la vibrante múltiple se destacan por el número de interrupciones o vibraciones que se perciben. En la Fig. 6.26, se nota una interrupción en la onda sonora del vibrante simple y cuatro interrupciones en la del vibrante múltiple.
Los lugares de articulación se interpretan de varios métodos; el método depende, en parte, del modo de articulación. En el caso de las oclusivas, la identificación del lugar de articulación se descifra por analizar las transiciones de los formantes vocálicos al aproximarse o alejarse de la consonante. Como se ve en la Fig. 6.27, de las secuencias [ápa áta áka], las transiciones al final de la primera vocal son diferentes según el lugar de articulación de la consonante que sigue.13 También las transiciones al comienzo de la segunda vocal varían de acuerdo con la consonante que precede. En el caso de las fricativas, además de las mismas transiciones ya mencionadas, varía la gama de energía acústica como se puede ver en la Fig. 6.28, de las secuencias [áfa ása áxa].14 El lugar de articulación de las consonantes nasales y laterales dependen de características acústicas particulares que se presentarán en los Capítulos 15 y 16. Las vibrantes son siempre alveolares.
La interpretación del estado de las cuerdas vocales, es decir, el reconocer si un sonido es sonoro o sordo es relativamente fácil. En un sonograma de banda ancha, un sonido sonoro presenta estrías verticales; un sonido sordo no tiene tales estrías. Esto se puede notar al comparar los sonogramas de [áxa áͣa] de la Fig. 6.29.15
Aunque es muy fácil examinar el tono fundamental en un trazo tonal como el que se ve en la Fig. 6.21, también se puede determinarlo en el sonograma. Como ya se ha expuesto anteriormente, el tono fundamental corresponde al número de ciclos vibratorios por segundo. En el sonograma de banda estrecha, entonces, el tono fundamental corresponde al valor en cps del primer armónico (A1). Esto se puede ver en la Fig. 6.18, que indica cómo dobla la frecuencia del primer armónico al subir una octava. En el sonograma de banda ancha, sin embargo, no se distinguen los armónicos. No obstante, es posible calcular el tono fundamental de un sonido sonoro de un sonograma de banda ancha. Las estrías verticales representan los ciclos vibratorios de las cuerdas vocales. El medir el decurso del tiempo entre las estrías, entonces, revela el período o el tiempo que lleva para completar un ciclo. Como ya se explicó antes, la frecuencia es el inverso del período. Esto quiere decir que si el período es de 1/125 de segundo, la frecuencia del tono fundamental es de 125 cps. Ese fenómeno se ve claramente en la Fig. 6.19, que representa la vocal [a] que comienza en un tono más bajo y termina en un tono una octava más alto. Se puede observar que el tiempo entre cada estría vertical, o sea el período, resulta ser la mitad al final de la vocal de lo que era al principio. Al interpretarse el tono fundamental de un sonograma, que presentan los formantes F1, F2, F3, etc., el tono fundamental se denomina F0. Son equivalentes entonces los términos tono fundamental, A1 y F0.
En vía de ilustración de cómo se interpreta un sonograma de un enunciado, se presenta en la Fig. 6.30 una muestra del dicho popular: De músico, poeta y loco, todos tenemos un poco.16
El análisis de un espectrograma generalmente comienza con una identificación de las vocales. Se pueden localizar las vocales por la presencia de sus formantes distintivos. La identificación de la vocal logra hacerse por medir las frecuencias del primero y segundo formantes y por compararlos con los valores de los formantes presentados en la Fig. 6.24. Luego se procede a una identificación de las consonantes, identificándolas como sonoras o sordas por la presencia o ausencia de las estrías verticales. Luego se identifica el modo de articulación: las oclusivas por la ausencia de energía acústica y las fricativas por una energía acústica esparcida. Las africadas son simplemente una combinación de las características de una oclusiva seguida de una fricativa. Las nasales y laterales se identifican por sus formantes débiles y las vibrantes simples y múltiples por sus breves interrupciones. El lugar de articulación de las consonantes se determina por las transiciones de los formantes vocálicos de acuerdo con lo presentado antes.
La fonética acústica estudia la onda sonora. Como toda onda, la onda sonora es una transferencia de energía a través de algún medio, generalmente el aire. Las ondas, en general, pueden clasificarse como simples o compuestas por un lado y armónicas o inarmónicas por otro lado según el Cuadro 6.31.
Puesto que la onda sonora es invisible, es necesario el uso de instrumentos de laboratorio para su estudio. Mediante los instrumentos se pueden examinar las propiedades de la onda que son su amplitud, frecuencia, duración y timbre. La correlación perceptiva de estas propiedades físicas de la onda se resume en el Cuadro 6.32.
La producción de todos los sonidos depende del movimiento del aire. Uno de los modelos más vigentes en la producción del habla es la teoría de la fuente y el filtro. Según ese modelo, la fuente del sonido, sobre todo en el caso de la fonación o producción de un sonido sonoro, es la vibración de las cuerdas vocales en la laringe. La fuente produce el tono fundamental con todos sus armónicos, formando así una onda compuesta. En el caso del susurro, la fuente es la constricción de las cuerdas vocales sin que lleguen a vibrarse.
El filtro, que modifica el sonido allí producido, se encuentra en las cavidades supraglóticas mediante las distintas conformaciones faríngeas, bucales y nasales que adoptan los órganos de dichas cavidades. En el caso de las vocales y los sonorantes, se filtran (es decir, se eliminan o se atenúan) distintos armónicos y otros se refuerzan al resonar en las cavidades supraglóticas, creando así el timbre particular del sonido armónico. En el caso de las demás consonantes, se modifica la salida de aire por una obstrucción, un estrechamiento u otro moldeamiento del canal bucal, convirtiendo la onda en un sonido cuasiarmónico.
Una vez producida, se lleva a cabo la propagación de la onda sonora por el medio del aire. Con la producción de la onda sonora de cada sonido, se ponen las moléculas de aire en distintos patrones de vibración, cuyos patrones de vibración se pasan de molécula en molécula desde el aparato fonador del emisor hasta el oído del receptor.
Como ya se demostró, la onda sonora solamente se deja estudiar mediante un análisis instrumental. El Cuadro 6.33 resume los distintos métodos de análisis y los aspectos de la onda sonora que cada método permite destacar.
Uno de los aspectos básicos de la onda sonora armónica es su tono fundamental. El tono fundamental corresponde a la frecuencia de vibración de las cuerdas vocales en la voz humana. El tono fundamental también se denomina el primer armónico (A1) o formante cero (F0). Se puede medir la frecuencia del tono fundamental en cps directamente en el trazo del tono fundamental. Se puede medir también la frecuencia del primer armónico (A1) directamente del sonograma de banda estrecha. También es posible calcular el tono fundamental del sonograma de banda ancha. El proceso requiere dos pasos:
Con referencia al sonograma de banda ancha, existen tres medidas importantes: F0 (el formante cero), F1 (el primer formante) y F2 (el segundo formante). El Cuadro 6.34 presenta un resumen de lo que indica cada uno.
Los movimientos articulatorios de los diferentes sonidos producen ondas sonoras distintas. Es posible reconocer cuáles son los sonidos por las características físicas de las distintas ondas sonoras. Por eso, los sonogramas se dejan interpretar permitiendo la identificación de cada uno de sus sonidos. El proceso de identificación depende de la evaluación de varios criterios. Inicialmente se determina si el sonido es armónico o inarmónico, es decir, si la onda presenta armónicos o formantes o si no los presenta. En general, eso determina si el sonido es vocal o consonante. Las vocales se identifican por los valores de su primero y segundo formantes. Para identificar las consonantes, hace falta determinar el modo de articulación, el lugar de articulación y el estado de las cuerdas vocales según los criterios resumidos en el Cuadro 6.35.
En el Capítulo 5 se examinó la fonética articulatoria, es decir, cómo el emisor produce el sonido o sea la onda sonora. En este capítulo se examinó la fonética acústica, es decir, cómo se transmite el mensaje a través de la propagación de la onda sonora. En el próximo capítulo, se examinará la fonética auditiva, es decir, cómo el receptor recibe e interpreta la onda sonora.
1. Video de una onda transmitida por una cuerda.
2. Video de una onda transmitida por el agua en un charco.
3. Video del movimiento de un péndulo.
4. La vocal [a] en volumen bajo y alto.
5. La vocal [a] en tono bajo y alto.
6. Las vocales [a] y [e] en el mismo tono y volumen.
7. La vocal [a] con duración breve y larga.
8. Las vocales [a e i o u].
9. La fricativa alveolar sorda y sonora en [έstamís̬ma].
10. “La fonética acústica es fascinante.”
11. Las secuencias [si se sa so su].
12. Secuencias que demuestran los distintos modos de articulación de las consonantes.
13. Secuencias que demuestran los distintos lugares de articulación de las consonantes oclusivas.
14. Secuencias que demuestran los distintos lugares de articulación de las consonantes fricativas.
15. Secuencias que demuestran la diferencia entre sonidos sordos y sonoros.
16. “De músico, poeta y loco, todos tenemos un poco.”