Introducción al análisis de sonidos

Introducción al análisis de sonidos Marcelo Araya-Salas New Mexico State University Taller análisis de vocalizaciones animales en R Modificado de Brad

Author: Marcos Gil Castro

2 downloads 39 Views 993KB Size

Report

DOWNLOAD PDF

Recommend Stories

Sonidos nasales Sonidos nasalizados

Sonidos

Generadores de sonidos A

Trabajando con sonidos

Los sonidos del flamenco

SÄNDNINGSDATUM: 2007-10-02 PRODUCENT: LAURA ALBANESI PROGRAMNUMMER 100589/ra1 Español con ritmo Los sonidos del flamenco Primera parte: los palos,

SONIDOS DE ARQUITECTURA MISTICA

Sonidos y electricidad

Hagamos sonidos con reglas

Mosaico de Sonidos Junio 2015

Mosaico de Sonidos Junio 2015 PUNTO DE PARTIDA Mosaico de Sonidos nace del deseo de las orquestas de la AEOS de crear un proyecto que beneficie a pe

LOS SONIDOS DEL AGUA

Story Transcript

Introducción al análisis de sonidos Marcelo Araya-Salas New Mexico State University Taller análisis de vocalizaciones animales en R Modificado de Bradbury y Vehrencamp 2010

Grabación de sonidos • Sonido: perturbación en la presión del medio (aire, agua, etc) • Cada región de presión mas alta que el promedio ambiental es seguida por una de presión mas baja

Grabación de sonidos • El micrófono convierte la variación en presión del sonido en una señal eléctrica que asemeja la oscilación

Describir y comparar sonidos

Presion

• Oscilograma (waveform): gráfico de presión vs tiempo. Es un descripción del sonido en el dominio de tiempo. Pájaro campana

Tiempo

Oropendola

Tiempo

• Como describir y comparar estas señales?

Oscilogramas simples • La señal mas simple que puede ser grabada es una onda sinusoidal sin cambios en amplitud o frecuencia:

Mediciones en el dominio del tiempo • Amplitud: la desviación máxima (o promedio) con respecto al ruido ambiental

Mediciones en el dominio del tiempo • Amplitud: generalmente la escala es relativa al ruido de fondo (dB = 20 log10 (Aobs/Aref))

Mediciones en el dominio del tiempo • Frecuencia: ciclos por segundo (Hz) de la onda (reciproco del tiempo de un ciclo =1/T)

Mediciones en el dominio de frecuencia • Frecuencia se puede visualizar mejor en un gráfico de densidad espectral

Dominio del tiempo

Dominio de frecuencia

Ondas no sinusoidales • Como se pueden describir?

• Modulación de frecuencia (1er gráfico) • Modulación de amplitud (2do grafico)

Análisis de Fourier • Por suerte! Cualquier onda continua puede ser descompuesta en ondas sinusoidales puras con frecuencia y amplitud (Análisis de Fourier) Los gráficos en el dominio de frecuencia son MUY útiles para comparar sonidos!

Análisis de Fourier

Amplitud

• Aplicando la solución de Fourier:

Frecuencia

Espectros de frecuencias

Frecuencia

Análisis de Fourier • Pero como analizar cantos mas complejos como este emberízido? • Solución: dividir el canto en segmentos y crear espectros de frecuencia para cada segmento

Pressure

(Mover cursor para reproducir)

Time

Análisis de Fourier • Los espectros se juntan para mostrar como cambian las frecuencias en el tiempo • El gráfico que resulta se conoce como espectrograma

Pressure

(Mover cursor para reproducir)

Time

Ondas no-sinusoidales • 3 tipos de desviaciones de una onda sinusoidal. La mayoría de animales son una combinaciones de estos 3 tipos: Onda sinusoidal

Modulación de amplitud (AM)

Modulación de frecuencia (MF)

Señales periódicas no sinusoidales

Ondas no-sinusoidales Onda sinusoidal

Modulación de amplitud (AM)

Modulación de frecuencia (MF)

Señales periódicas no sinusoidales

Análisis de ondas no-sinusoidales típicas

Amplitud

• Amplitud de modulación (AM):

Dominio del tiempo

Dominio de frecuencia

Análisis de ondas no-sinusoidales típicas • Amplitud de modulación (AM): – 2 mediciones posibles:

Portadora T f = 1/T Dominio del tiempo

Amplitud

• Frecuencia portadora (f)

Dominio de frecuencia

Análisis de ondas no-sinusoidales típicas • Amplitud de modulación (AM): – 2 mediciones posibles: • Frecuencia portadora (f) • Frecuencia modulante w = 1/t

Portadora T f = 1/T Dominio del tiempo

Amplitude

t

Frecuencia modulante

f–w f

f+w

Dominio de frecuencia

Análisis de ondas no-sinusoidales típicas • Amplitud de modulación (AM): – Espectro de frecuencia es 3 lineas: portadora (f) y dos modulantes (f-w y f+w)

w = 1/t

Portadora T f = 1/T Dominio del tiempo

Amplitude

t

Frecuencia modulante

f–w f

f+w

Dominio de frecuencia

Ondas no-sinusoidales Onda sinusoidal

Modulación de amplitud (AM)

Modulación de frecuencia (MF)

Señales periódicas no sinusoidales

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF)

Tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio del tiempo

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF) fmax= 1/T1

Tiempo

T1

Dominio del tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF) fmax= 1/T1 fmin= 1/T2

Tiempo

T2

T1

Dominio del tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF) fmax= 1/T1 fmin= 1/T2

Portadora ( f ) = (fmax+ fmin) / 2

Tiempo

T2

T1

Dominio del tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF) fmax= 1/T1 fmin= 1/T2

Frecuencia modulante, w Portadora ( f ) = (fmax+ fmin) / 2

Tiempo

T2

T1

Dominio del tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes

• Modulación de frecuencia (MF) fmax= 1/T1 fmin= 1/T2

Frecuencia modulante, w Portadora ( f ) = (fmax+ fmin) / 2

Tiempo

t

T2

w = 1/t

T1

Dominio del tiempo

Amplitud

Frecuencia

Manteniendo la amplitud constante

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Modulación de frecuencia (MF) El espectro de frecuencia tiene la frecuencia portadora y bandas laterales (± nw ) al rededor

t

T1

Dominio del tiempo

Amplitud

T2

w = 1/t

f f–2w f–3w

f–w

f+2w f+w

f+3w

Dominio de frecuencia

Ondas no-sinusoidales comunes Onda sinusoidal

Modulación de amplitud (AM)

Modulación de frecuencia (MF)

Señales periódicas no sinusoidales

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales

Amplitud

– Cualquier forma de onda mientras q haya periodicidad

Dominio del tiempo

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales – Cualquier forma de onda mientras q haya periodicidad – Se mide el tiempo de repetición del período y los periodos por tiempo (w) w = 1/t

Dominio del tiempo

Amplitud

t

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales – El espectro de frecuencia contiene componentes a w, 2w, 3w, etc. – Componentes que son múltiplos de la de una frecuencia son series harmónicas w = 1/t

Dominio del tiempo

Amplitud

t

2w 4w w

3w

6w 5w

7w

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales – La amplitud disminuye exponencialmente en los harmónicos sucesivos (regla de Dirichlet) – Salvo si la onda tiene simetría de media onda

w = 1/t

Dominio del tiempo

Amplitud

t

2w 4w w

3w

6w 5w

7w

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales – La amplitud disminuye exponencialmente en los harmónicos sucesivos (regla de Dirichlet) – Salvo si la onda tiene simetría de media onda

w = 1/t

Dominio del tiempo

Amplitud

t

2w 4w w

3w

6w 5w

7w

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales

t

w = 1/t

Dominio del tiempo

Amplitud

– La amplitud disminuye exponencialmente en los harmónicos sucesivos (regla de Dirichlet) – Salvo si la onda tiene simetría de media onda

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales

t

w = 1/t

Dominio del tiempo

Amplitud

– La amplitud disminuye exponencialmente en los harmónicos sucesivos (regla de Dirichlet) – Salvo si la onda tiene simetría de media onda

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales

t

w = 1/t

Dominio del tiempo

Amplitud

– Cuando al simetría es de media onda solo se producen los harmónicos impares

w

3w

5w

7w

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales

Amplitud

Otra excepción a la regla de Dirichlet ocurre cuando hay “máximos múltiples”:

Dominio del tiempo

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales Se puede medir la frecuencia fundamental de la serie harmónica

w = 1/t Dominio del tiempo

Amplitud

t

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales Pero también se puede calcular el periodo entre máximos múltiples

t

z = 1/t w = 1/t Dominio del tiempo

Amplitud

t

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Señales periódicas no sinusoidales El resultado es una serie harmónica basada en la fundamental w. Cuando un harmónico esta cerca de un múltiplo de z la amplitud es menor Vallers Cimas

w = 1/t Dominio del tiempo

Amplitud

t

w

5w

10w

15w

Dominio de frecuencia

Análisis de ondas no-sinusoidales comunes • Ondas compuestas Mayoría de vocalizaciones animales son combinaciones de AM, MF, y señales periódicas no-sinusoidales (ondas compuestas) Se pueden descomponer en frecuencias portadoras y moduladas!

Análisis de vocalizaciones animales • Ondas compuestas Cualquier combinación es posible Portadora

Modulación MF AM MF

Onda modulante

Resultado

El principio de incertidumbre •

•

El análisis de Fourier necesita varios ciclos para calcular las frecuencias de una señal Entre mas ciclos mayor precisión en el calculo

El principio de incertidumbre

•

Si se analiza solo un segmento de tiempo corto de tiempo la frecuencia va ser una banda amplia Si el segmento es largo las frecuencias se definen con mas precisión Segmento medio Amplitude

Amplitude

Segmento corto

Frequency

Segmento largo Amplitude

•

Frequency

Frequency

El principio de incertidumbre Compromiso entre precisión en frecuencia y precisión en tiempo: f·t ≈ 1

Segmento medio Amplitude

Amplitude

Segmento corto

Frequency

Segmento largo Amplitude

•

Frequency

Frequency

Construir espectrogramas • Se divide el sonido en segmentos y se calcula el espectro de frecuencia para cada segmento.

Presión

t

Tiempo

Construir espectrogramas • Se divide el sonido en segmentos y se calcula el espectro de frecuencia para cada segmento.

Frecuencia

t

Tiempo

Construir espectrogramas • Luego se usa un gradiente de colores para representar la variación en amplitud entre las diferentes frecuencias

Frecuencia

t

Tiempo

Construir espectrogramas • El resultado es un grafico con frecuencia en el eje y, tiempo en el eje x y amplitud en el gradiente de colores

Frecuencia

t

Tiempo

Construir espectrogramas • El resultado es un grafico con frecuencia en el eje y, tiempo en el eje x y amplitud en el gradiente de colores

Frecuencia

t

Tiempo

Resolución del espectrograma

Frecuencia

• EL t (resolución en tiempo) es muy alta y por tanto muy baja en frecuencia (f). • EL f es de solo 5 Hz

Tiempo

Resolución del espectrograma

Frecuencia

• Si se disminuye el t 4 veces el f aumenta a 20Hz • Esto mejora la resolución de las bandas de frecuencia

Tiempo

Resolución del espectrograma

Frecuencia

• Si se vuelve a disminuir el t 4 veces el f aumenta a 80Hz

Tiempo

Resolución del espectrograma

Frecuencia

• Si se disminuye una vez mas el t 4 veces el f aumenta a 320 Hz • El patrón temporal de los últimos elementos se ve mas claro

Tiempo

Resolución del espectrograma

Frecuencia

• Si se disminuye una vez mas el t 4 veces (1280 Hz) • El patrón temporal de los últimos elementos se ve mas claro

Tiempo

Resolución del espectrograma

Frecuencia

• Si se disminuye una vez mas el t 4 veces (1280 Hz) • El patrón temporal de los últimos elementos se ve mas claro

Tiempo

Resolución del espectrograma

Frecuencia

• Un nivel intermedio es el que resuelve mejor el compromiso entre resolución en frecuencia y resolución en tiempo • Es necesario probar diferentes resoluciones!

Tiempo

Resolución del espectrograma

Frecuencia

La resolución en frecuencia debe ser: • Suficientemente baja para ver los harmónicos • Suficientemente alta para mostrar MF y MA

Tiempo

Digital Sound Analysis • At each sample point, the computer also digitizes the amplitude value into one of N equidistant categories. The number of categories depends on how many “bits” are used to store each value. N = 2number of bits • Music CDs store 16 bits/sample and thus divide the full amplitude range into 216 = 65,536 possible values.

Digital Sound Analysis • The higher the sampling rate and the higher the bit depth, the more accurately the digital recording captures the original sound. • However, increasing sampling rate or bit depth or both increases the size of the digital file that must be stored. • In stereo recording, two columns of numbers must be stored, taking up even more memory.

Digital Sound Analysis • Nyquist frequency: A digital recorder or computer must be able to take at least 2 samples/cycle to be able to identify each frequency. • Thus, if you digitize your sounds at R samples/sec, you will be unable to properly capture any component with frequency >R/2. This latter value is called the Nyquist frequency.

Digital Sound Analysis • Aliasing: If you do not sample your sounds at a high enough rate, any frequency in the sounds that is higher than half the sampling rate is aliased. This means you will see an artifact in your spectrograms consisting of an inverted version of what the sounds should have looked like if you had sampled at a sufficiently high rate. Not nice!

Digital Sound Analysis • Digital Bandwidths: In most computer sound analysis programs, you do not set the bandwidth f directly, but instead set the segment duration, t. • Instead of setting a time, you indicate t by specifying the number of consecutive sample points to be used for each frequency spectrum in the spectrogram. This is often called “frame size.”

Digital Sound Analysis • Windowing: If you cut a sound directly into segments (a rectangular window) to make a spectrogram, you introduce artifacts at the beginning and end of each segment. • This occurs because, with rectangular windows, each segment begins with no sound and is suddenly switched “on” and suddenly “off.” The frequency spectrum of sudden onsets and offsets must contain a wide smear of frequencies.