¿Te gustaría grabar tu voz u otros sonidos?, aquí te damos una idea

¿Te gustaría grabar tu voz u otros sonidos?, aquí te damos una idea

Araceli Casas Corder,
Oscar Cruz Mendoza y
Jorge Uriel Jurado Muñoz
Cita
DOI: http://doi.org/10.22201/codeic.16076079e.2017.v18n8.a3
Recepción: 04/09/17. Aprobación: 06/11/17.

Resumen

El artículo expone de forma general, el tema de las señales acústicas en el ambiente, el registro, la conversión a formato digital y el almacenamiento del sonido empleando la placa Arduino. La secuencia de los temas, promueve el análisis y está enfocado al desarrollo de un dispositivo para grabar sonido. Se propone el uso de recursos open source para realizar un diseño a las necesidades de un proyecto y facilitar la recolección de información de audio, aplicado al estudio de eventos naturales. Adicionalmente, es importante considerar que la cantidad de información de naturaleza sonora es muy demandante en espacio de memoria, sin embargo, la disponibilidad de componentes que almacenan, así como los electrónicos, son cada vez más económicos. Desarrollar instrumentos que ayuden al estudio y análisis impulsará el desarrollo tecnológico en la comunidad académica.
Palabras clave: grabador de audio, Arduino, shannon-nyquist, microcontrolador, señales.

Would you like to record your voice or other sounds? We give you an idea

Abstract

The paper exposes the essential about the subject of acoustic signals environments, record, convert A/D and store audio files, using Arduino microcontroller board. The topic has been structured to promote the analysis and it focuses the interest of systems development to record sound using open source technology, in order to make a design appropriate to the project needs, and to facilitate the audio data compilation applied to the study of natural events. In addition, it is important to consider that the amount of data information from sound nature is very demanding in device memory space, however, the availability of components that store information as well as electronic are increasingly economical. To develop instruments that to assist to the study and analysis should motivate to development of the technology into academic community.
Key words: record sound, arduino, shannon-nyquist, microcontroller, signals.

Introducción

El estudio de fenómenos naturales, analizado desde diversas áreas de conocimiento a menudo carece de un enfoque sistemático. La cantidad de información que se recolecta, regularmente sobrepasa la capacidad de los métodos tradicionales o manuales, así como la falta de equipo apropiado, sin embargo, las tareas se pueden facilitar con el uso de tecnología open source.

Un caso para compartir, es una sección en el sitio de la Fonoteca Nacional de México titulada “Los sonidos en peligro de extinción”, la cual es una colección de sonidos que con el paso del tiempo han dejado de existir en nuestro entorno; por ejemplo, el sonido del afilador, el carro de helados, etcétera. Es natural preguntarse ¿cuáles serán los sonidos que hoy se nos hacen comunes, pero que estarán extintos a futuro?, el esfuerzo de esta recopilación es el fruto del interés de áreas como: antropología, urbanismo, psicología, tecnología, entre otras.

La idea de grabar sonidos y convertirlos en una aplicación útil para la sociedad, motiva a impulsar a la comunidad a que se una al mundo del desarrollo tecnológico. El material responde a las preguntas tales como: ¿Qué elementos electrónicos requiero para procesar el sonido?, ¿Cómo funciona? Y para finalizar ¿Porque es importante hacerlo?

En la Dirección General de Cómputo y de Tecnologías de Información y Comunicación (DGTIC) de la Universidad Nacional Autónoma de México (UNAM), apoyamos el desarrollo de interfaces electrónicas basadas en microcontroladores para promover la innovación tecnológica que respalden los proyectos académicos de la comunidad universitaria.

En breve la naturaleza del sonido

El sonido es una energía que se propaga en forma de ondas a través del aire o de cualquier otro medio que tenga propiedades elásticas, masa e inercia. Las vibraciones u oscilaciones que produce, son similares a las que se observan en las cuerdas de una guitarra. Las ondas sonoras describen un cambio de presión en el medio que se propagan y esto ocurre porque las vibraciones al desplazarse (en todas direcciones) chocan con las moléculas cercanas, se replican en las moléculas colindantes y se disipan en el entorno, cuando estos cambios de presión llegan hasta el sistema auditivo entonces se percibe lo que se reconoce como sonido (Estudio de Música Electroacústica, 2013).

Los elementos de análisis del movimiento periódico se emplean para estudiar el comportamiento del sonido, como se muestra en la figura 1.

Figura 1. Comportamiento del sonido.

El ciclo de la onda (línea anaranjada), es un segmento que describe una secuencia repetitiva de cambios de presión, en el primer caso (de izquierda a derecha), corresponde a un valor inicial de presión igual a cero y el ciclo se cumple cuando regresa nuevamente a cero, pasando por valores bajos y altos. Los dos casos adicionales que se muestran, también describen un ciclo que se completa en los puntos negativos o positivos de los extremos. La amplitud describe el cambio de presión desde un valor máximo a uno mínimo; los valores de la onda más bajos tienden al silencio.

La frecuencia se mide en Hertz (Hz) y se refiere al número de ciclos por segundo. Un tono musical alto o agudo, presenta una frecuencia elevada y por el contrario un tono grave tiene una frecuencia baja. Para tener una idea más clara de esto, te recomendamos ingresar a este sitio para experimentar algunos tonos variando la frecuencia: Online Tone Generator.

La fase indica la posición de una forma de onda en un ciclo; cero grados indica el inicio de la onda, 900 es el máximo valor de presión, 1800 el punto central, 2700 la posición de presión más baja y 3600 el punto final.

Las ondas de sonido, en la realidad son más complejas, en la figura 2, se presenta una aproximación de las ondas sonoras de la voz humana emitiendo el sonido al pronunciar la letra “A”.

Figura 2. Gráfica del sonido. Basada en Cancela Duarte (2017).

En las notas musicales, se presenta un modelo de ondulación regularmente uniforme, debido a que cada nota está constituida por un patrón. Este comportamiento se logra empleando cualquier objeto que produzca vibraciones y estas perturben el aire en forma regular, pero sólo será audible si el rango de frecuencia se encuentra entre los 20Hz a 20kHz.

En la naturaleza existen sonidos inferiores a la frecuencia de 20Hz (infrasónicos), presentes en el registro de movimientos sísmicos, así también, las frecuencias superiores a 20kHz (ultrasónicas) a través de las cuales se comunican especies animales como los murciélagos o delfines para facilitar la navegación. Estas frecuencias, son imperceptibles para el oído humano.

Las intensidades sonoras varían en un rango muy amplio, por lo que existe una escala útil para cuantificarlas (ver tabla 1) y la unidad es el decibel, el cual es una relación logarítmica entre dos magnitudes (Jay Newman, 2008: 272).

Esta magnitud se debe tener en cuenta al seleccionar el micrófono, porque la intensidad del sonido que se graba depende de la sensibilidad de este dispositivo.

Sonido Nivel de Intensidad (dB)
Nivel auditivo del ambiente 0
Conversación normal (a 1m) 60
Turbina de avión 130
Ruptura del tímpano 160

Tabla 1. Basada en Jay Newman (2008: 272).

Interacción entre las ondas

Los sonidos en el ambiente interactúan entre sí (véase figura 3), describiendo el siguiente comportamiento:

Se suman o se restan. Cuando coinciden perfectamente en fase, las ondas se refuerzan entre sí. Al sumarse tendrá una amplitud mayor que las ondas individuales. Se cancelan. En el caso de que los picos de las ondas se encuentren desfasados, se cancelan, lo que provoca que se minimice o anule el valor de la amplitud. Se combinan. Cuando las ondas se encuentran, se desfasan en diversas magnitudes y se produce una onda combinada, visualmente la onda resultante puede no tener relación con la original.

Figura 3. Basada en Urrea Harold (2013).

Captura de sonido

En 1877 Thomas Alva Edison inventó la máquina parlante o fonógrafo (ver figura 4), este dispositivo capturaba el sonido mediante un cilindro con relieves grabados en una hoja delgada de aluminio en contacto con una aguja y unido a un diafragma, el sistema además de registrar el sonido también era capaz de reproducirlo, el funcionamiento estaba basado en señales analógicas (The Editors of Encyclopædia Britannica, 2015).

Figura 4. Thomas Alva Edison y la máquina parlante.
Fuente: Minuto a minuto comunicación.

Actualmente se utilizan componentes electrónicos para registrar las señales acústicas, debido a que se obtienen buenos resultados, así también, el tamaño de los dispositivos cada vez es menor porque el tamaño de las partes electrónicas ha reducido su tamaño. Cuando estos sistemas cumplen la función de transformar la naturaleza de las señales, se les conoce como transductores. Los procesos para capturar el sonido son:

Registro de sonido

La primera etapa consiste en transformar la señal sonora en una onda eléctrica, mediante un micrófono (transductor); este dispositivo tiene en su interior una membrana sensible que vibra al captar el sonido y la señal se transforma en un flujo eléctrico.

Una característica a considerar en un micrófono es la sensibilidad, si es omnidireccional podrá captar una fuente sonora ubicada desde cualquier punto como en el caso del sonido ambiental; otros estarán restringidos a captar las señales en una ubicación determinada, es decir, al frente o en un ángulo específico. En un estudio de grabación, el tipo unidireccional evita la interferencia con otros sonidos, el tipo bidireccional presenta mayor sensibilidad en la parte delantera y trasera, sin embargo, bloquean la información proveniente de una dirección diferente (González Ruiz, 2015).

Amplificación de señal

La señal eléctrica que produce un micrófono es débil por naturaleza, por lo que es necesario amplificarla. Durante esta etapa se utilizan elementos electrónicos pasivos como: capacitores, inductores, resistores, además de elementos activos como: transistores, amplificadores operacionales, entre otros; con lo cual se completa la etapa de amplificación y filtrado en la señal para eliminar el ruido, hasta este punto la información sonora es analógica. Un altavoz basa su función en un circuito amplificador (ver figura 5).

Figura 5. Basada en Guaida David (2013).

Conversión de señal analógica a digital

La señal analógica del sonido al convertirse en una onda eléctrica, presenta una variación continua en la amplitud y la magnitud corresponde a valores de voltaje con referencia al tiempo.

Una forma alternativa de representación de la señal es una secuencia de números, cada uno de los cuales representa una magnitud en un instante determinado (Sedra Adel, 1999: 24). En la figura 6a, la trayectoria de la curva, representa magnitudes de voltaje y tiempo, al definirse intervalos iguales en el eje del tiempo (t0, t1, etcétera) y proyectarlos a la curva se determina un valor correspondiente de magnitud (voltaje), este proceso se conoce como muestreo (figura 6b).

Figura 6. Basada en Sedra Adel (1999: 21).

La naturaleza de la señal acústica representada, utilizando el método de muestreo, deja de ser continua y se le conoce como de tiempo discreto (ver figura 6b) es decir, los valores v1, v2 … vn están determinados por la proximidad que se determine para los valores t1, t2, … tn, por lo que habrá más valores de voltaje (v) de la onda si en un lapso de tiempo determinado se toman más muestras, y resultará una mejor representación de la señal original.

La conversión analógica implica transformar los valores o variaciones de voltaje (v1, v2 … vn) en código binario, representado por los dígitos 0 y 1, los cuales son equivalentes a apagado (OFF) o encendido (ON), es decir, se reconocen dos estados diferentes, esto es debido a que, en la electrónica digital, así como en sistemas de automatización eléctrica se trabaja con señales que solo pueden tomar dos valores, mediante la combinación de estos, se diseñan los circuitos digitales (véase figura 7).

Figura 7. Secuencia que muestra el proceso descrito para obtener la señal digital.

A través de dispositivos electrónicos se realiza el proceso de conversión de datos analógicos a digital, estos componentes, toman muestras a una determinada frecuencia, la unidad de esta magnitud es en hertz (Hz). Las tasas o frecuencias de muestreo estándar en audio digital son 24 kHz, 30 kHz, 44.1 kHz o 48 kHz, lo cual implica que a menor frecuencia (24 kHz) la calidad es menor, así como el espacio de almacenamiento requerido. A diferencia de la muestra a 48 kHz en donde la fidelidad de la señal es mejor, pero requiere más espacio de memoria para almacenar información.

Los datos de frecuencia están basados en el teorema Nyquist-Shannon y se aplica para obtener una muestra satisfactoria a partir de la señal original, por lo que una vez que se determina el máximo valor de la frecuencia deseada entonces se debe realizar el muestreo equivalente a por lo menos dos veces esa frecuencia. Es decir, considerando el máximo rango de capacidad auditiva del oído humano que corresponde a 20 kHz por segundo, entonces las muestras deben corresponder a 40 kHz.

Escritura de datos

La tecnología electrónica de los microcontroladores ofrece una excelente opción para llevar a cabo el proceso de conversión de señal analógica a digital. El circuito integrado, tiene en su interior los módulos descritos, los cuales se configuran a través de lenguaje de programación. Una de las características técnicas de los microcontroladores a considerar es la capacidad de datos que manejan 4, 8, 16 o 32 bits, los usados comúnmente son los de 8 bits.

El muestreo de una señal tiene más precisión, mientras se pueda disponer de un mayor número de bits en el microcontrolador, en la figura 8, la señal con 3 bits de resolución presenta una forma escalonada y una pérdida de calidad importante, en la parte superior de la gráfica, hay información que no logra registrar, sin embargo, el muestreo de la señal a 16 bits presenta una aproximación más cercana a la curva.

Figura 8. Basada en Aka (2015).

El muestreo a 3 bits presenta 7 valores y en el caso de 16 bits son 65 536 valores en amplitud o voltaje y como se mencionó, los requerimientos de memoria de almacenamiento corresponden a la resolución empleada, sin embargo, debido a que el microcontrolador no tiene una memoria de almacenamiento que soporte la cantidad información que generan los datos de sonido, es necesario contemplar una memoria externa para conservar la información.

Figura 9. Interacción de comunicación de circuito integrado del microcontrolador con la entrada de señal, almacenamiento y reproducción.

El proceso implica que el microcontrolador entregue datos al dispositivo de almacenamiento. La velocidad de transmisión y recepción deberán estar sincronizadas para que los datos no presenten errores.

Los datos que el microcontrolador envía a la unidad de almacenamiento, se someten a un proceso para generar un archivo de audio estándar como los formatos WAV, MP3, FLAC, etcétera, mediante la elaboración de código de programación.

Reproducción

Los archivos con formato de audio, contienen informacióncodificada, como la velocidad de muestreo, de reproducción, capacidad, tasa de transferencia en red, tipo de compresión, etcétera (Wallace, 2015: 27; Rumsey, 2008: 707), los datos recopilados están en relación con el tipo de archivo (WAV, MP3, etc.) y la calidad corresponde a la cantidad de muestras tomadas por segundo.

Existen múltiples formatos de audio digitales, por ejemplo, el MP3 es un formato muy compacto y eso le da importantes ventajas para la transferencia de audio en aplicaciones en línea, aunque soporta hasta 44.1 kHz de muestreo, a diferencia de un formato WAV, el cual ocupa mayor espacio de almacenamiento porque es un formato que no tiene compresión y su tasa de frecuencia máxima es de 48 kHz (Stack Exchange Inc. Blog., 2014), sin olvidar que existen otras opciones de formatos libres como Aiff, Ogg, Opus, etcétera.

El archivo de audio, almacenado en la memoria externa (ver figura 9), se puede reproducir en cualquier dispositivo que pueda interpretarlo por sí mismo o a través de una aplicación que lo decodifique, por lo que, si los datos están comprimidos, realizará el procedimiento para descomprimir, así también leerá la información contenida en el archivo y reproducirá el sonido, conociendo la velocidad y otros datos mencionados.

La naturaleza de audio digital corresponde a una representación aproximada de la onda originalmente analógica. En el caso de que hubiera pérdidas en los valores de muestreo entonces se produce un audio deficiente, aunque actualmente hay técnicas que superponen valores para lograr que los defectos sean imperceptibles.

Conoce nuestro proyecto

El Laboratorio de Microcontroladores en la DGTIC, UNAM, desarrolló un dispositivo con tecnología open source, que captura sonido, utilizando la tarjeta Arduino UNO, el sistema graba audio y lo almacena en una memoria SD como formato de audio digital WAV. El archivo queda reservado para su edición o reproducción. Utiliza un micrófono electret, con una sensibilidad de -50 dB y -70 dB, así también, el circuito realiza las funciones de amplificación y filtrado de ruido. Mediante el microcontrolador ATMega328P (Arduino UNO) se convierten señales analógicas a digitales, se crea el archivo de audio digital en formato WAV y se almacena el audio en una memoria externa. El consumo de energía es de 5V (ver figura 10).

La gestión de los procesos en la placa Arduino se realizan a través de código de programación. Sin embargo, la parte fundamental del proyecto, fue ajustar los ciclos de trabajo en el circuito integrado ATMega328P, es decir, mientras un ciclo se encarga de leer valores (muestreo), otro escribe esos valores a la velocidad adecuada para generar el archivo WAV. Ambos ciclos desempeñan su trabajo en momentos diferentes pero sincronizados de tal forma que no haya pérdida de información. La técnica implica desarrollar código para que el componente realice más operaciones por segundo, aumentando el rendimiento, también conocido como overclocking.

El proyecto en su estado actual funciona y se encuentra disponible para su uso en cualquier proyecto académico, para solicitar información escribanos a microprocesadores@unam.mx.

Figura 10. Dispositivo de grabación de audio en Arduino, en donde se identifican las etapas descritas al inicio.

Proyecto a futuro

Este dispositivo es versátil, porque permite añadir sensores y otras funciones, el trabajo puede tomar las siguientes líneas.

  • Control de dispositivos mediante comandos de voz, para activar, pausar o apagar electrodomésticos, sistemas al interior de un edificio o casa habitación y otros instrumentos que utilicen conexión internet con una interface de audio.
  • Desarrollo de interfaces interactivas de audio (entrada/reproducción), con aplicaciones para discapacidades.
  • Dispositivo portátil para el registro de sonidos de fauna animal en su hábitat natural, terrestre o marítimo, aplicado en las áreas de biología, antropología, entre otros.
  • Grabador y reproductor de guías vocales en museos interactivos.

El desarrollo de proyectos como el descrito permite conformar grupos multidisciplinarios que promueven el desarrollo tecnológico aplicado a investigación y/o docencia, y la formación integran en alumnos participantes.

Referencias

Show Buttons
Hide Buttons

Revista Digital Universitaria Publicación bimestral Vol. 18, Núm. 6julio-agosto 2017 ISSN: 1607 - 6079