Verificación de locutor en conjunto cerrado, dependiente del texto y en ambiente controlado utilizando Matlab

By: Martínez Ruiz, Juan CarlosContributor(s): Cardenas Acuña, Diego Armando [Autor] | Granados Figueroa, Expedito Ingeniero Electricista, MPE [Director]Material type: Mixed materialsMixed materialsLanguage: Spanish Series: Ingeniería ElectrónicaPublisher: Bucaramanga Universitaria De Santander, UDES 2003Description: 82 p. + CdOther classification: T 26.03 Dissertation note: Facultad Ingenierías - Ingeniería Electrónica Ingeniero Electrónico Universitaria de Santander UDES 2003 Summary: En las últimas décadas, empresas y centros de investigación de todo el mundo han invertido un gran esfuerzo en el desarrollo de sistemas inteligentes, es decir, sistemas con capacidad de percepción, aprendizaje, razonamiento y comunicación. Estos esfuerzos han dado lugar a campos de investigación completamente nuevos, como la visión artificial, la síntesis de voz, el reconocimiento del habla y la inteligencia artificial, etc. En particular, la comunicación con las máquinas, realizada típicamente a través de teclados, mandos, botones, etc. (elementos rudimentarios si los comparamos con el lenguaje hablado, forma natural de comunicación entre los seres humanos), constituye uno de los principales problemas pendientes. Tratar de "civilizar" a las máquinas para que aprendan a comunicarse mediante el habla requiere no sólo dispositivos tecnológicos avanzados (equivalentes al oído y al aparato fonador) sino también desarrollos a nivel teórico (lo que propiamente se denominaría lenguaje, que engloba aspectos gramaticales, léxicos, semánticos y prácticos), íntimamente ligados a la inteligencia artificial. En el pequeño mundo de la comunicación hombre-máquina mediante el habla se distinguen varios campos de investigación: síntesis de voz, reconocimiento del habla, reconocimiento del locutor, traducción de lengua hablada e identificación de la lengua. El nivel de desarrollo a nivel mundial de cada uno de estos campos no es el mismo. Los sistemas de reconocimiento automático del habla para grandes vocabularios, discursos continuos e independientes del locutor, así como la verificación del locutor y de la lengua y los sistemas de traducción automática se desarrollan con mayor o menor éxito en laboratorios de investigación de universidades o en departamentos de innovación y desarrollo de grandes empresas del mundo de la informática y de las telecomunicaciones tales como IBM, AT&T, Philips, etc. Es precisamente “La verificación del locutor” el objeto de este escrito, en donde el grado de desarrollo ha sido inferior al de las otras tecnologías. Además, esta técnica presenta una serie de dificultades, como por ejemplo, verificar que la voz no está grabada, discriminar la voz del ruido (ambiental o del medio de transferencia) y efectuar la identificación con fiabilidad. Superando estos inconvenientes, es posible que la máquina identifique o verifique satisfactoriamente la identidad de una persona, a través de la señal de voz. Una de sus principales finalidades es la utilización en aplicaciones donde la seguridad sea indispensable, ya que la voz es la característica biométrica, personal e intransferible, más fácil de transmitir, frente a otros sistemas como huellas dactilares, análisis de la retina, etc. El texto del presente proyecto se desarrollo en cinco capítulos así: En el primer capítulo se describe fisiológicamente el sistema fonador humano y la forma como se genera la voz, la definición de sonido y su clasificación, también se trata el modelo básico de la producción de voz y por último el diagrama de bloques de su formación. Las herramientas y algoritmos matemáticos utilizados para el análisis y procesamiento de la voz humana son tratados en el segundo capítulo. La descripción del proceso para la verificación del locutor está contenido en el tercer capítulo, junto con la descripción del hardware empleado, los parámetros establecidos para las herramientas y algoritmos matemáticos implementados. El cuarto capítulo contiene las pruebas realizadas con el software implementado, los gráficos de las muestras obtenidas y las tablas de aceptación y rechazo. Por último se presentan en los anexos, una introducción al Matlab, Redes Neuronales Artificiales y el manual del usuario de la interfaz gráfica desarrollada.
List(s) this item appears in: Ingeniería Industrial
Tags from this library: No tags from this library for this title. Log in to add tags.
    Average rating: 0.0 (0 votes)
Item type Current location Collection Call number Vol info Copy number Status Date due Barcode Item holds
Trabajos de Grado Trabajos de Grado Biblioteca Central UDES- Bucaramanga
Colección de Monografías y Trabajos de Grado T 26.03 M178v (Browse shelf) 1 Ej. 1 Not for loan 009124
Total holds: 0

Facultad Ingenierías - Ingeniería Electrónica Ingeniero Electrónico
Universitaria de Santander UDES
2003

En las últimas décadas, empresas y centros de investigación de todo el mundo han invertido un gran esfuerzo en el desarrollo de sistemas inteligentes, es decir, sistemas con
capacidad de percepción, aprendizaje, razonamiento y comunicación. Estos esfuerzos han dado lugar a campos de investigación completamente nuevos, como la visión artificial, la síntesis de voz, el reconocimiento del habla y la inteligencia artificial, etc. En particular, la comunicación con las máquinas, realizada típicamente a través de teclados, mandos, botones, etc. (elementos rudimentarios si los comparamos con el lenguaje hablado, forma natural de comunicación entre los seres humanos), constituye uno de los principales problemas pendientes. Tratar de "civilizar" a las máquinas para que aprendan a comunicarse mediante el habla requiere no sólo dispositivos tecnológicos avanzados (equivalentes al oído y al aparato fonador) sino también desarrollos a nivel teórico (lo que propiamente se denominaría lenguaje, que engloba aspectos gramaticales, léxicos, semánticos y prácticos), íntimamente ligados a la inteligencia artificial.

En el pequeño mundo de la comunicación hombre-máquina mediante el habla se distinguen varios campos de investigación: síntesis de voz, reconocimiento del habla, reconocimiento del locutor, traducción de lengua hablada e identificación de la lengua. El nivel de desarrollo a nivel mundial de cada uno de estos campos no es el mismo. Los sistemas de reconocimiento automático del habla para grandes vocabularios, discursos continuos e independientes del locutor, así como la verificación del locutor y de la lengua y los sistemas de traducción automática se desarrollan con mayor o menor éxito en
laboratorios de investigación de universidades o en departamentos de innovación y desarrollo de grandes empresas del mundo de la informática y de las telecomunicaciones tales como IBM, AT&T, Philips, etc.

Es precisamente “La verificación del locutor” el objeto de este escrito, en donde el grado de desarrollo ha sido inferior al de las otras tecnologías. Además, esta técnica presenta una serie de dificultades, como por ejemplo, verificar que la voz no está grabada, discriminar la voz del ruido (ambiental o del medio de transferencia) y efectuar la identificación con fiabilidad.

Superando estos inconvenientes, es posible que la máquina identifique o verifique satisfactoriamente la identidad de una persona, a través de la señal de voz. Una de sus principales finalidades es la utilización en aplicaciones donde la seguridad sea indispensable, ya que la voz es la característica biométrica, personal e intransferible, más fácil de transmitir, frente a otros sistemas como huellas dactilares, análisis de la retina, etc.

El texto del presente proyecto se desarrollo en cinco capítulos así:

En el primer capítulo se describe fisiológicamente el sistema fonador humano y la forma como se genera la voz, la definición de sonido y su clasificación, también se trata el modelo básico de la producción de voz y por último el diagrama de bloques de su formación.

Las herramientas y algoritmos matemáticos utilizados para el análisis y procesamiento de la voz humana son tratados en el segundo capítulo.
La descripción del proceso para la verificación del locutor está contenido en el tercer capítulo, junto con la descripción del hardware empleado, los parámetros establecidos para las herramientas y algoritmos matemáticos implementados.

El cuarto capítulo contiene las pruebas realizadas con el software implementado, los gráficos de las muestras obtenidas y las tablas de aceptación y rechazo.

Por último se presentan en los anexos, una introducción al Matlab, Redes Neuronales Artificiales y el manual del usuario de la interfaz gráfica desarrollada.

There are no comments on this title.

to post a comment.
Copyright © 2014 Universidad de Santander :: PBX 57-7-6516500 - Todos los derechos reservados
Institución sujeta a inspección y vigilancia por el MEN