Buscar artículos

Secciones

Archivo

Marcas

Elige una opción del listado

Novedades

Dell Usb Dvd Drive-dw316

Lectores de CD para Portátiles Dell...

46,22 €

Monitor Lenovo L24i-4b

DESDE 23 HASTA 36 PULGADAS Lenovo...

118,17 €

Monitor Lenovo R32qc-30

DESDE 23 HASTA 36 PULGADAS Lenovo...

315,28 €

Monitor Lenovo R27qc-30

DESDE 23 HASTA 36 PULGADAS Lenovo...

243,22 €

Monitor Lenovo L24i-4a

DESDE 23 HASTA 36 PULGADAS Lenovo...

118,17 €

Todos los productos nuevos

Así ayudan aplicaciones de inteligencia artificial a mejorar la vida de las personas con discapacidad

Publicado el 15/01/2024

Asistentes personales como Siri o Alexa permiten encender la tele o apagar la luz con sólo pedirlo. Sin embargo, tienen problemas para entender a una persona con dificultad del habla. Lo mismo pasa con las aplicaciones que permiten escanear texto pero que no lo leen en voz alta, algo indispensable para alguien con discapacidad visual. La inteligencia artificial puede ser un apoyo para superar estas barreras, como programas entrenados para procesar todo tipo de discursos e inflexiones de la voz o gafas inteligentes que pueden describir nuestro entorno.

Algunos usos de la inteligencia artificial de los últimos años se centran en la generación de imágenes y vídeos a partir de instrucciones de texto, los conocidos como 'prompts'. Pero hay aplicaciones que permiten hacer el proceso inverso: subir una fotografía o grabar un vídeo y que una inteligencia artificial describa los elementos que aparecen en la imagen.

Es el caso de Be My Eyes, una aplicación que desde agosto de 2023 ha incorporado esta tecnología para describir imágenes a usuarios con discapacidad visual. Hasta ahora había que esperar a contactar con un voluntario a través de esta plataforma para recibir este tipo de asistencia, pero a través de la inteligencia artificial es más sencillo.

El modelo de lenguaje GPT-4, la misma tecnología que emplea ChatGPT, permite solicitar este apoyo a una inteligencia artificial y pedir ayuda a la hora de buscar objetos caídos, leer etiquetas o guiarnos a través de un lugar. Be My Eyes está disponible en la Play Store y en la App Store.

Ask Envision es otro proyecto que utiliza la tecnología de ChatGPT para dar nuevas herramientas a las personas con problemas de visión. En lugar de una aplicación móvil, Ask Envision hace uso de las gafas Envision: unas gafas con conexión a internet basadas en la tecnología de Google Glass que permite tomar imágenes de nuestros alrededores y hacernos una descripción de los elementos que nos rodean.

Por ejemplo, es posible escanear el menú de un restaurante y que lea la carta completa o preguntarle al asistente qué opciones vegetarianas existen. Las gafas Envision están disponibles desde 1.899 euros en su versión más básica.

La inteligencia artificial tiene su hueco en el mundo del sonido y el habla. Al igual que aplicaciones como Google Translate, que permite traducir cualquier conversación en tiempo real (una herramienta útil para preguntar direcciones en otros idiomas si viajamos), Google Live Transcript (disponible en la Play Store) realiza una transcripción en tiempo real de las conversaciones alrededor y avisa de sonidos como el ladrido de un perro o el timbre de una puerta.

Estas herramientas de traducción también se pueden usar en las lenguas de signos. Ese es el proyecto de Priyanjali Gupta, una estudiante de ingeniería en el Instituto de Tecnología Vellore, en India, que ha desarrollado una inteligencia artificial capaz de traducir en tiempo real la lengua de signos estadounidense (ALS, por sus siglas en inglés, usada en en Estados Unidos, Canadá y México) al inglés escrito.

La inteligencia artificial se puede usar como apoyo para desarrollar diferentes competencias o como un recurso terapéutico para los niños con dificultad del habla, como Timlogo. Es una plataforma online (sólo disponible en rumano) desarrollada por la compañía rumana Ascendia que ofrece juegos destinados a pacientes menores de edad y es capaz de analizar la pronunciación de los niños para detectar problemas específicos en su discurso y ofrecer ejercicios personalizados a través de esta tecnología.

Las personas con discapacidad auditiva pueden presentar problemas en el habla y que esto dificulte la comunicación oral con otras personas. Aunque existen herramientas capaces de convertir el texto escrito a voz (un proceso conocido como 'text-to-speech'), este tipo de sistemas no son del todo fluidos a la hora de mantener una conversación.

Para tratar de solucionar este problema, Google ha desarrollado Parrotron: una inteligencia artificial capaz de reconocer el discurso de una persona con dificultades para el habla y hacer que una voz sintética (aquella generada por ordenador y que es capaz de imitar nuestra forma de hablar) repita cada frase con una cadencia y prosodia consistente, aunque por el momento se encuentra en fase de investigación.

Los problemas en el habla pueden dificultar el uso de otra tecnología como los asistentes de voz, como Siri, Alexa o el Asistente de Google, que pueden ser útiles para personas con determinados tipos de discapacidad ya que nos permiten llamar a nuestros contactos, escuchar un podcast o encender las luces de una habitación con sólo un comando de voz.

Aunque estos sistemas están entrenados con cientos de grabaciones de voz para aprender a reconocer instrucciones orales, no están preparados para comprender el discurso de alguien que tenga dificultades para hablar. Pero poco a poco van surgiendo alternativas como Voiceitt: un modelo de inteligencia artificial centrado en usuarios con dificultad del habla y que se puede implementar en asistentes de voz como Alexa o emplear para generar transcripciones en reuniones online en plataformas como Webex. Voiceitt está disponible en español a través de una suscripción mensual de 50 dólares en su plataforma web.

Hay casos en los que una persona puede haber perdido la capacidad de habla de forma permanente, como los pacientes de Esclerosis Lateral Amiotrófica (ELA). Aunque los sistemas de conversión de texto a voz pueden facilitar la comunicación a quiénes ya no conservan el habla, estas herramientas se valen de voces sintéticas que pueden resultar impersonales y artificiales.

Gracias a la inteligencia artificial y a las voces clonadas (aquellas voces que imitan el habla, el timbre y la prosodia de una persona en concreto) se pueden sistemas de conversión de texto a voz personalizados que ayudan a los pacientes a mantener su identidad y mejorar su calidad de vida. Fue el caso del padre de Álvaro Medina, periodista en Prodigioso Volcán, que en colaboración con ahoLab pudo conservar su voz después de grabar diferentes muestras de su voz con un micrófono y crear un modelo acústico de la misma, una función que ya se encuentra disponible en dispositivos Apple.

Publicado en
Actualidad del sector

COMENTARIOS

No hay comentarios de clientes por ahora.

Utilizamos cookies propias y de terceros para analizar el uso del sitio web y mostrarte publicidad relacionada con tus preferencias sobre la base de un perfil elaborado a partir de tus hábitos de navegación (por ejemplo, páginas visitadas).

Política de cookies Personalizar cookies

Cookies funcionales

Descripción y cookies

Las cookies funcionales son estrictamente necesarias para proporcionar los servicios de la tienda, así como para su correcto funcionamiento, por ello no es posible rechazar su uso. Permiten al usuario la navegación a través de nuestra web y la utilización de las diferentes opciones o servicios que existen en ella.


PHP_SESSID	tiendasigloxxi.es	La cookie PHPSESSID es nativa de PHP y permite a los sitios web almacenar datos de estado serializados. En el sitio web se utiliza para establecer una sesión de usuario y para pasar los datos de estado a través de una cookie temporal, que se conoce comúnmente como una cookie de sesión. Estas Cookies solo permanecerán en su equipo hasta que cierre el navegador.	Sesión
PrestaShop-#	tiendasigloxxi.es	Se trata de una cookie que usa Prestashop para guardar información y mantener abierta la sesión del usuario. Permite guardar información como la divisa, el idioma, identificador del cliente, entre otros datos necesarios para el correcto funcionamiento de la tienda.	480 horas

Cookies publicitarias

Descripción

Son aquellas que recaban información sobre los anuncios mostrados a los usuarios del sitio web. Pueden ser de anónimas, si solo recopilan información sobre los espacios publicitarios mostrados sin identificar al usuario o, personalizadas, si recopilan información personal del usuario de la tienda por parte de un tercero, para la personalización de dichos espacios publicitarios.

Cookies de analíticas

Descripción

Recopilan información sobre la experiencia de navegación del usuario en la tienda, normalmente de forma anónima, aunque en ocasiones también permiten identificar de manera única e inequívoca al usuario con el fin de obtener informes sobre los intereses de los usuarios en los productos o servicios que ofrece la tienda.

Cookies de rendimiento

Descripción

Se usan para mejorar la experiencia de navegación y optimizar el funcionamiento de la tienda.

Otras cookies

Descripción

Son cookies sin un propósito claro o aquellas que todavía estamos en proceso de clasificar.

No te pierdas el email semanal de TeknoBot con consejos y contenido exclusivo. Tranqui, que puedes cancelar la suscripción cuando quieras.

Suscribirse al boletín

© 2024 Tienda Siglo XXI. Prohibida la reproducción total o parcial de los contenidos. Reservados todos los derechos.

Somos la tienda online oficial de Diario Siglo XXI y Viajes y Lugares. Un proyecto de Grupo Siglo XXI.

Así ayudan aplicaciones de inteligencia artificial a mejorar la vida de las personas con discapacidad

COMENTARIOS

Añadir un comentario