Ir al contenido principal

WaveNet, un sistema que ayuda a que las máquinas «hablen» como un ser humano



Invstigadores de DeepMind, empresa propiedad de Alphabet, anuncian un software que puede revolucionar la forma en la que los procesos informáticos y automátizados se relacionan con las personas gracias a un lenguaje más natural.

 
La Inteligencia Artificial es muy controvertida. Existe un crudo debate acerca de los posibles riesgos que puede provocar en un futuro y las ventajas que posibilitan para el desarrollo de la economía. Los seres humanos ya se comunican, desde hace tiempo, con las máquinas para determinados servicios y trabajos. Y, en los últimos tiempos, gracias a asistentes virtuales como Google Now, Cortana o Siri la sociedad ha tenido al alcance del bolsillo la oportunidad de interaccionar por voz con los aparatos electrónicos. 


Los avances tecnológicos en esta materia no echan el freno de mano. De cara a materializar un acercamiento de la voz artificial hacia la más natural, investigadores de DeepMind, empresa propietaria del gigante de internet, han anunciado la creación de WaveNet, un programa informático capaz de generar voz sintética basado en Inteligencia Artificial y que se comporta de una similar a la de un ser humano, un paso importante para hacer evolucionar las máquinas y los procesos automatizados. Según sus creadores, puede permitir que una manera hable exactamente igual que una persona.


Esta plataforma, que funciona como un sistema neuronal, rompe con la tradicional naturaleza robótica de la voz programada en los aparatos electrónicos para dotarle de naturalidad y matices propios del ser humano. El equipo de ingenieros asegura que el software puede «imitar a la perfección» una voz humana. Las muestras de voz se ha impulsado en diversos programas informáticos como Google Voice desde hace bastante tiempo, pero sintetizar y acercarse a una mayor naturalidad está resultando un gran desafío. Hasta el momento, la técnica común es una lectura virtual, es decir, una concatenación de texto a voz (TTS, en sus siglas en inglés) que combina fragmentos de un discurso grabado para generar las frases, que un sistema devuelve en función de la interacción realizada. 


El principal problema -dicen- es que este método no es capaz de alterar y modificar la base de datos y fragmentos existentes para crear algo desde cero, lo que provoca la situación actual: una voz «robótica» y enlatada. Mientras, en otros procesos informáticos se han basado en un método de texto a voz paramétrico que codifica la voz. El resultado, sin embargo, es incluso menos natural, dicen los investigadores. Y hacia la corrección de esta situación es adonde va WaveNet.


Para ello utiliza un «enfoque totalmente diferente», ya que en lugar de analizar, cruzar y devolver el audio almacenado en el software el sistema, basado en Inteligencia Artificial, es capaz de aprender. La idea es que se mueva sobre un contexto determinado, con sus matices lingüísticos, resolviendo incluso modos de expresión como la ironía o el sarcasmo, tal y como funcionan los sistemas neuronales. Logra este cometido al trabajar con 16.000 secuencias de palabras por segundo, con lo que el sistema puede generar sus propias muestras de audio, sin la intervención del ser humana. Utiliza una serie de estadísticas para predecir realmente qué pieza de sonido necesita en cada situación. 


Fuente: http://www.abc.es

www.conectareus.com


Comentarios

Entradas populares de este blog

Cómo protegerte de los cuatro ciberataques más populares en internet

ABC consulta con expertos y hackers las claves para protegerse de ataques de tipo «ransomware», «phishing», «adware» y «WiFi Hacking» La tecnología tiene sus beneficios, pero también sus pegas. Su vertiginoso desarrollo ha facilitado la vida de los usuarios; sin embargo, ha permitido que los delincuentes informáticos tengan más armas a su alcance. Y cada vez las utilizan más y mejor. Así lo demuestra, por ejemplo, el repunte de ciberataques gestionados por el Incibe . Si en el año 2014 estábamos hablando de 17.888 ciberataques; en 2018, se ascendió hasta los 111.519 incidentes. Nadie está completamente a salvo, ni particulares ni empresas. Pero eso no significa que no se le puedan poner las cosas especialmente difíciles a los atacantes. La empresa de formación tecnológica Keepcoding ha destacado cuatro de los ciberataques más populares actualmente en España. ABC consulta con hackers y expertos las claves para que el usuario pueda detectarlos a tiempo y evitarlos. Ransomware Pos

Western Digital presenta sus nuevos discos de red WD Red de 6 TB

WD ha presentado los nuevos discos de su galardonada serie de discos duros WD Red , diseñada para dispositivos de red NAS de entornos domésticos y pequeñas empresas. Han presentado dos nuevas unidades, de 5 y 6 TB de capacidad , además de la introducción de la nueva serie de discos duros WD Red Pro , éstos orientados a medianas y grandes empresas. Con estos últimos, ahora la serie de discos duros WD Red ofrecen las  capacidades de 1, 2, 3, 4, 5 y 6 TB, mientras que la nueva serie WD Red Pro se ofrece en capacidades de 2 y 4 TB de momento, aunque se espera un nuevo modelo de 6 TB pronto en esta serie. Según las palabras de Matt Rutledge, mánager general de WD Storage Technology,  “Con la expansión y la evolución de la familia WD Red, una vez más le proporcionamos a nuestros clientes las últimas innovaciones, ahora con 6 TB de capacidad por disco y con soporte para funcionar en dispositivos de 8 bahías. Además, la nueva serie WD Red Pro proporciona una mayor amplitud de mi

Las acciones de Alphabet (Google) alcanzan un máximo histórico y su crecimiento es imparable

Al día de hoy, Alphabet (que para efectos prácticos nos referiremos como Google) es una de las compañías tecnológicas más sólidas del mundo, y esto lo confirma con sus más recientes resultados financieros que corresponden al tercer trimestre de 2016 que concluyó el pasado 30 de septiembre. Las cifras que presenta Google son impresionantes compradas con lo mostrado el año anterior, lo que ha provocado que las acciones se hayan disparado hasta alcanzar un máximo histórico para la compañía. En resumen, Google está reportando ingresos por 22.451 millones de dólares, es decir, un incremento del 20% respecto al mismo periodo del año anterior, lo que significa que la estrategia del cambio hacia Alphabet ha sido un verdadero éxito. Google empieza a dejar de depender de la publicidad Algo que se destaca de los números que presenta Google para este trimestre es la baja en los ingresos por publicidad, algo que en otros años hubiera significado una caída global en ingresos debido a su d