Máquinas más humanas

Después de hablar durante una hora con un Premio Nacional de Informática entiendes que no hay precisión sin emoción, ni máquina capaz de sustituir a un ser humano. Aunque ellas, las máquinas, también pueden aprender. Enrique Vidal y más de cien informáticos, ingenieros y científicos trabajan para que la tecnología…

Máquinas más humanas

Después de hablar durante una hora con un Premio Nacional de Informática entiendes que no hay precisión sin emoción, ni máquina capaz de sustituir a un ser humano. Aunque ellas, las máquinas, también pueden aprender. Enrique Vidal y más de cien informáticos, ingenieros y científicos trabajan para que la tecnología mejore la vida de quien la usa.

Enrique Vidal, Premio Nacional de Informática 2011. Foto: Luis Zurano/Comunicación Científica UPV.

Enrique Vidal, Premio Nacional de Informática 2011. Foto: Luis Zurano/Comunicación Científica UPV.

Son las 4 de la tarde de un viernes de diciembre y en ese extremo de la Universitat Politècnica de València (UPV) no hay ni un alma a quien preguntarle donde está el despacho de Enrique Vidal, así que encontrar su centro de operaciones entre los laberínticos edificios de la Ciudad Politécnica de la Innovación más bien parece una prueba eliminatoria, «si consigues llegar podrás hacer la entrevista» bromea el Catedrático de la UPV. Vidal atiende a un miembro de su equipo, él es argentino y forma parte de un selecto grupo de más de cien expertos especializados en campos tan dispares como la Visión por Computador, el Procesamiento del Lenguaje o la Robótica. Todos ellos colaboran en un ambicioso proyecto de cinco años del programa Consolider Ingenio 2010, denominado MIPRCV (Multimodal Interaction in Pattern Recognition and Computer Vision) y coordinado por el Premio Nacional de Informática Aritmel 2011, Enrique Vidal.

«Qué músico no sueña con trasladar ese momento de inspiración a una partitura con un solo clic. A qué periodista no le gustaría pasar una entrevista a un documento de texto automáticamente». Pues esto ya se puede hacer, estas herramientas y otras similares ya están en la calle aunque lo cierto es que no convencen. ¿Por qué? Porque fallan mucho. En subsanar los errores que las hacen poco fiables trabaja el equipo Patern Recognition and Human Language Technologies (PRHLT), que codirige este catedrático de la UPV.

Doctor en Ciencias Físicas, se descubre cuando habla de ‘machine learning’ (aprendizaje computacional, o de las máquinas). Su pasión y su apuesta pasan por la sinergia entre el ser humano y la máquina, «que interactúen, que exista un ‘feedback’ entre el usuario y su herramienta». Usar un traductor on line y que paralelamente necesites a un profesional que edite el texto no tiene sentido, comenta. Pero, si el usuario puede indicar a la máquina dónde está el error y ésta lo asume como tal, la optimización de los resultados desembocará en una herramienta hecha a su medida.

«Qué músico no sueña con trasladar ese momento de inspiración a una partitura con un solo clic. A qué periodista no le gustaría pasar una entrevista a un documento de texto automáticamente»

Con los coches pasaría igual, prosigue. «Quizás no sería una buena idea automatizar totalmente la conducción; pero sí lo es facilitar el proceso». Desde el punto de vista de la conducción asistida, el conductor y el vehículo colaboran en la tarea de conducir, gracias a sensores avanzados el vehículo asiste al conductor en aspectos como la detección de obstáculos u otros peligros que pueden pasan inadvertidos al conductor y éste reacciona corrigiendo las decisiones o sugerencias del vehículo mediante el uso de los mandos habituales (volante, frenos, etcétera), además de otras modalidaes como la mirada o el habla.

La novedad de su trabajo respecto a los planteamientos tradicionales de reconocimiento de formas y visión por computador es que ya no se busca suplir al usuario, sino que la máquina sea una prolongación de éste, una asistente. A través del proyecto se persigue que las máquinas ayuden a predecir las intenciones de quien conduce, asumiendo que la persona sea quien decide.

Para este incombustible investigador valenciano no se debe sustituir a un traductor, ni a un conductor y ni mucho menos a un médico, pero sí facilitar su trabajo. Existen píldoras que en realidad son cámaras, cápsulas que portan en su interior un aparato capaz de captar imágenes a su paso. Pues bien, estas grabaciones ofrecen tal cantidad de información que localizar dónde está la dolencia sería realmente complicado. Por ello su esfuerzo se centra en acotar dónde están las irregularidades a través del intercambio de información entre la herramienta en cuestión y el doctor. El equipo MIPRCV trabaja bajo una misma consigna y es que «la tecnología debe ser un complemento para facilitar la vida a quien la usa».

Multimodal Interactive Handwritten Transcription.

Multimodal Interactive Handwritten Transcription.

Paleógrafos 3.0


Algunas de las propuestas de MIPRCV ya pueden ser utilizadas, advierte Enrique Vidal. Se refiere al demostrador de Multimodal Interactive Handwritten Transcription, una herramienta que se cuela en el hermético mundo de los estudiosos de la escritura de documentos antiguos, los paleógrafos. A través de esta aplicación estos profesionales tienen a su alcance la posibilidad de trabajar sobre un códice, por ejemplo. Pasando el ratón sobre las líneas de este manuscrito aparece superpuesta su transcripción, ofreciendo sobre cada palabra múltiples posibilidades. El profesional detecta las palabras que no le gustan y las sustituye. De este modo la herramienta se retroalimenta y así evita errores futuros. El sistema aprende de sus propios fallos y evita repetirlos, base del aprendizaje humano.