Clase del 06/11/2015
Saludos:
Ya están disponibles las láminas de la clase de hoy, la cual será guiada por la Dra. Olga Acosta, investigadora post-doctoral asociada al Magíster en Procesamiento y Gestión de la Información (MPGI).
En concreto, seguimos trabajando con Sketch Engine, y ahora la idea es tratar de generar las primeras estadísticas relacionadas con el vocabulario contenido en dos corpus, uno en inglés y otro en español, los cuales están conformados por 10 artículos de medicina cada uno.
Complementario a esto, verán también un modelo de análisis lingüístico que se conoce como Ley de Zipf, la cual nos permite determinar cuáles son las palabras más relevantes que describen el contenido de un texto, o en nuestro caso una colección de textos (esto es, un corpus). La idea de manejar la ley de Zipf es crear un modelo estadístico de lenguaje, el cual puedan aplicar en una tarea de traducción.
Cualquier consulta, pueden enviarme un correo, o lo vemos en la siguiente clase.
Suerte con todo.