Tarea 2: creación de un corpus con etiquetas sintácticas (12/10/2017)
Saludos:
De entrada, una disculpa por el retraso en la presentación de la segunda tarea, la cual consiste en crear un corpus etiquetado sintácticamente, usando las funciones que hemos visto en clases anteriores.
Para esto, pueden acceder a dos colecciones de textos médicos en inglés, a través del siguiente link:
https://www.dropbox.com/sh/vwfbp0ek6hyw5wa/AABWtqeQ9bkyhG953hlhwo73a?dl=0
Una vez que hayan entrado a esta carpeta en Dropbox, seleccionen uno de estos corpus:
1. English_Medical_Corpus_01
2. English_Medical_Corpus_02
Una vez hecho esto, pueden almacenar dichos corpus en sus computadores. Ahora bien, cada corpus será procesado por dos equipos, p.e.: los equipos 1 y 2 trabajan con el English_Medical_Corpus_01, y los equipos 3 y 4 lo hacen con el English_Medical_Corpus_02.
Igualmente, les dejo aquí una guía con la descripción de las etapas a seguir para realizar esta tarea, a saber: generar un corpus anotado y hacer algunos análisis de frecuencia para describir el comportamiento de las palabras que contiene dicho corpus.
Para concluir, las condiciones de entrega del reporte de su tarea:
Cualquier consulta, mándenme un correo, o lo vemos en clase.
Suerte con todo.
Saludos:
De entrada, una disculpa por el retraso en la presentación de la segunda tarea, la cual consiste en crear un corpus etiquetado sintácticamente, usando las funciones que hemos visto en clases anteriores.
Para esto, pueden acceder a dos colecciones de textos médicos en inglés, a través del siguiente link:
https://www.dropbox.com/sh/vwfbp0ek6hyw5wa/AABWtqeQ9bkyhG953hlhwo73a?dl=0
Una vez que hayan entrado a esta carpeta en Dropbox, seleccionen uno de estos corpus:
1. English_Medical_Corpus_01
2. English_Medical_Corpus_02
Una vez hecho esto, pueden almacenar dichos corpus en sus computadores. Ahora bien, cada corpus será procesado por dos equipos, p.e.: los equipos 1 y 2 trabajan con el English_Medical_Corpus_01, y los equipos 3 y 4 lo hacen con el English_Medical_Corpus_02.
Igualmente, les dejo aquí una guía con la descripción de las etapas a seguir para realizar esta tarea, a saber: generar un corpus anotado y hacer algunos análisis de frecuencia para describir el comportamiento de las palabras que contiene dicho corpus.
Para concluir, las condiciones de entrega del reporte de su tarea:
- Fecha de entrega: martes 31 de octubre, máximo a las 11:59 p.m.
- El reporte me lo mandarán por correo, en formato de Word, en donde incluirán una breve descripción de los códigos que ocuparon para hacer la tarea, así como los resultados de cada etapa.
- Integren a su trabajo las frecuencias y los gráficos que generen sus programas.
- No hay una extensión máxima o mínima de páginas. En todo caso, esto depende de lo detallado o resumidos que quieran ser con su reporte.
Cualquier consulta, mándenme un correo, o lo vemos en clase.
Suerte con todo.