Clase del jueves 14/09/2017
Saludos:
Ya están disponibles las láminas de la clase de hoy, seguimos trabajando con corpora lingüísticos. Lo primero que haremos será aplicar un proceso de etiquetado sintáctico a un documento que vamos a descargar de Internet. Este texto lo vamos a descargar del sitio perteneciente al Projecto Gutenberg:
www.gutenberg.org
Igualmente, vamos a explorar algunos recursos de NLTK para trabajar con colecciones de datos lingüísticos, particularmente el Brown Corpus y el Inaugural Address Corpus. Para ello, vamos a revisar uno de los capítulos del libro electrónico sobre NLTK:
Bird, S.; Klein, E.; y Loper, E. (2009): "Accessing Text Corpora and Lexical Resources", en Natural Language Processing with Python. Sitio electrónico: http://nltk.org/book/ch02.html.
Cualquier consulta, lo podemos ver en clase.
Suerte con todo.
Ya están disponibles las láminas de la clase de hoy, seguimos trabajando con corpora lingüísticos. Lo primero que haremos será aplicar un proceso de etiquetado sintáctico a un documento que vamos a descargar de Internet. Este texto lo vamos a descargar del sitio perteneciente al Projecto Gutenberg:
www.gutenberg.org
Igualmente, vamos a explorar algunos recursos de NLTK para trabajar con colecciones de datos lingüísticos, particularmente el Brown Corpus y el Inaugural Address Corpus. Para ello, vamos a revisar uno de los capítulos del libro electrónico sobre NLTK:
Bird, S.; Klein, E.; y Loper, E. (2009): "Accessing Text Corpora and Lexical Resources", en Natural Language Processing with Python. Sitio electrónico: http://nltk.org/book/ch02.html.
Cualquier consulta, lo podemos ver en clase.
Suerte con todo.