Clase del martes 03/10/2017
Saludos:
Ya están disponibles las láminas para la sesión de hoy, en seguimos viendo algunas cuestiones relacionadas con la lematización, en concreto:
1. El tipo de análisis que se pueden llevar a cabo, sin considerar el algoritmo de Porter, en este caso, aplicando un método basado en el cálculo de entropía entre raíces y sufijos.
2. La aplicación del algoritmo de Eric Brill para asignar etiquetas gramaticales a palabras lematizadas.
Como material de lectura, seguimos revisando los siguientes textos:
Bird, S.; Klein, E.; y Loper, E. (2009): "Proccesing Raw Text"; "Categorizing and Tagging Words" en Natural Language Processing with Python. Sitio electrónico: http://nltk.org/book/ch02.html;
http://nltk.org/book/ch05.html.
Cualquier consulta, la vemos en la clase.
Suerte con todo.
Saludos:
Ya están disponibles las láminas para la sesión de hoy, en seguimos viendo algunas cuestiones relacionadas con la lematización, en concreto:
1. El tipo de análisis que se pueden llevar a cabo, sin considerar el algoritmo de Porter, en este caso, aplicando un método basado en el cálculo de entropía entre raíces y sufijos.
2. La aplicación del algoritmo de Eric Brill para asignar etiquetas gramaticales a palabras lematizadas.
Como material de lectura, seguimos revisando los siguientes textos:
Bird, S.; Klein, E.; y Loper, E. (2009): "Proccesing Raw Text"; "Categorizing and Tagging Words" en Natural Language Processing with Python. Sitio electrónico: http://nltk.org/book/ch02.html;
http://nltk.org/book/ch05.html.
Cualquier consulta, la vemos en la clase.
Suerte con todo.