Skip to content

Latest commit

 

History

History
38 lines (18 loc) · 2.27 KB

lab4-AS.md

File metadata and controls

38 lines (18 loc) · 2.27 KB

Laboratorio 4: Aprendizaje Supervisado

Análisis de las Posiciones del Aborto en Twitter
Diplomatura en Ciencias de Datos, Aprendizaje Automático y sus aplicaciones.

Objetivo y alcance

En este práctico el objetivo es poder comenzar a tener en cuenta el contenido del tweet (texto) como feature en el proceso de aprendizaje y así poder aprovechar el campo que puede aportar más información.

El otro gran objetivo del práctico es indagar entre los diferentes modelos de aprendizaje supervisado vistos en la materia y comparar el desempeño obtenido.

Método

Para poder realizar este práctico, hay que trabajar con los prácticos realizados en las 2 materias anteriores.

Por un lado, a partir del notebook de curación de datos, hay que volver en el dataset de tweets y trabajar con el texto, con herramientas de procesamiento de lenguaje natural natural (Bag of Words, ver en referencias). Con esto generar los features para poder realizar el aprendizaje supervisado.

Luego, a partir del práctico de introducción de aprendizaje automático, cambiar y probar otros modelos vistos en esta materia y comparar los resultados a partir de la métrica seleccionada.

Estructura del informe

Para la entrega de este laboratorio, hay que mostrar por un lado las modificaciones a partir del segundo práctico para incluir en el dataset features a partir del análisis de Bag Of Words de los tweets.

Por otro lado, el práctico en sí tiene que ser un notebook similar al práctico 3, con la estructura y los pasos de un proceso de aprendizaje automático en donde se evalúen al menos 2 o 3 modelos de clasificación de aprendizaje supervisado, comparando con la métrica de evaluación seleccionada (la/s misma/s para los diferentes modelos), teniendo en cuenta que las clases a clasificar están desbalanceadas.

Referencias:

  • An Introduction to Bag-of-Words in NLP (Link)
  • Bag of Words Algorithm in Python Introduction (Link)

Fecha de entrega primera versión: 15 días después de entregado el laboratorio.

Fecha de entrega versión final: Una semana luego de la respuesta del mentor.