Secretos del Text Mining: Exploración y Visualización

Herramientas y técnicas avanzadas usando R.

  • Inicio: Octubre de 2024
  • Duración: 8 clases de 3 horas cada una.
  • Modalidad de cursado: a Distancia.
  • Certificado Oficial UTN Regional Mendoza

A quienes está dirigido:

  • Estudiantes con interés en la ciencia de datos aplicada a Text Mining.
  • Interesados en las ciencias de datos.
  • Programadores principiantes con interés en aplicar análisis de datos en textos.
  • Analistas de datos con interés en el análisis de textos.
  • Entusiastas del procesamiento de textos.

Objetivo:

El objetivo es adquirir conceptos y habilidades prácticas, usando la Inteligencia Artificial y la herramienta R, en las siguientes áreas temáticas:

  • Analisis de texto.
  • Text mining.
  • Nubes de palabras.
  • Bigramas.
  • Token.
  • Corpus.
  • Machine learning.
  • NLP – Natural Language Processing – Procesamiento Lenguaje Natural

Contenido:

  1. Introducción al curso: Presentación del curso. Limitaciones en la descarga de Tweets. Plataforma y Recursos, Rtweet. ¿Qué es el Text Mining?. Repaso de R y sus librerías
  2. Tus primeros pasos con el análisis de texto: Calculando la frecuencia de palabras. Filtrando las StopWords. Palabras Vacías o StopWords. La importancia de conocer los datos
  3. Análisis de Texto con R: Preparando todo para comenzar a graficar. Comparando la frecuencia por usuario. Nubes de palabras. Corrigiendo los acentos. Mejorando los datos. Introduciendo los n-gramas. Preparando los bigramas. Graficando bigramas. Analizando las características del texto. Analizando los retweets. Mezclando conocimientos Bigramas y favoritos. Comparación del uso de palabras. Tendencias de palabras en el tiempo. Paquete IRaMute para análisis multivariado de texto
  4. Bonus Aprendizaje Automático.

Metodología:

En este curso se aprenderá a analizar texto con R, una habilidad muy importante en el mundo del análisis de datos moderno.

Las clases serán teóricas y prácticas, pero con un foco mayor en los ejercicios prácticos. Se trabajará con un conjunto de datos real. Las actividades se centrarán con los mismos problemas y soluciones que se encuentran a diario en cualquier ámbito laboral.

Desde el principio, se iniciarán actividades con el análisis básico de textos, cálculos iniciales, limpieza y extracción de datos.

Se aprenderá cómo usar las características propias de cada texto, utilizando como base un conjunto de datos de Twitter, una de las redes más usadas en este tipo de análisis. Se verá cómo analizar cada texto y cómo sacar importantes conclusiones.

Luego, se evolucionará a métodos más avanzados, con algoritmos predictivos aplicados al análisis de texto.

Si eres un analista de datos, un científico de datos o simplemente te apasionan las redes sociales, los textos y el procesamiento de lenguaje natural, este curso es para ti.

Requisitos:

Conocimientos informáticos generales. Se recomienda tener conocimientos básicos de programación y de R (o dar una lectura a R antes de iniciar el curso).

Docente/Instructor: Dra. Matilde Césari

Carga horaria: 24 horas..

Costos: 2 cuotas de $50.000 (se abona 1 cuota por mes)

Medios de pago: RapiPago, PagoFacil, MercadoPago

Importante: la Facultad no realiza devoluciones, salvo errores involuntarios en montos de las cuotas.