Se realiza un proyecto de ciencia de datos con un programa simple. Los docentes llevarán a cabo las principales tareas de este tipo de proyectos: recolección, análisis, procesamiento y visualización de datos a partir de una librería de datos pública. La experiencia requiere la apropiación de conceptos centrales de procesamiento de datos (adquisición y visualización de datos) y su articulación con otros temas de programación, como minería de datos. Asimismo, se analizarán conceptualmente nuevas tecnologías en términos de sus licencias y mecanismos de recolección, almacenamiento y análisis de datos personales (ej.: cámaras de seguridad, manipulación de información de contactos o actividades, etc.) y las bases filosóficas de la protección legal de los derechos a la privacidad.
En relación con la enseñanza, a partir de la práctica de minería de datos, se realiza una propuesta para analizar los datos recolectados sobre la experiencia de enseñanza de programación planteada en el módulo “Seminario de Trabajo Final I”.
Objetivos
- Afianzar los conceptos y habilidades de programación aprendidos en los módulos anteriores. Programación orientada a objetos, estructuras de datos básicas, representación de la información.
- Familiarizarse con conceptos centrales de la recolección, procesamiento y análisis de datos.
- Desarrollar un programa sencillo utilizando bibliotecas predefinidas de un lenguaje de programación como Python.
- Discutir sobre las bases filosóficas de la protección legal de los derechos a la privacidad entendiendo el funcionamiento de ciertos servicios de internet y las posibilidades de la minería de datos y el procesamiento de la información.
Contenidos mínimos
- Programación orientada a objetos.
- Tratamiento de estructuras de datos básicas (listas y registros) desde un punto de vista de alto nivel (recorridos, búsquedas, totalizaciones).
- Funciones. Encapsulamiento. Tareas repetitivas. Generalización por abstracción.
- Bibliotecas de los lenguajes de programación. Acceso y usos. Programación como experimentación
- Procesamiento lineal de datos.
- Nociones de funcionamiento de programas heurísticos y de inteligencia artificial, como ser asistentes de texto predictivo, clasificadores, etc.
- Nociones de seguridad y minería de datos.
- Privacidad de los datos. Servicios de internet. Almacenamiento en la nube.
- Metadatos.
- Programación Secuencial: stream programming.
- Diferencia entre editor, intérprete, compilador.
- Adquisición de datos (procesamiento de strings, formatos de archivo, reconocimiento de caracteres: ocr).
- Tipos de archivos: imágenes, texto, etc.
Bibliografía
- Adèr, H.J. (2008). Chapter 14: Phases and initial steps in data analysis. In H.J. Adèr & G.J. Mellenbergh (Eds.) (with contributions by D.J. Hand), Advising on Research Methods: A consultant's companion (pp. 333–356). Huizen, the Netherlands: Johannes van Kessel Publishing.
- Adèr, H.J. (2008). Chapter 15: The main analysis phase. In H.J. Adèr & G.J. Mellenbergh (Eds.) (with contributions by D.J. Hand), Advising on Research Methods: A consultant's companion (pp. 333–356). Huizen, the Netherlands: Johannes van Kessel Publishing.
- Tabachnick, B.G. & Fidell, L.S. (2007). Chapter 4: Cleaning up your act. Screening data prior to analysis. In B.G. Tabachnick & L.S. Fidell (Eds.), Using Multivariate Statistics, Fifth Edition (pp. 60–116). Boston: Pearson Education, Inc. / Allyn and Bacon.