Prácticas de TGD
Prólogo
0.1
Contenidos
0.2
Planificación (tentativa)
0.2.1
Evaluación
0.3
Fuentes de información:
0.3.1
Básica
0.3.2
Complementaria:
1
Manipulación de datos con R
1.1
Lectura, importación y exportación de datos
1.1.1
Formato de datos de R
1.1.2
Acceso a datos en paquetes
1.1.3
Lectura de archivos de texto
1.1.4
Importación desde SPSS
1.1.5
Importación desde Excel
1.1.6
Exportación de datos
1.1.7
Python, Julia y otros lenguajes de programación
1.1.8
Operaciones con variables
1.1.9
Operaciones con casos
1.1.10
Datos faltantes
1.1.11
Funciones
apply
1.1.12
Generación de tablas
1.1.13
Operaciones con tablas de datos
1.2
Ejemplo WoS data
2
Introducción al lenguaje SQL
2.1
Bases de Datos Relacionales
2.1.1
Definiciones
2.2
Restricciones
2.3
Sistemas Gestores de Bases de Datos (SGDB)
2.4
Sintaxis SQL
2.5
Cláusulas básicas de SQL
2.5.1
Selección de campos
2.5.2
Número de filas (paginación)
2.5.3
Filtrado de Resultados
2.5.4
Ordenación de Resultados
2.5.5
Unión de tablas
2.5.6
Agrupamiento
2.5.7
Subconsultas (subqueries)
2.5.8
Operaciones con conjuntos de resultados
2.6
Gestión de datos
2.6.1
Operaciones CRUD
2.7
Gestión de Bases de Datos
2.7.1
Creación de una base de datos
2.7.2
Eliminación de una base de datos
2.7.3
Selección de base de datos
2.8
Gestión de tablas
2.8.1
Creación de tablas
2.8.2
Creación de índices
2.8.3
Borrado de tablas
2.8.4
Modificación de tablas
2.9
Vistas
2.10
Ejemplos de consultas SQL
2.11
Conexión con bases de datos desde R
2.11.1
Introducción a SQL en R
2.11.2
El paquete sqldf
2.11.3
SQL Queries
2.12
Ejemplo Scopus data
2.13
Ejercicios SQL con RSQLite
2.13.1
Setup de RSQLite
2.14
Práctica 1: SQL
3
Manipulación de datos con tidyverse
3.1
Introducción al ecosistema tidyverse
3.1.1
Operador
pipe
(redirección)
3.1.2
Lectura y escritura de archivos de texto
3.1.3
Escritura
3.2
Manipulación de datos con dplyr y tidyr
3.2.1
El paquete dplyr
3.2.2
Operaciones con variables (columnas)
3.2.3
Operaciones con casos (filas)
3.2.4
Datos faltantes
3.3
[1] 153
3.4
Herramientas tidyr
3.5
Operaciones con tablas de datos
3.6
Bases de datos con dplyr
3.6.1
Ejemplos
3.7
Conceptos y tipos de bases de datos NoSQL (documental, columnar, clave/valor y de grafos)
3.7.1
Características de las bases de datos NoSQL
3.7.2
Tipos de Bases de Datos NoSQL
3.7.3
MongoDB: NoSQL documental
3.7.4
Redis: NoSQL key-value
3.7.5
Cassandra: NoSQL columnar
3.7.6
Neo4j: NoSQL grafos
3.7.7
Otros: search engines
3.8
Conexión de R a MongoDB
3.9
Ejercicios prácticos con MongoDB
3.10
Introducción al Aprendizaje Estadístico
3.11
Tecnologías Big Data (Hadoop/Spark y Visualización)
3.11.1
Tecnologías Hadoop, Spark, y Sparklyr
3.11.2
Big Data y Machine Learning
3.11.3
Rattle como alternativa a RapidMiner en R
3.11.4
Visualización y Generación de Cuadros de Mando
3.12
Introducción al Análisis de Datos Masivos
3.13
Práctica 3: Big Data
3.13.1
Ejercicio A con sparklyr
3.13.2
Ejercicio B con rattle
3.13.3
Ejercicio C con sparklyr y Hadoop
3.13.4
Combinando los distintos elementos
3.13.5
Uso de Sparklyr
Publicado con bookdown
Prácticas de Tecnologías de Gestión y Manipulación de Datos
2.7
Gestión de Bases de Datos
2.7.1
Creación de una base de datos
CREATE
DATABASE
database_name;
2.7.2
Eliminación de una base de datos
DROP
DATABASE
database_name;
2.7.3
Selección de base de datos
USE
database_name;