• Prácticas de TGD
  • Prólogo
  • 1 Introducción a las Tecnologías de Gestión y Manipulación de Datos
    • 1.1 Contenidos
    • 1.2 Planificación (tentativa)
      • 1.2.1 Evaluación
    • 1.3 Fuentes de información:
      • 1.3.1 Básica
      • 1.3.2 Complementaria:
  • 2 Manipulación de datos con R
    • 2.1 Lectura, importación y exportación de datos
      • 2.1.1 Formato de datos de R
      • 2.1.2 Acceso a datos en paquetes
      • 2.1.3 Lectura de archivos de texto
      • 2.1.4 Alternativa tidyverse
      • 2.1.5 Importación desde SPSS
      • 2.1.6 Importación desde Excel
      • 2.1.7 Exportación de datos
    • 2.2 Manipulación de datos
      • 2.2.1 Operaciones con variables
      • 2.2.2 Operaciones con casos
      • 2.2.3 Funciones apply
      • 2.2.4 Operaciones con tablas de datos
    • 2.3 Ejemplo WoS data
  • 3 Introducción al lenguaje SQL
    • 3.1 Bases de Datos Relacionales
      • 3.1.1 Definiciones
    • 3.2 Sintaxis SQL
      • 3.2.1 Extracción SQL (11 statements)
      • 3.2.2 Crear/Actualizar/Borrar tablas SQL (8 statements)
      • 3.2.3 Añadir/Actualizar/Borrar tuplas en SQL (3 statements)
      • 3.2.4 Gestión Bases de Datos (5 statements)
      • 3.2.5 Ejemplos de consultas SQL
    • 3.3 Conexión con bases de datos desde R
      • 3.3.1 Introducción a SQL en R
      • 3.3.2 El paquete sqldf
      • 3.3.3 SQL Queries
    • 3.4 Ejemplo Scopus data
    • 3.5 Ejercicios SQL con RSQLite
      • 3.5.1 Setup de RSQLite
    • 3.6 Práctica 1: SQL
  • 4 Manipulación de datos con dplyr
    • 4.1 El paquete dplyr
      • 4.1.1 Datos de ejemplo
    • 4.2 Operaciones con variables (columnas)
      • 4.2.1 Seleccionar variables con select()
      • 4.2.2 Generar nuevas variables con mutate()
    • 4.3 Operaciones con casos (filas)
      • 4.3.1 Seleccionar casos con filter()
      • 4.3.2 Organizar casos con arrange()
    • 4.4 Resumir valores con summarise()
    • 4.5 Agrupar casos con group_by()
    • 4.6 Operador pipe %>% (tubería, redirección)
    • 4.7 Operaciones con tablas de datos
    • 4.8 Bases de datos con dplyr
      • 4.8.1 Ejemplos (Práctica 1)
  • 5 Introducción a Tecnologías NoSQL
    • 5.1 Conceptos y tipos de bases de datos NoSQL (documental, columnar, clave/valor y de grafos)
      • 5.1.1 Características de las bases de datos NoSQL
      • 5.1.2 Tipos de Bases de Datos NoSQL
      • 5.1.3 MongoDB: NoSQL documental
      • 5.1.4 Redis: NoSQL key-value
      • 5.1.5 Cassandra: NoSQL columnar
      • 5.1.6 Neo4j: NoSQL grafos
      • 5.1.7 Otros: search engines
    • 5.2 Conexión de R a MongoDB
    • 5.3 Práctica 2: NoSQL
      • 5.3.1 Ejercicios con RMongolite
  • 6 Tecnologías para el Tratamiendo de Datos Masivos
    • 6.1 Tecnologías Big Data (Hadoop, Spark, Hive, Rspark, Sparklyr)
      • 6.1.1 Uso de Hadoop con dos ejemplos:
      • 6.1.2 Uso de Sparklyr
    • 6.2 Visualización y Generación de Cuadros de Mando
    • 6.3 Introducción al Análisis de Datos Masivos
      • 6.3.1 Rattle
      • 6.3.2 Combinando los distintos elementos
    • 6.4 Práctica 3: Big Data
      • 6.4.1 Ejercicio A con sparklyr
      • 6.4.2 Ejercicio B con rattle
      • 6.4.3 Ejercicio C con sparklyr y Hadoop
  • Apendices
  • A Enlaces
    • A.1 RStudio
    • A.2 Bibliometría
  • B El paquete scimetr
    • B.1 Instalación
    • B.2 Carga de datos
      • B.2.1 Datos de ejemplo
      • B.2.2 Cargar datos de directorio
    • B.3 Sumarios
      • B.3.1 Sumario summary.wos.db()
      • B.3.2 Sumario por años summary_year()
    • B.4 Gráficos
      • B.4.1 Gráficos de la base de datos plot.wos.db()
      • B.4.2 Gráficos sumario plot.summary.wos.db()
      • B.4.3 Gráficos sumario por años plot.summary.year()
    • B.5 Filtrado
      • B.5.1 Funciones get
      • B.5.2 Obtener documentos (de autores, revistas, …)
      • B.5.3 Sumarios filtrados
    • B.6 Indices de autores
  • C El paquete CITAN
    • C.1 Creación de la base de datos
      • C.1.1 Primera ejecución: Creación del modelo de DB
      • C.1.2 Incorporar nuevos datos
    • C.2 Extraer información de la BD
      • C.2.1 Estadísticos descriptivos
      • C.2.2 Otra información
    • C.3 Cerrar conexión
  • D Introducción al Aprendizaje Estadístico
    • D.1 Data Science
      • D.1.1 Ventajas e inconvenientes
    • D.2 Métodos de aprendizaje estadístico
      • D.2.1 Métodos (de aprendizaje supervisado):
      • D.2.2 Construcción y evaluación de los modelos
      • D.2.3 Matriz de confusión
      • D.2.4 Predicciones frente a observado
    • D.3 Arboles de decisión
    • D.4 Bagging y Boosting
      • D.4.1 Bagging o agregación Bootstrap
      • D.4.2 Bosques Aleatorios
      • D.4.3 Boosting
    • D.5 Support vector machines (SVM)
    • D.6 Modelos lineales (generalizados)
    • D.7 Métodos de regularización
      • D.7.1 Ridge Regression
      • D.7.2 Lasso
    • D.8 Regresión no paramétrica
      • D.8.1 Modelos aditivos
    • D.9 Redes neuronales
    • D.10 Bibliografía
  • Publicado con bookdown

Prácticas de Tecnologías de Gestión y Manipulación de Datos

5.2 Conexión de R a MongoDB

A través del paquete mongolite, aquí tenéis un Tutorial

install.packages("mongolite")
library(mongolite)

# Connect to a local MongoDB

my_collection = mongo(collection = "restaurants", db = "Restaurants") # create connection, database and collection
my_collection$count