• Prácticas de TGD
  • Prólogo
  • 1 Introducción
    • 1.1 Contenidos
    • 1.2 Planificación (tentativa)
      • 1.2.1 Evaluación
    • 1.3 Fuentes de información:
      • 1.3.1 Básica
      • 1.3.2 Complementaria:
  • 2 Manipulación de datos con R
    • 2.1 Lectura, importación y exportación de datos
      • 2.1.1 Formato de datos de R
      • 2.1.2 Acceso a datos en paquetes
      • 2.1.3 Lectura de archivos de texto
      • 2.1.4 Importación desde SPSS
      • 2.1.5 Importación desde Excel
      • 2.1.6 Exportación de datos
      • 2.1.7 Python, Julia y otros lenguajes de programación
    • 2.2 Manipulación de datos
      • 2.2.1 Operaciones con variables
      • 2.2.2 Operaciones con casos
    • 2.3 Datos faltantes
      • 2.3.1 Funciones apply
      • 2.3.2 Tablas (para informes)
      • 2.3.3 Operaciones con tablas de datos
    • 2.4 Ejemplo WoS data
  • 3 Introducción al lenguaje SQL
    • 3.1 Bases de Datos Relacionales
      • 3.1.1 Definiciones
    • 3.2 Sintaxis SQL
      • 3.2.1 Extracción SQL (11 statements)
      • 3.2.2 Crear/Actualizar/Borrar tablas SQL (8 statements)
      • 3.2.3 Añadir/Actualizar/Borrar tuplas en SQL (3 statements)
      • 3.2.4 Gestión Bases de Datos (5 statements)
      • 3.2.5 Ejemplos de consultas SQL
    • 3.3 Conexión con bases de datos desde R
      • 3.3.1 Introducción a SQL en R
      • 3.3.2 El paquete sqldf
      • 3.3.3 SQL Queries
    • 3.4 Ejemplo Scopus data
    • 3.5 Ejercicios SQL con RSQLite
      • 3.5.1 Setup de RSQLite
    • 3.6 Práctica 1: SQL
  • 4 Manipulación de datos con tidyverse
    • 4.1 Introducción al ecosistema tidyverse
      • 4.1.1 Operador pipe (redirección)
      • 4.1.2 Lectura y escritura de archivos de texto
      • 4.1.3 Escritura
    • 4.2 Manipulación de datos con dplyr y tidyr
      • 4.2.1 El paquete dplyr
      • 4.2.2 Operaciones con variables (columnas)
      • 4.2.3 Operaciones con casos (filas)
      • 4.2.4 Datos faltantes
    • 4.3 Herramientas tidyr
    • 4.4 Operaciones con tablas de datos
    • 4.5 Bases de datos con dplyr
      • 4.5.1 Ejemplos
  • 5 Introducción a Tecnologías NoSQL
    • 5.1 Conceptos y tipos de bases de datos NoSQL (documental, columnar, clave/valor y de grafos)
      • 5.1.1 Características de las bases de datos NoSQL
      • 5.1.2 Tipos de Bases de Datos NoSQL
      • 5.1.3 MongoDB: NoSQL documental
      • 5.1.4 Redis: NoSQL key-value
      • 5.1.5 Cassandra: NoSQL columnar
      • 5.1.6 Neo4j: NoSQL grafos
      • 5.1.7 Otros: search engines
    • 5.2 Conexión de R a MongoDB
    • 5.3 Ejercicios prácticos con MongoDB
  • 6 Tecnologías para el Tratamiendo de Datos Masivos
    • 6.1 Introducción al Aprendizaje Estadístico
    • 6.2 Tecnologías Big Data (Hadoop/Spark y Visualización)
      • 6.2.1 Tecnologías Hadoop, Spark, y Sparklyr
      • 6.2.2 Big Data y Machine Learning
      • 6.2.3 Rattle como alternativa a RapidMiner en R
      • 6.2.4 Visualización y Generación de Cuadros de Mando
    • 6.3 Introducción al Análisis de Datos Masivos
  • Apendices
  • A Enlaces
    • A.1 RStudio
    • A.2 Bibliometría
  • B Instalación de R
    • B.1 Instalación de R en Windows
      • B.1.1 Asistente de instalación
      • B.1.2 Instalación de paquetes
    • B.2 Instalación en Mac OS X
    • B.3 Instalación (opcional) de un entorno o editor de comandos
      • B.3.1 Opciones adicionales
  • Publicado con bookdown

Prácticas de Tecnologías de Gestión y Manipulación de Datos

A Enlaces

Recursos para el aprendizaje de R ( https://rubenfcasal.github.io/post/ayuda-y-recursos-para-el-aprendizaje-de-r ): A continuación se muestran algunos recursos que pueden ser útiles para el aprendizaje de R y la obtención de ayuda…

Ayuda online:

  • Ayuda en línea sobre funciones o paquetes: RDocumentation

  • Buscador RSeek

  • StackOverflow

Cursos: algunos cursos gratuitos:

  • Coursera:

    • Introducción a Data Science: Programación Estadística con R

    • Mastering Software Development in R

  • DataCamp:

    • Introducción a R
  • Stanford online:

    • Statistical Learning
  • Curso UCA: Introducción a R, R-commander y shiny
  • Curso R CODER
  • Udacity: Data Analysis with R
  • Swirl Courses: se pueden hacer cursos desde el propio R con el paquete swirl.

Para información sobre cursos en castellano se puede recurrir a la web de R-Hispano en el apartado formación. Algunos de los cursos que aparecen en entradas antiguas son gratuitos. Ver: Cursos MOOC relacionados con R.

Libros

  • Iniciación:

    • R for Data Science by Hadley Wickham and Garrett Grolemund (online, O’Reilly). online-castellano, O’Reilly.

    • 2011 - The Art of R Programming. A Tour of Statistical Software Design, (No Starch Press)

    • Hands-On Programming with R: Write Your Own Functions and Simulations, by Garrett Grolemund (O’Reilly)

  • Avanzados:

    • Advanced R by Hadley Wickham (online: 1ª ed, 2ª ed, Chapman & Hall)

    • 2008 - Software for Data Analysis: Programming with R - Chambers (Springer)

    • R packages by Hadley Wickham (online, O’Reilly)

  • Bookdown: el paquete bookdown de R permite escribir libros empleando R Markdown y compartirlos. En https://bookdown.org está disponible una selección de libros escritos con este paquete (un listado más completo está disponible aquí). Algunos libros en este formato en castellano son:

    • Introducción al Análisis de Datos con R (disponible en el repositorio de GitHub rubenfcasal/intror).

    • Prácticas de Simulación (disponible en el repositorio de GitHub rubenfcasal/simbook).

    • Escritura de libros con bookdown (disponible en el repositorio de GitHub rubenfcasal/bookdown_intro).

    • R para profesionales de los datos: una introducción.

    • Estadística Básica Edulcorada.

Material online: en la web se puede encontrar mucho material adicional, por ejemplo:

  • CRAN: Other R documentation

  • Blogs en inglés:

    • https://www.r-bloggers.com/

    • https://www.littlemissdata.com/blog/rstudioconf2019

    • RStudio: https://blog.rstudio.com

    • Microsoft Revolutions: https://blog.revolutionanalytics.com

  • Blogs en castellano:

    • https://www.datanalytics.com

    • http://oscarperpinan.github.io/R

    • http://rubenfcasal.github.io

  • Listas de correo:

    • Listas de distribución de r-project.org: https://stat.ethz.ch/mailman/listinfo

    • Búsqueda en R-help: http://r.789695.n4.nabble.com/R-help-f789696.html

    • Búsqueda en R-help-es: https://r-help-es.r-project.narkive.com

      https://grokbase.com/g/r/r-help-es

    • Archivos de R-help-es: https://stat.ethz.ch/pipermail/r-help-es