Ir al contenido

ANÁLISIS DE DATOS CON R STUDIO

Expositor:

Lic. Deilyn Quiel

¡Inscríbete!

Modulo 1


 ALFABETIZACIÓN EN DATOS Y PENSAMIENTO COMPUTACIONAL

  • ¿Qué es R y por qué no es Excel? Entender la diferencia entre una hoja de cálculo (interfaz visual) y un lenguaje de programación (instrucciones escritas). La importancia de la reproducibilidad en la ciencia.

  • Fundamentos de Programación (Desde Cero):

    • El concepto de Variable: La analogía de "la caja" para guardar datos (pesos, absorbancias, nombres).
    • Tipos de Datos Crudos: Diferencia entre números (numeric), texto (character) y valores lógicos (TRUE/FALSE).
    • Estructuras de Datos: Cómo R organiza la información:

      • Vectores: Una lista de un mismo tipo de dato.
      • Data Frames: La "tabla de laboratorio" donde las columnas son variables y las filas son muestras.

  • El Entorno RStudio: Instalación y configuración. Diferencia entre la Consola (donde R habla) y el Script (donde escribimos nuestras recetas de análisis).

  • Sesión de Programación I (Mi primer código):

    • Operaciones matemáticas básicas como calculadora científica.
    • Uso de funciones: ¿Qué es una función? (Entrada -> Proceso -> Salida).
    • Cómo pedir ayuda a R y entender los mensajes de error (sin entrar en pánico).

Modulo 2


 INMERSIÓN AL ECOSISTEMA R Y FUNDAMENTOS

  • Importancia de R en las Ciencias: ¿Por qué R es el estándar en publicaciones científicas? (Reproducibilidad vs. Excel).

  • Entorno de Trabajo: Instalación de R y RStudio. Configuración de proyectos y "Working Directory".

  • Fundamentos de Programación: * Tipos de objetos (Vectores, Matrices, Listas, Data Frames).

    • Sintaxis básica y operadores lógicos.
    • Instalación y carga de librerías (tidyverse).

  • Sesión de Programación I: Carga de datos desde archivos Excel y CSV. Limpieza básica de nombres de columnas.


Modulo 3


 PROGRAMACIÓN Y MANIPULACIÓN DE DATOS PARA INVESTIGACIÓN

  • El paradigma Tidyverse: Uso del operador "Pipe" (%>% o |>) para escribir código legible.

  • Manipulación de Datos con dplyr:

    • Filtrado de muestras (filter).
    • Selección de variables analíticas (select).
    • Creación de nuevas métricas y conversiones de unidades (mutate).
    • Resúmenes estadísticos por grupos (group_by y summarise).

  • Visualización Científica con ggplot2: Creación de gráficos de dispersión y boxplots para comparar grupos de estudio.

  • Manipulación con dplyr (Limpieza de datos):

    • Seleccionar columnas de interés y filtrar muestras contaminadas o fuera de rango.
    • Crear nuevas columnas (ej. calcular concentraciones a partir de absorbancias).
    • Agrupar datos por categorías (ej. por tipo de tratamiento o cepa bacteriana).



Modulo 4


 ESTADÍSTICA APLICADA AL CAMPO EXPERIMENTAL

  • Fundamentos de Inferencia: Pruebas de normalidad (Shapiro-Wilk) y homogeneidad de varianza.

  • Test Estadísticos Esenciales:

    • Pruebas t de Student: Comparación de medias en ensayos de recuperación o comparación de dos métodos.
    • ANOVA de un factor: Evaluación de diferencias entre múltiples lotes o condiciones experimentales.
    • Regresión Lineal: Evaluación de curvas de calibración y cálculo del coeficiente de correlación de Pearson.

  • Interpretación de P-valores: Cómo leer e informar resultados estadísticos en un informe de investigación.

  • Visualización de Datos con ggplot2:

    • El concepto de "Capas": Fondo + Datos + Geometría (puntos, barras, cajas).
    • Creación de gráficos de calidad para publicación (Boxplots, Dispersión e Histogramas).

  • Estadística Útil para el Investigador:

    • Comprobación de supuestos: ¿Mis datos son normales? (Test de Shapiro-Wilk).
    • Comparación de grupos: Pruebas t de Student y ANOVA de un factor.
    • Correlación y Regresión: Evaluación de la relación entre dos variables químicas o biológicas.