Математическая статистика и анализ данных на языке R

Автор

Анна Валяева

Дата публикации

1 сентября 2021 г.

Информация о курсе

Текущий курс

Целью курса является наработка практических навыков визуализации и статистического анализа данных биологических экспериментов в области клеточной биологии и гистологии с использованием языка программирования R.

Каждое занятие включает теоретическую часть и практические занятия на компьютере. Основные практические навыки вырабатываются в ходе самостоятельной работы студентов. Для этого каждое занятие сопровождается домашним заданием (ДЗ), выполнение которого затем проверяется преподавателем.

Структура курса

Занятие Тема Презентация R практика Домашнее задание

1

Введение в R. Устройство RStudio. Воспроизводимость, скрипты, проекты. Вектор. Переменная. Типы данных и переменных. Вызов функций.
Введение в статистику. Генеральная совокупность и выборка. Описательные статистики.

2

Табличный формат данных: matrix, dataframe и tibble. Введение в dplyr.
Пропущенные значения. Случайные события и вероятность.

3

Визуализация данных с помощью ggplot2.
Распределения вероятностей.

4

Визуализация данных. Работа с факторами.
Статистические тесты, понятие p-value. T-test.

5

Визуализация данных с помощью ggpubr.
Парные тесты. Параметрические и непараметрические тесты. Тесты на нормальность.

6

Решение задач (двухвыборочные тесты).

7

Написание собственных функций, циклов, if/else условий.
Тесты для категориальных переменных.

8

RMarkdown / Quarto.
Проблема множественного тестирования. ANOVA

9

Корреляция. Кластеризация. Линейные модели.

10

Зачет

Для получения зачета необходимо выполнить домашние задания по всем темам и решить задачу на последнем занятии.

Архив курсов