1주차
-
01
R 언어의 이해
- 데이터 구조, 데이터 유형
- 연산자의 이해
-
02
Rstudio 소개
- Rstudio 사용법
- 단축키 사용법
-
03
R 기초 함수 소개
-
과제
R 활용한 기초 통계 분석 실무 시뮬레이션
- 데이터 불러오기 연습
- 데이터 프레임 익히기
- R 기초 함수 익히기
[과제 수행 위한 제공 자료]
- 과제용 데이터(csv)
- Rstudio 단축키 정리집
2주차
-
01
data.table이란?
- data.table의 특장점
-
02
I, J - ROW, COLUMN 다루기
- data.table 연산자
-
03
BY - 그룹별 요약 통계량
- 그룹 별 변수 계산하기
-
과제
data.table 실무 시뮬레이션
- 특정 조건에 맞는 환자 데이터 추출하기
- 새로운 열(column) 생성하기
- 집단 별 통계량, 응답 분포 계산하기
[과제 수행 위한 제공 자료]
- data.table 실습 예제
- 국민건강영양조사 11개 년 데이터
3주차
-
01
lapply & .SD
- 여러 변수를 동시에 처리하기
-
02
Join (merge)
- rbind, cbind: 데이터 합치기
- inner join, left join: 키를 통한 데이터 합치기
-
03
pivoting
- melt: wide to long 변환
- dcast: long to wide 변환
-
과제
lapply, pivoting, join 활용 문제
- 데이터 결측치 동시에 처리하기
- 여러 개의 데이터 합치기
- 데이터 구조 변경을 통한 요약 통계량 계산하기
[과제 수행 위한 제공 자료]
- data.table 실습 예제
- 국민건강보험공단 표본코호트 데모 데이터
4주차
-
01
생존 분석 개념의 이해
-
02
R로 하는 생존 분석
- 로지스틱 회귀분석
- Cox 비례위험 회귀분석
-
03
생존 분석 시각화
- Kaplan-Meier 곡선
- Forest Plot
-
과제
임상데이터 생존분석 실습
- 암 발생 환자 생존분석
- 약물 사용에 따른 환자 사망 생존분석
5주차
-
01
통계 분석 테이블 만들기
- gtsummary 로 테이블 만들기
- 기본 특성 테이블
- 회귀분석 결과 테이블
-
02
다양한 결측치(NA) 대체 배우기
- MICE를 이용한 결측치 대체
- 결측치 시각화
- 다중 결측치 대체
- 결측치 대체 이후 모델링
-
03
정규표현식으로 문자 처리하기
- stringr을 통한 문자 나누기, 문자 대체, 문자 추출
-
과제
실무에서 유용한 패키지 실습
6주차
-
01
빅데이터 분석 시 유용한 패키지
-
02
1~6주차 세션 리뷰 및 Q&A