<- read_csv("data/nels88_sample.csv")
nels <- nels |>
nels select(grades = ffugrad, pared = bypared, hw_in = f1s36a1, hw_out = f1s36a2, prev = bytests)
nels
# summarize data
summary(nels)
# count values
|> count(pared)
nels |> count(hw_out) nels
Case Study 3
Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences by Jacob Cohen, Patricia Cohen, Stephen G. West, Leona S. Aiken
National Education Longitudinal Study of 1988 (NELS:88)
Source: p.69 in Multiple Regression and Beyond (3e) by Timothy Z. Keith
연구주제: 학생들의 과제는 성적에 영향을 주는가? 준다면 그 영향력의 크기는 어떠한가?
grades
: 10학년의 성적 평균 in English, Math, Science, Social Studies.
pared
: 부모의 교육 수준 (높은 쪽)
hw_in
, hw_out
: 10학년 때 학생들이 보고한 숙제하는데 보낸 주당 평균 시간 (in school or out of school)
변수들 간의 관계 탐색
code for ggpairs
<- function(data, mapping, ...){
trendlines ggplot(data = data, mapping = mapping) +
geom_point(alpha = .2) +
geom_smooth(method = loess, se = FALSE, color = "orange", ...) +
geom_smooth(method = lm, se = FALSE, color = "deepskyblue", ...)
}
<- function(data, ...) {
ggpairs2 ::ggpairs(data, lower = list(continuous = trendlines))
GGally }
ggpairs2(nels)