Как зависит удовлетворенность электронным курсом от времени его прохождения
Порешаем кейс Аналитика в дистанционном обучении.
Напомню, основная идея: посмотреть как время прохождения курса влияет на оценку удовлетворенности этим курсом.
Данные по оценкам такие
1 2 3 4 5
63 90 769 5280 22585
Ценность прогноза, безусловно, снижается тем, что у "пятерки" дают три четверти оценок. Тем не менее, мы различия нашли
Данные регрессии следующие (время прохождения курса мы логарифмируем)
lm(formula = log(r1$timec, base = exp(1)) ~ k, data = r1)
Residuals:
Min 1Q Median 3Q Max
-1.2396 -0.5590 -0.0482 0.4218 3.3122
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9601884 0.0046702 847.976 < 2e-16 ***
k1 0.2416935 0.0866167 2.790 0.00527 **
k2 0.2267594 0.0730114 3.106 0.00190 **
k3 0.1126549 0.0255257 4.413 1.02e-05 ***
k4 0.0004889 0.0107263 0.046 0.96364
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.7027 on 28870 degrees of freedom
(19 observations deleted due to missingness)
Multiple R-squared: 0.001263, Adjusted R-squared: 0.001124
F-statistic: 9.125 on 4 and 28870 DF, p-value: 2.305e-07
Потрясающий R^2?)
И распределение времени по каждому уровню оценки
Как читать диаграмму boxplot - для понимания результатов
Напомню, основная идея: посмотреть как время прохождения курса влияет на оценку удовлетворенности этим курсом.
Диаграмма. Распределение времени прохождения курсов
Данные по оценкам такие
1 2 3 4 5
63 90 769 5280 22585
Ценность прогноза, безусловно, снижается тем, что у "пятерки" дают три четверти оценок. Тем не менее, мы различия нашли
Данные регрессии следующие (время прохождения курса мы логарифмируем)
lm(formula = log(r1$timec, base = exp(1)) ~ k, data = r1)
Residuals:
Min 1Q Median 3Q Max
-1.2396 -0.5590 -0.0482 0.4218 3.3122
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9601884 0.0046702 847.976 < 2e-16 ***
k1 0.2416935 0.0866167 2.790 0.00527 **
k2 0.2267594 0.0730114 3.106 0.00190 **
k3 0.1126549 0.0255257 4.413 1.02e-05 ***
k4 0.0004889 0.0107263 0.046 0.96364
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.7027 on 28870 degrees of freedom
(19 observations deleted due to missingness)
Multiple R-squared: 0.001263, Adjusted R-squared: 0.001124
F-statistic: 9.125 on 4 and 28870 DF, p-value: 2.305e-07
Потрясающий R^2?)
И распределение времени по каждому уровню оценки
Как читать диаграмму boxplot - для понимания результатов