Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Testiä #11

Open
wants to merge 26 commits into
base: master
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Empty file added .Rhistory
Empty file.
10 changes: 10 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,10 @@

---
output: github_document
---

This course seems to be quite dificult at the beginning. Not R but this GutHub stuff.

Link to my course diary:
<https://kimsta.github.io/IODS-project/>

8 changes: 7 additions & 1 deletion chapter1.Rmd
Original file line number Diff line number Diff line change
@@ -1,4 +1,10 @@

# About the project

*Write a short description about the course and add a link to your github repository here. This is an R markdown (.Rmd) file so you can use R markdown syntax. See the 'Useful links' page in the mooc area (chapter 1) for instructions.*
*Write a short description about the course and add a link to your github repository here. This is an R markdown (.Rmd) file so you can use R markdown syntax. See the 'Useful links' page in the mooc area (chapter 1) for instructions.*

This course is interesting. It is nice to learn RStudio and GitHub stuff. Great.

Here is link to my GitHub repository:

<https://github.com/kimsta/IODS-project>
164 changes: 164 additions & 0 deletions chapter1.html

Large diffs are not rendered by default.

58 changes: 54 additions & 4 deletions chapter2.Rmd
Original file line number Diff line number Diff line change
@@ -1,7 +1,57 @@
# Insert chapter 2 title here
# Chapter 2

*Describe the work you have done this week and summarize your learning.*

- Describe your work and results clearly.
- Assume the reader has an introductory course level understanding of writing and reading R code as well as statistical methods
- Assume the reader has no previous knowledge of your data or the more advanced methods you are using
This week I have read some data from the internet and created a subset from that data with Rstudio and uploaded it into my GitHub repository. I have learned to analyse my dataset with some simple regression analysis and linear modeling. I have also learned to view my data graphicly with libraries GGally and ggplot2.

Report:

I can read my file as follows:

```{r}
learning <- read.csv("data/learning.csv", sep = ",", header = T)
dim(learning)
str(learning)
```

I named my dataset as learning. It has 7 variables and 166 observations.

Variable attitude represents students attitude.
Variable deep represents students deep learning skills.
Variable stra represents students strategic learning skills.
Variable surf represents students surface learning skills.

All variables above are scaled back to scale 1-5 by taking a mean from a question set in question.

Variables gender and age are self explanatory.
Variable points is a sum of points from an exam. Observations where points < 1 are left out from this subset.

Variables can be seen in a scatterplot (excluding gender) as follows:

```{r}
pairs(learning[-1], col = learning$gender)
```

In scatterplot genders are shown with different colors, red being female and black being male.

If we use libraries GGally and ggplot2 we can see some more detailed information about variables.

```{r}
library(GGally)
library(ggplot2)

p <- ggpairs(learning, mapping = aes(col = learning$gender), lower = list(combo = wrap("facethist", bins = 20)))
p
```

Now we choose three variables that explains variable points most likely. We choose variables that has highes absolute value of correlation with points; attitude, stra and surf.

```{r}
my_model <- lm(points ~ attitude + stra + surf, data = learning)
my_model
```

It seems like attitude explains most points and surf correlates slightly negatively with points.



203 changes: 203 additions & 0 deletions chapter2.html

Large diffs are not rendered by default.

167 changes: 167 additions & 0 deletions data/learning.csv
Original file line number Diff line number Diff line change
@@ -0,0 +1,167 @@
"gender","age","attitude","deep","stra","surf","points"
"F",53,3.7,3.58333333333333,3.375,2.58333333333333,25
"M",55,3.1,2.91666666666667,2.75,3.16666666666667,12
"F",49,2.5,3.5,3.625,2.25,24
"M",53,3.5,3.5,3.125,2.25,10
"M",49,3.7,3.66666666666667,3.625,2.83333333333333,22
"F",38,3.8,4.75,3.625,2.41666666666667,21
"M",50,3.5,3.83333333333333,2.25,1.91666666666667,21
"F",37,2.9,3.25,4,2.83333333333333,31
"M",37,3.8,4.33333333333333,4.25,2.16666666666667,24
"F",42,2.1,4,3.5,3,26
"M",37,3.9,3.58333333333333,3.625,2.66666666666667,31
"F",34,3.8,3.83333333333333,4.75,2.41666666666667,31
"F",34,2.4,4.25,3.625,2.25,23
"F",34,3,3.33333333333333,3.5,2.75,25
"M",35,2.6,4.16666666666667,1.75,2.33333333333333,21
"F",33,4.1,3.66666666666667,3.875,2.33333333333333,31
"F",32,2.6,4.08333333333333,1.375,2.91666666666667,20
"F",44,2.6,3.5,3.25,2.5,22
"M",29,1.7,4.08333333333333,3,3.75,9
"F",30,2.7,4,3.75,2.75,24
"M",27,3.9,3.91666666666667,2.625,2.33333333333333,28
"M",29,3.4,4,2.375,2.41666666666667,30
"F",31,2.7,4,3.625,3,24
"F",37,2.3,3.66666666666667,2.75,2.41666666666667,9
"F",26,3.7,3.66666666666667,1.75,2.83333333333333,26
"F",26,4.4,4.41666666666667,3.25,3.16666666666667,32
"M",30,4.1,3.91666666666667,4,3,32
"F",33,3.7,3.75,3.625,2,33
"F",33,2.5,3.25,2.875,3.5,29
"M",28,3,3.58333333333333,3,3.75,30
"M",26,3.4,4.91666666666667,1.625,2.5,19
"F",27,3.2,3.58333333333333,3.25,2.08333333333333,23
"F",25,2,2.91666666666667,3.5,2.41666666666667,19
"F",31,2.4,3.66666666666667,3,2.58333333333333,12
"M",20,4.2,4.5,3.25,1.58333333333333,10
"F",39,1.6,4.08333333333333,1.875,2.83333333333333,11
"M",38,3.1,3.83333333333333,4.375,1.83333333333333,20
"M",24,3.8,3.25,3.625,2.41666666666667,26
"M",26,3.8,2.33333333333333,2.5,3.25,31
"M",25,3.3,3.33333333333333,1.25,3.41666666666667,20
"F",30,1.7,4.08333333333333,4,3.41666666666667,23
"F",25,2.5,2.91666666666667,3,3.16666666666667,12
"M",30,3.2,3.33333333333333,2.5,3.5,24
"F",48,3.5,3.83333333333333,4.875,2.66666666666667,17
"F",24,3.2,3.66666666666667,5,2.41666666666667,29
"F",40,4.2,4.66666666666667,4.375,3.58333333333333,23
"M",25,3.1,3.75,3.25,2.08333333333333,28
"F",23,3.9,3.41666666666667,4,3.75,31
"F",25,1.9,4.16666666666667,3.125,2.91666666666667,23
"F",23,2.1,2.91666666666667,2.5,2.91666666666667,25
"M",27,2.5,4.16666666666667,3.125,2.41666666666667,18
"M",25,3.2,3.58333333333333,3.25,3,19
"M",23,3.2,2.83333333333333,2.125,3.41666666666667,22
"F",23,2.6,4,2.75,2.91666666666667,25
"F",23,2.3,2.91666666666667,2.375,3.25,21
"F",45,3.8,3,3.125,3.25,9
"F",22,2.8,4.08333333333333,4,2.33333333333333,28
"F",23,3.3,2.91666666666667,4,3.25,25
"M",21,4.8,3.5,2.25,2.5,29
"M",21,4,4.33333333333333,3.25,1.75,33
"F",21,4,4.25,3.625,2.25,33
"F",21,4.7,3.41666666666667,3.625,2.08333333333333,25
"F",26,2.3,3.08333333333333,2.5,2.83333333333333,18
"F",25,3.1,4.58333333333333,1.875,2.83333333333333,22
"F",26,2.7,3.41666666666667,2,2.41666666666667,17
"M",21,4.1,3.41666666666667,1.875,2.25,25
"F",23,3.4,3.41666666666667,4,2.83333333333333,28
"F",22,2.5,3.58333333333333,2.875,2.25,22
"F",22,2.1,1.58333333333333,3.875,1.83333333333333,26
"F",22,1.4,3.33333333333333,2.5,2.91666666666667,11
"F",23,1.9,4.33333333333333,2.75,2.91666666666667,29
"M",22,3.7,4.41666666666667,4.5,2.08333333333333,22
"M",23,3.2,4.83333333333333,3.375,2.33333333333333,21
"M",24,2.8,3.08333333333333,2.625,2.41666666666667,28
"F",22,4.1,3,4.125,2.75,33
"F",23,2.5,4.08333333333333,2.625,3.25,16
"M",22,2.8,4.08333333333333,2.25,1.75,31
"M",20,3.8,3.75,2.75,2.58333333333333,22
"M",22,3.1,3.08333333333333,3,3.33333333333333,31
"M",21,3.5,4.75,1.625,2.83333333333333,23
"F",22,3.6,4.25,1.875,2.5,26
"F",23,2.6,4.16666666666667,3.375,2.41666666666667,12
"M",21,4.4,4.41666666666667,3.75,2.41666666666667,26
"M",22,4.5,3.83333333333333,2.125,2.58333333333333,31
"M",29,3.2,3.33333333333333,2.375,3,19
"F",29,3.9,3.16666666666667,2.75,2,30
"F",21,2.5,3.16666666666667,3.125,3.41666666666667,12
"M",28,3.3,3.83333333333333,3.5,2.83333333333333,17
"F",21,3.3,4.25,2.625,2.25,18
"F",30,3,3.83333333333333,3.375,2.75,19
"F",21,2.9,3.66666666666667,2.25,3.91666666666667,21
"M",23,3.3,3.83333333333333,3,2.33333333333333,24
"F",21,3.3,3.83333333333333,4,2.75,28
"F",21,3.5,3.83333333333333,3.5,2.75,17
"F",20,3.6,3.66666666666667,2.625,2.91666666666667,18
"M",22,3.7,4.33333333333333,2.5,2.08333333333333,17
"M",21,4.2,3.75,3.75,3.66666666666667,23
"M",21,3.2,4.16666666666667,3.625,2.83333333333333,26
"F",20,5,4,4.125,3.41666666666667,28
"M",22,4.7,4,4.375,1.58333333333333,31
"F",20,3.6,4.58333333333333,2.625,2.91666666666667,27
"F",20,3.6,3.66666666666667,4,3,25
"M",24,2.9,3.66666666666667,2.75,2.91666666666667,23
"F",20,3.5,3.83333333333333,2.75,2.66666666666667,21
"F",19,4,2.58333333333333,1.375,3,27
"F",21,3.5,3.5,2.25,2.75,28
"F",21,3.2,3.08333333333333,3.625,3.08333333333333,23
"F",22,2.6,4.25,3.75,2.5,21
"F",25,2,3.16666666666667,4,2.33333333333333,25
"F",21,2.7,3.08333333333333,3.125,3,11
"F",22,3.2,4.16666666666667,3.25,3,19
"F",25,3.3,2.25,2.125,4,24
"F",20,3.9,3.33333333333333,2.875,3.25,28
"M",24,3.3,3.08333333333333,1.5,3.5,21
"F",20,3,2.75,2.5,3.5,24
"M",21,3.7,3.25,3.25,3.83333333333333,24
"F",20,2.5,4,3.625,2.91666666666667,20
"F",20,2.9,3.58333333333333,3.875,2.16666666666667,19
"M",31,3.9,4.08333333333333,3.875,1.66666666666667,30
"F",20,3.6,4.25,2.375,2.08333333333333,22
"F",22,2.9,3.41666666666667,3,2.83333333333333,16
"F",22,2.1,3.08333333333333,3.375,3.41666666666667,16
"M",21,3.1,3.5,2.75,3.33333333333333,19
"M",22,4,3.66666666666667,4.5,2.58333333333333,30
"F",21,3.1,4.25,2.625,2.83333333333333,23
"F",21,2.3,4.25,2.75,3.33333333333333,19
"F",21,2.8,3.83333333333333,3.25,3,18
"F",21,3.7,4.41666666666667,4.125,2.58333333333333,28
"F",20,2.6,3.5,3.375,2.41666666666667,21
"F",21,2.4,3.58333333333333,2.75,3.58333333333333,19
"F",25,3,3.66666666666667,4.125,2.08333333333333,27
"M",21,2.8,2.08333333333333,3.25,4.33333333333333,24
"F",24,2.9,4.25,2.875,2.66666666666667,21
"F",20,2.4,3.58333333333333,2.875,3,20
"M",21,3.1,4,2.375,2.66666666666667,28
"F",20,1.9,3.33333333333333,3.875,2.16666666666667,12
"F",20,2,3.5,2.125,2.66666666666667,21
"F",18,3.8,3.16666666666667,4,2.25,28
"F",21,3.4,3.58333333333333,3.25,2.66666666666667,31
"F",19,3.7,3.41666666666667,2.625,3.33333333333333,18
"F",21,2.9,4.25,2.75,3.5,25
"F",20,2.3,3.25,4,2.75,19
"M",21,4.1,4.41666666666667,3,2,21
"F",20,2.7,3.25,3.375,2.83333333333333,16
"F",21,3.5,3.91666666666667,3.875,3.5,7
"F",20,3.4,3.58333333333333,3.25,2.5,21
"F",18,3.2,4.5,3.375,3.16666666666667,17
"M",22,3.3,3.58333333333333,4.125,3.08333333333333,22
"F",22,3.3,3.66666666666667,3.5,2.91666666666667,18
"M",24,3.5,2.58333333333333,2,3.16666666666667,25
"F",19,3.2,4.16666666666667,3.625,2.5,24
"F",20,3.1,3.25,3.375,3.83333333333333,23
"F",20,2.8,4.33333333333333,2.125,2.25,23
"F",17,1.7,3.91666666666667,4.625,3.41666666666667,26
"M",19,1.9,2.66666666666667,2.5,3.75,12
"F",20,3.5,3.08333333333333,2.875,3,32
"F",20,2.4,3.75,2.75,2.58333333333333,22
"F",20,2.1,4.16666666666667,4,3.33333333333333,20
"F",20,2.9,4.16666666666667,2.375,2.83333333333333,21
"F",19,1.9,3.25,3.875,3,23
"F",19,2,4.08333333333333,3.375,2.83333333333333,20
"F",22,4.2,2.91666666666667,1.75,3.16666666666667,28
"M",35,4.1,3.83333333333333,3,2.75,31
"F",18,3.7,3.16666666666667,2.625,3.41666666666667,18
"F",19,3.6,3.41666666666667,2.625,3,30
"M",21,1.8,4.08333333333333,3.375,2.66666666666667,19
60 changes: 60 additions & 0 deletions data/week2_dataset.R
Original file line number Diff line number Diff line change
@@ -0,0 +1,60 @@
#Kim Ståhlberg
#09112018
#This file is for week two exercise

#Reading data into memory from a website
learning_2014 <- read.table("http://www.helsinki.fi/~kvehkala/JYTmooc/JYTOPKYS3-data.txt", sep="\t", header = T)

#Inspecting dimensions of data
dim(learning_2014)

# Access the dplyr library
library(dplyr)

# create column 'attitude' by scaling the column "Attitude"
learning_2014$attitude <- learning_2014$Attitude / 10

# questions related to deep, surface and strategic learning
deep_questions <- c("D03", "D11", "D19", "D27", "D07", "D14", "D22", "D30","D06", "D15", "D23", "D31")
surface_questions <- c("SU02","SU10","SU18","SU26", "SU05","SU13","SU21","SU29","SU08","SU16","SU24","SU32")
strategic_questions <- c("ST01","ST09","ST17","ST25","ST04","ST12","ST20","ST28")

# select the columns related to deep learning and create column 'deep' by averaging
deep_columns <- select(learning_2014, one_of(deep_questions))
learning_2014$deep <- rowMeans(deep_columns)

# select the columns related to surface learning and create column 'surf' by averaging
surface_columns <- select(learning_2014, one_of(surface_questions))
learning_2014$surf <- rowMeans(surface_columns)

# select the columns related to strategic learning and create column 'stra' by averaging
strategic_columns <- select(learning_2014, one_of(strategic_questions))
learning_2014$stra <- rowMeans(strategic_columns)

# choose a handful of columns to keep
keep_columns <- c("gender","Age","attitude", "deep", "stra", "surf", "Points")

# select the 'keep_columns' to create a new dataset
learning2014 <- select(learning_2014, one_of(keep_columns))

#Inspect new dataset
dim(learning2014)

#Change clomun names to lowercase and print them out
colnames(learning2014)[2]<- "age"
colnames(learning2014)[7]<- "points"
colnames(learning2014)

#Filter out rows where points < 1 and overwrite data
learning2014 <- filter(learning2014, points > 0)
dim(learning2014)

?write.csv

#Write a .csv file into working directory
write.table(learning2014, file = "learning.csv", col.names = c("gender", "age", "attitude", "deep", "stra", "surf", "points"), sep = ",", row.names = F)

#Test if the file can be raed and used as planned
testi2 <- read.csv("data/learning.csv", sep = ",", header = T)
dim(testi2)
testi2
1 change: 1 addition & 0 deletions index.Rmd
Original file line number Diff line number Diff line change
@@ -1,5 +1,6 @@
---
title: "IODS course project"
author: "Kim Ståhlberg"
output:
html_document:
theme: cosmo
Expand Down
85 changes: 66 additions & 19 deletions index.html

Large diffs are not rendered by default.