Site icon Tutor Bin

R Question

R Question

Description

Part 1: Mini-data thon – practice makes perfect.

For part 1, you are to pick one or more data-sets from the following URLs and you are to do the following (cannot be the data-sets we’ve used already in class – unless it’s from the exam or your project data as I had noted during class would be OK):

  1. Create 1 bar graph that displays the count of a qualitative variable.
  2. Create 1 bar graph that displays a qualitative variable and a continuous variable.
  3. Create 1 histogram and change the bin width to a size of your liking.
  4. Create 1 box plot that displays a qualitative variable and a continuous variable.
  5. Create 1 line graph that shows changes over time.
  6. Create 1 scatter plot that contains two continuous variables.
  7. Implement 5 of the items that are listed in the “Additional configurations/ tips and tricks” from the Intro to Data Visualization in R HTML notes. When implementing any of these, it is important that you make a note of this in the comment of your code. These can be part of the graphs for 1-6, though you need to note what it is that you did with a comment in your code.

For each graph, you are to include labels (x, y, any legends, and the title properly formatted), a subtitle, and a caption that explains what you are showing.

Data repositories:

Part 2: On a .RMD file that you will eventually knit to convert to HTML:

  1. Create a numeric vector that contains 5 values
  2. Create a character vector that contains 5 values
  3. Create a logical vector with 4 values
  4. Access index location 4 from your numeric vector with 5 values and display just the number that is at index location 4 with code.
  5. Access index locations 2-4 for your character vector with 5 values and display just the character strings that are at index location 2-4.
  6. Create three numeric vectors with at least 3 values each and use rbind to combine them into a matrix.
    • With code, display the output of the first row and second column of your matrix.
    • With code, display the output of your second row and columns 2-3.
  7. Find a function or package that you’ve never used before, and try something new by reading through the documentation available. You can use any dataset for this question.
  8. Create a function of your choosing to demonstrate that you have an understanding of how they work. You can use any dataset from the link I shared above with it.

Part 3: College Majors Data Transformation and Wrangling 

For this part of the assignment, you’ll be working with data from the website fivethirtyeightLinks to an external site.. To load your data, install the “fivethirtyeight” package in R Studio, load it, and then run the following code to see what you are working with:

View(college_recent_grads). https://www.rdocumentation.org/packages/fivethirtyeight/versions/0.6.2/topics/college_recent_grads Links to an external site.(this link describes the contents of the columns)

To successfully complete this, you should reference the HTML notes pages I’ve shared. 

1. Which majors have the lowest unemployment rate? 

– Create an output that displays the answer to this question in a non graph format (a tabular format – just displaying the output in the mini console within the .RMD as I’ve shown in class). The unemployment rate must be displayed as a %. 
– Create an output that displays the answer to this question in a graph format (ggplot). The unemployment rate must be displayed as a % and the graph must show the majors in either ascending or descending order. Only show the top 10 (lowest unemployment).  Hint, “head()” can be used to output only a certain amount of things. 

Note: this requires the combination of multiple things that we have looked at thus far, and may require some investigation on your part – a skill that you will develop in completing this question (and the others). There are multiple ways to approach this solution so know that there is not one way that I am looking for you to do this. 

To answer this, you’re going to need to sort your data. You can use the arrange function to do this, where you’ll sort by the unemployment_rate variable. By default, arrange is going to sort by ascending order. Depending on how you approach this, you may need to make use of the fct_reorder function as well, or the “factor” function (makes a character or numeric column into type “factor” which allows for you to make edits to the order that data displays) where you set the order (my documentation for wrangling has an example of fct_reorder, though if you want to try it another way feel free to reference https://www.r-graph-gallery.com/267-reorder-a-variable-in-ggplot2.html Links to an external site.(you’ll see that the reorder() function that I’ve shown you is there). Links to an external site. There is an example of me using the reorder function in the exam notes that I had shared (the queries). Lastly, you are going to need to make use of the “percent” function that transforms a number into a percentage. This function comes from the “scales” package. 

Example of use of percent:

my_dataframe %>%
  mutate(mycolumn = percent(some_column))

Answer (a freebie):

college_recent_grads %>%
  arrange(unemployment_rate) %>%
  mutate(major = factor(major, levels = major)) %>%
  select(rank, major, unemployment_rate) %>%
  mutate(unemployment_rate = percent(unemployment_rate)) %>%
  head(10) %>%
  ggplot(aes(x = major, y = unemployment_rate, fill = major)) +
  geom_col(show.legend = FALSE) +
  coord_flip() +
  labs(title = "Unemployment Rates by Major", x = "Unemployment Rate", y = "Major")

2. How does the median income compare across major categories? Display just the top 5 in a visual.

You are going to need to make use of group_by, and summarize and get the median of the median column. You will also need to use arrange() (from the wrangling notes). To get the median, you can use the function median() – you’ve seen mean() before and it works the same way within summarize.

Part 4: Removed per Hurricane Ian. 

Have a similar assignment? "Place an order for your assignment and have exceptional work written by our team of experts, guaranteeing you A results."

Exit mobile version