Попытка создать пропорции скорости вспенивания на основе только пола. Можно получить пропорции от общего числа участников

#r

#r

Вопрос:

1. Прочитайте файл

 library(tidyverse)
churnData <- as_tibble(read.table("WA_Fn-UseC_-Telco-Customer-Churn.csv",
             sep=",",header=TRUE,stringsAsFactors=FALSE))
  

2. Сколько случаев сбивания и отсутствия сбивания?

  churnData %>%
   group_by(Churn) %>% 
   summarise(Count=n())
`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 2 x 2
  Churn Count
  <chr> <int>
1 No     5174
2 Yes    1869
  

3. Определите количество и пропорцию женщин и мужчин в файле

  churnData %>%
   group_by(gender) %>%
   summarise(Count=n(),Proportion=Count/nrow(churnData))
 
`summarise()` ungrouping output (override with `.groups` argument)
# A tibble: 2 x 3
  gender Count Proportion
  <chr>  <int>      <dbl>
1 Female  3488      0.495
2 Male    3555      0.505
  

4. Учитывая пол клиента, какова вероятность сбивания?

    churnData   %>%
   group_by(gender,Churn)   %>%
   summarise(Count=n(),Proportion=Count/nrow(churnData))

`summarise()` regrouping output by 'gender' (override with `.groups` argument)
# A tibble: 4 x 4
# Groups:   gender [2]
  gender Churn Count Proportion
  <chr>  <chr> <int>      <dbl>
1 Female No     2549      0.362
2 Female Yes     939      0.133
3 Male   No     2625      0.373
4 Male   Yes     930      0.132
>     summarise(Count=n(),Proportion=Count/nrow[churnData$gender==gender])
Error: `n()` must only be used inside dplyr verbs.
Run `rlang::last_error()` to see where the error occurred.
  

необходимо, чтобы пропорции были:

 0.731
0.269
0.738
0.262
  

Комментарии:

1. Вы понимаете, какие вычисления вам нужно сделать? Вы не можете использовать целое nrow(churnData) в качестве знаменателя, вам нужно, чтобы ваш пол считался с # 3 в качестве знаменателя. Поэтому вы должны сохранить или воссоздать эти показатели, а не просто просматривать их и двигаться дальше.

2. хорошо, я пытаюсь создать подсчеты с помощью mutate, чтобы они были сохранены для суммирующей гендерной таблицы <- table(churnData$gender) if (churnData $gender == ‘Female’) { churnData_gentotal <- mutate(.data=churnData,gentotal=genderTable[1]) } else {churnData_gentotal <- mutate(.data=churnData,gentotal=genderTable[2]) } %>% Я заставил женскую часть работать, но r говорит «неожиданное другое» извините, если это глупый вопрос, но я не вижу в этом ничего плохого. пожалуйста, помогите