У меня проблема с отсутствующими значениями в моем наборе данных. По какой-то причине в нескольких идентификаторах отсутствует значение в столбце "Имена". Это странно, потому что другие идентификаторы (с тем же КОДОМ (в моем наборе данных больше кодов (> 10K) и в том же году (6 вариантов для лет)) имеют значение в этом столбце.
Может ли кто-нибудь помочь мне выяснить код, чтобы идентификаторы с отсутствующими значениями в столбце «Имена» получали такое же значение символа в столбце «Имена», если другие идентификаторы с тем же кодом и годом имеют значение в этом столбец?
Например: NA в строке 4; должен измениться на «Больница»; на основе того же кода и года другого идентификатора (в моем исходном фрейме данных есть идентификатор с 2013 и код 01 с именем «Больница»; в противном случае он должен остаться NA).
Примечание: это панельные данные, поэтому каждый идентификатор может находиться в наборе данных в течение нескольких лет (и строк; каждый год - это одна строка), и не все входят в каждый год. В моем фрейме данных также есть больше переменных.
> dput(Dataframe[1:7, ])
structure(list(ID = structure(c(1, 2, 2, 2, 2, 2, 2), format.spss = "F9.3"), CODE = c("01", "01", "01","01", "01", "01", "01"), Year = structure(c(2018, 2014, 2018, 2013, 2013, 2015, 2015), format.spss = "F9.3"), Quarter = structure(c(3, 4, 4, 4, 3, 4, 3), format.spss = "F9.3"), Size = c(24.5, 23.25, 24.5, 30, 30, 19.25, 19.25), Names = c("Hospital", "Hospital", "Hospital", NA, "Hospital", NA, "Hospital")), row.names = c(NA, -7L), class = c("tbl_df", "tbl", "data.frame"
A tibble: 7 x 8
ID Gender CODE Year Quarter Size Names
<dbl> <dbl> <dttm> <chr> <dbl> <dbl> <dbl> <chr>
1 1 2 01 2018 3 24.5 Hospital
2 2 1 01 2014 4 23.2 Hospital
3 2 1 01 2018 4 24.5 Hospital
4 2 1 01 2013 4 30 NA
5 2 1 01 2013 3 30 Hospital
6 2 1 01 2015 4 19.2 NA
7 2 1 01 2015 3 19.2 Hospital
Выбор и проверка отдельных строк - это слишком много работы, у меня более 1,1 миллиона строк ..
Изменить: также можно перенести столбец «имена» в 1, если он имеет (символьное) значение, и 0, если нет.
Спасибо!