Ищете руководство о том, как заменить фигурный апостроф прямым апострофом в списке R векторов символов.
Причина, по которой я заменяю фигурные апострофы, — позже в сценарии я проверяю каждый элемент списка, чтобы увидеть, найден ли он в словаре (используя qdapDictionary), чтобы убедиться, что это настоящее слово, а не мусор. В словаре используются прямые апострофы, поэтому слова с фигурными апострофами «отбрасываются».
Ниже приведен пример кода, который у меня есть в настоящее время. В моем тестовом списке элемент № 6 содержит фигурный апостроф, а элемент № 2 — прямой апостроф.
Пример:
list_TestWords <- as.list(c("this", "isn't", "ideal", "but", "we", "can’t", "fix", "it"))
func_ReplaceTypographicApostrophes <- function(x) {
gsub("’", "'", x, ignore.case = TRUE)
}
list_TestWords_Fixed <- lapply(list_TestWords, func_ReplaceTypographicApostrophes)
Результат: Без изменений. Пункт 6 по-прежнему использует фигурный апостроф. См. вывод ниже.
list_TestWords_Fixed
[[1]]
[1] "this"
[[2]]
[1] "isn't"
[[3]]
[1] "ideal"
[[4]]
[1] "but"
[[5]]
[1] "we"
[[6]]
[1] "can’t"
[[7]]
[1] "fix"
[[8]]
[1] "it"
Любая помощь, которую вы можете предложить, будет высоко оценена!
gsub("’", "'", x, fixed=TRUE)
- person Wiktor Stribiżew   schedule 18.10.2017gsub("(*UCP)’", "'", x, perl=TRUE)
или простоgsub("’", "'", x, perl=TRUE)
. Обратите внимание, чтоignore.case = TRUE
можно безопасно удалить. - person Wiktor Stribiżew   schedule 18.10.2017