Как я могу заменить стеммер на основе портера в пакете R tm другим, который лучше соответствует моим потребностям? В данном случае это cistem (https://github.com/FlorianSchwendinger/cistem/). Однако Cistem принимает отдельные слова (или вектор) в качестве аргумента:
install_github("FlorianSchwendinger/cistem")
library("cistem")
> cistem("arbeiten")
[1] "arbei"
> cistem(c("arbeiten", "Arbeit"))
[1] "arbei" "arbeit"
тогда как встроенный стеммер берет весь документ
corpus <- tm_map(corpus, stemDocument, language = "german")
Как интегрировать стеммер CISTEM в пакет tm?
Любая помощь приветствуется.