Программирование на R — мощный и популярный инструмент для статистических вычислений и анализа данных. Специалисты по данным и исследователи любят его из-за широкого спектра пакетов и функций, которые делают обработку и визуализацию данных быстрой и легкой.
Эти советы и подсказки помогут вам максимально эффективно использовать этот гибкий и мощный инструмент, независимо от того, являетесь ли вы новичком, пытающимся начать программирование на R, или опытным пользователем, желающим отточить свои навыки.
Использование оператора R Native Pipe
Большинству из нас потребуется привыкнуть к этому, но есть лучший вариант по сравнению с оператором magrittr%>%
, который является оператором канала R native, который поставляется с базовым R. Вам не нужно устанавливать какие-либо пакеты tidyverse, чтобы использовать его, просто убедитесь, что ваш R обновлен до последней версии, и вы можете включить его, перейдя в Инструменты › Глобальные параметры › Код, и отметьте опцию ниже.
Просмотр ваших данных на новой вкладке
Вы можете просматривать данные на новой вкладке, чтобы получить представление, подобное тому, что вы видите в электронной таблице Excel, используя функцию View()
.
View(mtcars)
Это дает вам более широкое представление о вашем наборе данных и выглядит лучше, чем просмотр вашего набора данных на консоли. Вы также можете отсортировать данные в этом представлении, щелкнув стрелку любой из переменных, это отсортирует данные в порядке возрастания или убывания. Это похоже на то, что вы делаете с Таблицами в Excel.
Вы можете видеть, что набор данных mtcars
отсортирован по возрастанию миль на галлон, вы также можете использовать оператор конвейера для передачи функции View()
вашим данным, как показано ниже.
library(dplyr) mtcars |> filter(mpg <= 15) |> View()
Объединение сюжетов с пэчворком
Иногда слишком много графиков может сделать работу беспорядочной, вы можете сделать свою работу более организованной, объединив от двух до четырех графиков на одной странице. Patchwork — это пакет, который упрощает эту задачу, используя математические операторы.
library(ggplot2) library(patchwork) a <- diamonds |> ggplot(aes(price)) + geom_histogram() b <- diamonds |> ggplot(aes(cut,price)) + geom_col() a + b
В приведенном выше коде графики a
и b
были объединены в одном столбце с использованием знака +
.
Если вы хотите узнать об объединении нескольких графиков в R, почему бы вам не прочитать эту статью, она будет вам интересна.
Печать результата назначения
Я знаю, вы задавались вопросом, почему я всегда буду присваивать значение переменной и по-прежнему вызывать эту переменную по имени или использовать функцию print()
для получения результата, почему я не могу просто получить результат после его присвоения?
Что ж, надеюсь, это решит вашу проблему, если вы хотите увидеть результат своего задания, просто закройте его круглой скобкой вот так,
(data <- head(iris))
Приведенный выше код сохраняет результат head(iris)
в переменной data
и сразу же выдает результат.
Создание собственного бинарного оператора
Точно так же, как были созданы операторы канала, вы также можете создавать свои собственные бинарные операторы. Оператор +=
в Python позволяет вам добавлять значение к существующей переменной, тем самым обновляя значение этой переменной. Вы можете воспроизвести такую функцию в R.
'%+=%' <- function(x,y) x + y
R интерпретирует любой текст между двумя знаками процента (%…%)
как бинарный оператор.
>x = 4 >(x <- x %+=% 7) 11
Использование раздела кода в ваших сценариях
Многие пользователи R этим не пользуются, вы можете добавлять разделы кода в свой сценарий, чтобы упростить навигацию, особенно если вы пишете длинные строки кода. Чтобы добавить разделы кода в сценарий, начните комментарий с #
и завершите его ----
, ####
или ====
. Это создаст раздел кода, который вы можете увидеть, щелкнув по контуру.
# Section One ---- # Section Two #### # Section Three ====
Получение сводки данных с помощью Skimr
В отличие от функций str()
и summary()
, функция skim()
в пакете skimr является более полной, позволяя вам видеть такую информацию, как типы данных в наборе данных, отсутствующие значения, а также распределение каждой непрерывной переменной с помощью мини-гистограммы каждой переменной. .
skimr::skim(mtcars)
Использование радужных скобок
Я знаю, что я не единственный, кто находит вложенные функции запутанными, представьте себе такую функцию,
Иногда становится еще хуже, но вы можете сделать скобки разноцветными, включив радужные скобки. Перейдите в раздел Код › Радужные скобки.
Выглядит более приятно для глаз.
Заключение
Эй, надеюсь, вы найдете некоторые из этих советов полезными, так как кто-то поделился некоторыми из этих советов со мной, почему бы вам не поделиться ими с другим пользователем R? Вы не знаете, вы можете спасти жизнь!