Программирование на R — мощный и популярный инструмент для статистических вычислений и анализа данных. Специалисты по данным и исследователи любят его из-за широкого спектра пакетов и функций, которые делают обработку и визуализацию данных быстрой и легкой.

Эти советы и подсказки помогут вам максимально эффективно использовать этот гибкий и мощный инструмент, независимо от того, являетесь ли вы новичком, пытающимся начать программирование на R, или опытным пользователем, желающим отточить свои навыки.

Использование оператора R Native Pipe

Большинству из нас потребуется привыкнуть к этому, но есть лучший вариант по сравнению с оператором magrittr%>%, который является оператором канала R native, который поставляется с базовым R. Вам не нужно устанавливать какие-либо пакеты tidyverse, чтобы использовать его, просто убедитесь, что ваш R обновлен до последней версии, и вы можете включить его, перейдя в Инструменты › Глобальные параметры › Код, и отметьте опцию ниже.

Просмотр ваших данных на новой вкладке

Вы можете просматривать данные на новой вкладке, чтобы получить представление, подобное тому, что вы видите в электронной таблице Excel, используя функцию View().

View(mtcars)

Это дает вам более широкое представление о вашем наборе данных и выглядит лучше, чем просмотр вашего набора данных на консоли. Вы также можете отсортировать данные в этом представлении, щелкнув стрелку любой из переменных, это отсортирует данные в порядке возрастания или убывания. Это похоже на то, что вы делаете с Таблицами в Excel.

Вы можете видеть, что набор данных mtcars отсортирован по возрастанию миль на галлон, вы также можете использовать оператор конвейера для передачи функции View() вашим данным, как показано ниже.

library(dplyr)

mtcars |> 
  filter(mpg <= 15) |> 
  View()

Объединение сюжетов с пэчворком

Иногда слишком много графиков может сделать работу беспорядочной, вы можете сделать свою работу более организованной, объединив от двух до четырех графиков на одной странице. Patchwork — это пакет, который упрощает эту задачу, используя математические операторы.

library(ggplot2)
library(patchwork)

a <- diamonds |> 
  ggplot(aes(price)) +
  geom_histogram()

b <- diamonds |> 
  ggplot(aes(cut,price)) +
  geom_col()

a + b

В приведенном выше коде графики a и b были объединены в одном столбце с использованием знака +.

Если вы хотите узнать об объединении нескольких графиков в R, почему бы вам не прочитать эту статью, она будет вам интересна.



Печать результата назначения

Я знаю, вы задавались вопросом, почему я всегда буду присваивать значение переменной и по-прежнему вызывать эту переменную по имени или использовать функцию print() для получения результата, почему я не могу просто получить результат после его присвоения?

Что ж, надеюсь, это решит вашу проблему, если вы хотите увидеть результат своего задания, просто закройте его круглой скобкой вот так,

(data <- head(iris))

Приведенный выше код сохраняет результат head(iris)в переменной data и сразу же выдает результат.

Создание собственного бинарного оператора

Точно так же, как были созданы операторы канала, вы также можете создавать свои собственные бинарные операторы. Оператор += в Python позволяет вам добавлять значение к существующей переменной, тем самым обновляя значение этой переменной. Вы можете воспроизвести такую ​​функцию в R.

'%+=%' <- function(x,y)
  x + y

R интерпретирует любой текст между двумя знаками процента (%…%) как бинарный оператор.

>x = 4
>(x <- x %+=% 7)
11

Использование раздела кода в ваших сценариях

Многие пользователи R этим не пользуются, вы можете добавлять разделы кода в свой сценарий, чтобы упростить навигацию, особенно если вы пишете длинные строки кода. Чтобы добавить разделы кода в сценарий, начните комментарий с # и завершите его ----, #### или ====. Это создаст раздел кода, который вы можете увидеть, щелкнув по контуру.

# Section One ----

# Section Two ####

# Section Three ====

Получение сводки данных с помощью Skimr

В отличие от функций str() и summary(), функция skim() в пакете skimr является более полной, позволяя вам видеть такую ​​информацию, как типы данных в наборе данных, отсутствующие значения, а также распределение каждой непрерывной переменной с помощью мини-гистограммы каждой переменной. .

skimr::skim(mtcars)

Использование радужных скобок

Я знаю, что я не единственный, кто находит вложенные функции запутанными, представьте себе такую ​​​​функцию,

Иногда становится еще хуже, но вы можете сделать скобки разноцветными, включив радужные скобки. Перейдите в раздел Код › Радужные скобки.

Выглядит более приятно для глаз.

Заключение

Эй, надеюсь, вы найдете некоторые из этих советов полезными, так как кто-то поделился некоторыми из этих советов со мной, почему бы вам не поделиться ими с другим пользователем R? Вы не знаете, вы можете спасти жизнь!