6 причин, почему вы должны изучить R, что делает R эффективным, где R сияет, и лучшие практики R

Я так далеко зашел по пути Python, обладая обширной подготовкой, профессиональным опытом и образованием, что упустил из виду, насколько вырос R, особенно в его выполнении жизненного цикла в статистических сценариях использования и исключительных возможностях визуализации.

Вы просили пост со списком — вот он! Нет пуха; прямо в точку.

Помимо этого, R исключительно эффективен для реализаций данных.

Как правило, я применяю нисходящий подход к оттачиванию определений и расширению хранилища знаний по заданной теме.

Описание R

Используйте программирование на R для проведения статистического анализа и развертывания графических представлений данных.

R — это функциональный язык программирования, который поддерживает векторные операции и матричную алгебру. R также может создавать графику публикационного качества и имеет широкий спектр статистических алгоритмов и алгоритмов машинного обучения. R обладает широкими возможностями расширения, и для анализа данных доступно множество программных пакетов, включая популярную коллекцию пакетов «tidyverse» [4]. R является программным обеспечением с открытым исходным кодом и доступно бесплатно на веб-сайте CRAN [5].

Случаи использования R (постоянно обновляются — темы высокого уровня)

Вот 25 вариантов использования, полная версия, по областям знаний/областям знаний:

(1) визуализация данных (2) анализ данных (3) обработка данных (4) машинное обучение (5) глубокое обучение [8];

(6) Прогнозная аналитика (7) Оптимизация (8) Моделирование (9) Веб-разработка [6] (10) Системное администрирование;

(11) Интеллектуальный анализ данных (12) Статистические вычисления (13) Биоинформатика [10] (14) Журналистика данных (15) Эконометрика;

(16) Страхование (17) Маркетинг [9] (18) Розничная торговля (19) Парсинг в Интернете (20) Анализ социальных сетей;

(21) Анализ настроений (22) Сетевой анализ (23) Геопространственный анализ [7] (24) Интеллектуальный анализ текста (25) Бизнес-аналитика.

Причины эффективности R (постоянно обновляются)

1. R — мощный инструмент анализа данных со множеством встроенных статистических функций и функций машинного обучения.

2. R — интерпретируемый язык, а это означает, что код может выполняться без предварительной его компиляции. Это позволяет тестировать новые идеи и быстро создавать прототипы решений.

3. R ​​имеет большое и активное сообщество со множеством полезных онлайн-ресурсов.

4. R — бесплатное программное обеспечение с открытым исходным кодом, выпущенное под лицензией GNU General Public License [1]. Это делает его доступным для всех и позволяет вносить изменения и улучшения.

5. R является кроссплатформенным, то есть его можно использовать в Windows, Mac и Linux.

6. R легко интегрируется с другими программными средами и языками, что упрощает его использование в различных условиях.

7. Синтаксис R прост и легок в освоении даже для тех, у кого нет опыта программирования.

8. R обладает широкими возможностями настройки [2], что позволяет пользователям адаптировать программное обеспечение к своим конкретным потребностям.

9. Возможности построения графиков и визуализации в R очень эффективны, что упрощает создание сложных диаграмм и графиков. Я еще не встречал ни одного человека, который утверждал бы, что Python обладает превосходными возможностями построения диаграмм и визуализации по сравнению с R.

10. R — отличный инструмент для исследовательского анализа данных [3], обеспечивающий гибкую и интерактивную среду для исследования наборов данных.

Причины, по которым вам следует изучать R вместо Python (постоянно обновляется)

1. R — это язык статистического программирования, специально разработанный для работы с данными. Python — это язык программирования общего назначения, который позволяет использовать его для самых разных целей.

2. R предназначен для работы с фреймами данных [24] — типом структуры данных, повсеместно используемым в статистическом анализе. К сожалению, в Python нет собственного типа данных dataframe, что усложняет работу с данными.

3. R ​​имеет множество встроенных функций статистического анализа, облегчающих работу с конкретными данными. В Python не так много встроенных статистических функций, что может затруднить анализ данных в более широком статистическом пространстве.

4. R — векторный язык, а это означает, что большинство операций выполняются над векторами данных [25]. Это может быть очень полезно для анализа данных, поскольку позволяет легко применять операции к нескольким точкам данных. С другой стороны, Python не является векторным языком, что усложняет анализ данных.

5. У R очень активное сообщество пользователей, а это значит, что есть много доступных ресурсов для изучения того, как использовать язык. Python также имеет большое сообщество пользователей, но сообщество R более активно работает над специализированными темами, что упрощает поиск помощи в случае необходимости.

6. R является бесплатным и имеет открытый исходный код, что означает, что каждый может использовать его, не платя за это. Python также, конечно, Python с открытым исходным кодом, но R более широко используется в научном сообществе, что может упростить поиск конкретных и полезных ресурсов.

Сходство между R и Python (постоянно обновляется)

1. Оба являются интерпретируемыми языками, что означает, что код выполняется построчно, а не компилируется одновременно.

2. Это языки высокого уровня; они абстрагированы от базовой системы и легко читаются и пишутся.

3. Они бесплатны и имеют открытый исходный код; любой может использовать и внести свой вклад в них.

4. R и Python кроссплатформенны: их можно использовать в разных операционных системах.

5. R и Python имеют обширные библиотеки; уже написано много кода, который можно использовать повторно.

6. R и Python являются объектно-ориентированными: код организован в виде объектов, которыми можно манипулировать.

7. R и Python имеют обширную документацию; доступно много информации о том, как их использовать.

8. R и Python поддерживаются большими сообществами: многие люди могут помочь с их использованием или разработкой.

9. R и Python используются в науке о данных; они хорошо подходят для анализа данных и задач машинного обучения.

10. R и Python — универсальные языки — их можно использовать для разных задач.

Различия между R и Python (постоянно обновляется)

R — это язык программирования и программная среда для статистического анализа, графического представления и составления отчетов. Python — это интерпретируемый язык программирования высокого уровня общего назначения.

1) R — статистический язык, а Python — язык программирования общего назначения.

2) R предназначен для статистического анализа и визуализации данных, тогда как Python больше подходит для программирования общего назначения и создания алгоритмов.

3) У R более крутая кривая обучения, чем у Python.

4) R имеет много специализированного синтаксиса и терминологии, тогда как Python более лаконичен и удобочитаем.

5) R может быть сложным для отладки, в то время как Python может быть более интуитивным процессом отладки.

6) R имеет больше встроенных статистических функций, чем Python [21].

7) R имеет более богатую графическую библиотеку, чем Python.

8) R может быть сложно расширить, в то время как Python более модульный и легко расширяемый [22].

9) R не обязательно так широко используется, как Python (с количеством вариантов использования, доступных для реализации с использованием Python по сравнению с R).

10) R распространяется под лицензией GNU GPL [1], а Python распространяется под лицензией Python Software Foundation [23].

Случаи использования R

1. Анализируйте и прогнозируйте финансовые данные.

2. Изучите поведение потребителей.

3. Понимать закономерности в ДНК и другие данные о последовательностях [11].

4. Рекомендуйте фильмы и другие товары пользователям на основе их прошлого поведения.

5. Отслеживать и прогнозировать распространение болезней [12].

6. Изучите влияние маркетинговых кампаний на продажи.

7. Отслеживать и предсказывать погоду [13].

8. Анализируйте данные социальных сетей, чтобы найти интересные закономерности.

9. Изучить влияние лекарств на больных [14].

Рекомендации

1. Используйте set.seed(): это важно, поскольку гарантирует воспроизводимость результатов [15]. Без set.seed генератор случайных чисел будет генерировать разные числа каждый раз, когда вы запускаете свой код, что приводит к различиям в ваших результатах.

2. Используйте %›%: оператор канала (%›%) — отличный способ сделать ваш код более читабельным [18]. Он берет выходные данные левой стороны и подает их на правую сторону.

3. Избегайте использования глобальных переменных [16]: глобальные переменные доступны на протяжении всего сеанса R. Использование глобальных переменных может привести к случайным изменениям в вашем коде и может затруднить его чтение.

4. Используйте функции: функции — отличный способ избежать повторения кода. Например, если вы обнаружите, что постоянно пишете один и тот же код, вы можете создать функцию, которая сделает это за вас, в результате чего код станет более кратким и легким для чтения.

5. Используйте RStudio: RStudio — это IDE (интегрированная среда разработки) для R. Она включает в себя множество функций, облегчающих программирование на R, например подсветку синтаксиса и завершение кода [17].

6. Держите свой код в чистоте, например, чтобы код был организован и легко читался. Один из способов сделать это — использовать пробелы для создания отступа в коде и облегчения его сканирования [19].

7. Используйте комментарии: комментарии — отличный способ сделать ваш код более читабельным и объяснить, что он делает. При написании комментариев будьте ясны и лаконичны.

8. Используйте встроенную справку: R имеет обширную документацию по всем своим функциям.

9. Следуйте руководству по стилю: руководство по стилю Hadley Wickham [20] является широко используемым руководством по стилю для программирования на R. Следование руководству по стилю делает ваш код более последовательным и легким для чтения.

10. Используйте контроль версий: контроль версий — это система, которая позволяет вам отслеживать изменения в вашем коде с течением времени. Это важно для отслеживания вашей работы и сотрудничества с другими.

Подумайте о том, чтобы поделиться со мной своими мыслями, если у вас есть какие-либо изменения / исправления, которые вы можете порекомендовать, или рекомендации по дальнейшему расширению этой темы.

Также, пожалуйста, подпишитесь на мой еженедельный информационный бюллетень:



Ссылки:

1. Лицензии R. https://www.r-project.org/Licenses/

2. Введение в R. https://www.r-project.org/about.html

3. Услуги — Semanticlabs. https://www.semanticlabs.at/services

4. Tidyverse. https://www.tidyverse.org

5. Сайт CRAN для загрузки R. https://cran.r-project.org

6. Блестящий. https://shiny.rstudio.com

7. R: Картография и геопространственная информация. https://guides.library.duke.edu/r-geospatial

8. Начало работы с глубоким обучением в R. https://www.rstudio.com/blog/getting-started-with-deep-learning-in-r/

9. Вот почему каждый современный рынок нуждается в программировании на R. https://www.cmswire.com/digital-marketing/heres-why-every-modern-marketer-needs-r-programming/

10. Введение в R и RStudio для геномики. https://datacarpentry.org/genomics-r-intro/

11. Использование R для биоинформатики. https://a-little-book-of-r-for-bioinformatics.readthedocs.io/en/latest/src/chapter1.html

12. 100 лучших ресурсов R о коронавирусе COVID-19. https://statsandr.com/blog/top-r-resources-on-covid-19-coronavirus/

13. Введение в прогнозирование погоды с помощью глубокого обучения. https://blogs.rstudio.com/ai/posts/2020-09-01-weather-prediction/

14. Использование программирования R для анализа данных клинических испытаний. https://www.quanticate.com/blog/r-programming-in-clinical-trials

15. Установить seed в R. https://r-coder.com/set-seed-r/

16. Будущее для R: общие проблемы с решениями. https://cran.r-project.org/web/packages/future/vignettes/future-4-issues.html

17. Студио. https://www.rstudio.com

18. Как использовать %n% в R: 7 примеров использования оператора. https://www.marsja.se/how-to-use-in-in-r/

19. Чистый и аккуратный R-скрипт. https://davidzeleny.net/wiki/doku.php/recol:clean_and_tidy_script

20. Расширенное руководство по стилю R от Hadley Wickham. http://adv-r.had.co.nz/Style.html

21. Python против R: в чем разница? https://www.ibm.com/cloud/blog/python-vs-r

22. Расширение и встраивание интерпретатора Python. https://docs.python.org/3/extending/index.html

23. История и лицензия. https://docs.python.org/3/license.html

24. Глава 6. Работа с фреймами данных. https://bookdown.org/dli/rguide/working-with-data-frames.html

25. Р — вектор. https://www.geeksforgeeks.org/r-vector/