Настройка среды

В этой статье показан проект, над которым я начал два месяца; Июль. Закончив его. Думаю, было бы неплохо дать вам всем пошаговое руководство, особенно для тех, кто хочет заняться наукой о данных как постоянной профессией (новички).

Эта статья будет в серии именно;

  1. Настройка среды
  2. Предварительная обработка данных и разработка функций
  3. Исследовательский анализ данных (EDA)
  4. Кластерный анализ
  5. Классификация
  6. Регрессивный анализ

К концу этой серии вы станете намного увереннее реализовывать свой собственный проект.

Google, чтение документации и нескольких ресурсов в Интернете — ваши лучшие друзья.

Давай начнем!

Установка Python

Прежде всего вам необходимо загрузить и установить Python в вашей системе. Установка Python: перейдите по этой ссылке Python link, прокрутите вниз и выберите установщик Windows (64-битная или 32-битная версия) в зависимости от конфигурации вашей системы. Если вы застряли, используйте это обучающее видео, которое поможет вам.

Установка Конды

Установка Conda довольно проста, перейдите по этой ссылке

Настройка кода Visual Studio

Опять же, довольно легко установить и настроить ссылку для скачивания. После установки необходимо будет выполнить некоторые настройки. Оставил бы это вам.

Подсказка: Google и исследования!😁

Настройка среды

Как только вышеперечисленное будет достигнуто, можно приступать! Активируйте среду Conda (для этого обратитесь к подсказке выше).

Перейдите на рабочий стол при использовании терминала Conda. У вас должно получиться что-то похожее на это;

Используя терминал Conda (см. фото выше), следуйте инструкциям ниже;

  1. Запустите mkdir имя_папки1
  2. Откройте свой vs-код, создайте следующий файл yaml и сохраните его как env.yaml;
name: ml
channels:
  - conda-forge
  - defaults
dependencies:
  # # Latest versions
  # # conda channels
  - scikit-learn=1.3.0
  - seaborn=0.12.2
  - python=3.11
  - plotly=5.15.0
  - pandas=2.0.3
  - matplotlib
  # - numpy=1.25.0
  # - scipy=1.11.1
# All are on the latest versions
# pandas would install the following by default;
# - scipy
# - numpy
# - statsmodels

В приведенном выше файле создается папка с именем ml с установленными пакетами, чтобы запустить изолированную виртуальную среду conda для использования, не затрагивая основную среду conda, которую вы установили ранее.

3. Создайте еще одну папку в папке имя_папки1; mkdir ml, имя должно соответствовать переменной name в файле yaml

4. Запустите conda env create -f env.yml -p ../имя_папки1/ml

5. Запустите conda env list, чтобы получить список всех сред, созданных с помощью Anaconda.

6. Запустите conda active ./ml, чтобы активировать среду.

7. Запустите conda list, чтобы проверить, все ли зависимости установлены.

Выполнив все приведенные выше инструкции, вы готовы к следующему набору серии! Ты сделал это ! 😎

Полезные ссылки



https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html