Основная идея: загружать данные в удаленное хранилище и хранить указатель данных в репозитории git. Отслеживая указатель, вы отслеживаете свои данные, поскольку вы всегда можете получить свои данные с помощью указателя.

Инициализация (аналогично git init)

dvc init # Initialise for whole git repository
dvc init --subdir # initialise in a subdirectory of git repository

Добавить файл/папку (аналогично git add)

dvc add data/data.xml # Add a file
dvc add data # Add whole directory

Отслеживание указателя DVC на git

# Add files generated from DVC to git, files will look similar to command below, not exact same
git add data/.gitignore data/data.xml.dvc # In case you have added data/data.xml

Push, Pull, Checkout (аналогично командам git)

dvc push # push data to remote storage
dvc pull # pull data from remote storage
dvc checkout # checkout the data from current dvc files

Добавить пульты

# https://dvc.org/doc/command-reference/remote/add
dvc remote add -d myremote s3://mybucket/path # Use S3 as remote
dvc remote add -d storage gdrive://folder_id # Use Google Drive as remote