Основная идея: загружать данные в удаленное хранилище и хранить указатель данных в репозитории git. Отслеживая указатель, вы отслеживаете свои данные, поскольку вы всегда можете получить свои данные с помощью указателя.
Инициализация (аналогично git init)
dvc init # Initialise for whole git repository dvc init --subdir # initialise in a subdirectory of git repository
Добавить файл/папку (аналогично git add)
dvc add data/data.xml # Add a file dvc add data # Add whole directory
Отслеживание указателя DVC на git
# Add files generated from DVC to git, files will look similar to command below, not exact same git add data/.gitignore data/data.xml.dvc # In case you have added data/data.xml
Push, Pull, Checkout (аналогично командам git)
dvc push # push data to remote storage dvc pull # pull data from remote storage dvc checkout # checkout the data from current dvc files
Добавить пульты
# https://dvc.org/doc/command-reference/remote/add dvc remote add -d myremote s3://mybucket/path # Use S3 as remote dvc remote add -d storage gdrive://folder_id # Use Google Drive as remote