MisconfigurationError: устройства TPU не были обнаружены, даже если TPU подключен в PyTorch Lightning.

За последние несколько часов были разочарованы проблемой, хотя, скорее всего, это проблема, которую я начал сам, ха.

Пытаюсь подключиться к ТПУ в Колабе. Я почти уверен, что разобрался со всем импортным материалом. Мой код здесь. Я не полностью настроен на все, поэтому весь документ не работает, но вы должны увидеть мои попытки подключения TPU.

Я использую Pytorch в версии 1.5.0 и torchvision в 0.6.0, потому что обнаружил, что не могу установить XLA с чем-либо более поздним, чем 1.5.0. Я использую XLA версии 20200325.

Это изображение кажется таким запутанным: в нем говорится, что у нас есть соединение с xla: 1, но при попытке пометить его в трейнере я получаю сообщение об ошибке, что TPU не может быть найден.

введите описание изображения здесь

Если бы кто-нибудь мог мне помочь, это было бы замечательно.

Спасибо


person DownstairsPanda    schedule 21.12.2020    source источник
comment
Просто интересно - пробовали ли вы установить Torch / Torch-XLA / PyTorch-Lightning с помощью документации здесь? Кажется, что Torch XLA установлен правильно, как вы упомянули, но похоже, что PyTorch-Lightning требует нескольких дополнительных шагов.   -  person Allen Wang    schedule 22.12.2020


Ответы (1)


У меня возникла та же проблема, и эти шаги решили ее.

  1. Следуйте документации PyTorch-Lightning: ПОДДЕРЖКА TPU
  2. Добавьте еще одну ячейку записной книжки:
%%capture
!curl https://raw.githubusercontent.com/pytorch/xla/master/contrib/scripts/env-setup.py -o pytorch-xla-env-setup.py > /dev/null
!python pytorch-xla-env-setup.py --version nightly --apt-packages libomp5 libopenblas-dev > /dev/null
!pip install pytorch-lightning > /dev/null
person Valley    schedule 10.01.2021