Часть 1: Введение в геопространственные концепции (следуйте здесь)
Часть 2: Геопространственная визуализация и создание геометрии (следуйте здесь)
Часть 3. Геопространственные операции (следуйте здесь)
Часть 4. Создание конвейера геопространственного машинного обучения (этот пост)

В этом посте мы собираемся завершить серию статей по Практическому руководству по геопандам, рассмотрев различные классы задач геопространственного машинного обучения и способы их решения.

Таблица содержания:

  1. Резюме
  2. Геопространственная регрессия
  3. Геопространственная классификация
  4. Геопространственная кластеризация
  5. Что дальше

Резюме

В предыдущем посте здесь мы обсуждали, как географические объекты могут быть связаны друг с другом. Это отношение может быть усилено путем выполнения, например, операций пересечения или внутри в Geopandas. Кроме того, мы обсудили удобную пространственную операцию Пространственных объединений, с помощью которой вы можете выполнять функцию агрегирования или группирования для различных географических объектов (например, добавлять название города для каждого дома в районе).

А теперь мы познакомимся с различными типами задач геопространственного машинного обучения и получим раннее интуитивное представление о том, чем они отличаются от типичных непространственных задач. Общие задачи, которые мы собираемся обсудить, - это геопространственная регрессия, классификация и кластеризация.

Геопространственная регрессия

Задача непространственной регрессии учитывает несколько входных переменных для оценки значения целевого выхода. Обычно целевая переменная имеет форму непрерывной переменной.

Возьмем, к примеру, задачу регрессии для прогнозирования цены на жилье с учетом некоторых других факторов, таких как размер квартиры, количество комнат и историческая продажная цена за последние 20 лет. Затем вы найдете наиболее подходящее уравнение, которое минимизирует определенную функцию ошибок.

Однако в задаче «Геопространственная регрессия» вам потребуется учитывать пространственные зависимости как часть зависимой переменной.

Как показано на рисунке выше, ваша цена на жилье (целевая переменная) теперь зависит от пространства. Это означает, что расположение одного дома может повлиять на цену соседних домов.

Не только это, но и независимые входные переменные также имеют соответствующие пространственные зависимости. Например, историческая цена одного дома может повлиять на историческую цену других домов.

В более общих случаях даже независимые переменные могут оказывать пространственное влияние на другие переменные (например, количество комнат в жилом комплексе может влиять на средний размер семьи в близлежащих местах). Эти пространственные взаимозависимости являются ключом к проблеме геопространственной регрессии.

Обычно некоторые из наиболее распространенных алгоритмов геопространственной регрессии, которые могут фиксировать эти пространственные зависимости:

  1. Регрессия методом наименьших квадратов (OLS) и
  2. Географически взвешенная регрессия (GWR)

Геопространственная классификация

Точно так же задача непространственной классификации учитывает несколько входных переменных для оценки класса целевого выхода. Обычно целевой результат имеет форму дискретной переменной, представляющей определенный класс (например, кошка или собака).

Однако в задаче геопространственной классификации вы обычно выполняете классификацию на уровне пикселей или на всем наборе растровых данных. Это может включать семантическую сегментацию, сегментацию экземпляра или классификацию растра.

На приведенном выше рисунке показана задача семантической сегментации по пикселям для определения землепользования (например, водоемов, лесов, засушливых земель, городских территорий) с учетом растровых данных.

Подобно типичной задаче классификации, задача геопространственной классификации может быть решена с использованием глубокой нейронной сети (компьютерное зрение), случайного леса, машины опорных векторов (SVM) или моделей максимального правдоподобия.

Геопространственная кластеризация

И последнее, но не менее важное: еще одна распространенная задача геопространственного машинного обучения включает в себя геопространственную кластеризацию. В обычных непространственных задачах мы можем выполнять кластеризацию, группируя большое количество наблюдений в несколько «горячих точек» в соответствии с некоторыми мерами сходства, такими как расстояние, плотность и т. Д. и т. Д..

Но согласно первому закону географии:

«Все связано со всем остальным, но близкие вещи более связаны, чем далекие». - Уолдо Тоблер

Это затрудняет кластеризацию в контексте геопространственного машинного обучения, потому что нам также необходимо учитывать, как каждое наблюдение связано друг с другом в своем пространственном контексте (т. Е. С пространственными ограничениями).

Одна интересная проблема геопространственной кластеризации - это анализ пространственно-временных закономерностей. Помимо рассмотрения пространственных зависимостей между различными точками наблюдения или полигонами, этот класс алгоритмов также учитывает временные зависимости. Чтобы иметь возможность кластеризовать точку наблюдения пространства-времени, обычно строится трехмерная диаграмма, на которой затем может работать алгоритм кластеризации.

Некоторые из наиболее распространенных моделей для решения проблемы геопространственной кластеризации:

  1. Многомерная кластеризация с пространственными ограничениями
  2. Анализ горячих точек
  3. Кластеризация на основе плотности
  4. Майнинг трехмерных пространственно-временных структур

Подпишитесь на мою информационную рассылку по электронной почте: https://tinyurl.com/2npw2fnz , где я регулярно резюмирую исследовательские работы по ИИ на простом английском языке и в красивой визуализации.

Что дальше

Область геопространственного машинного обучения обширна, и я надеюсь, что этот пост может дать вам лишь представление о разнообразии этой области. Если у вас есть какие-либо связанные темы, которые вас интересуют, пожалуйста, дайте мне знать. Вы также можете ознакомиться с некоторыми из моих других постов по геопространственному машинному обучению: