I. ОСНОВЫ ПРОСТРАНСТВЕННОГО АНАЛИЗА 1. КОНЦЕПТУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ 1.1. Геопространственный анализ 1.2. "Что", "Где" и "Почему" - три этапа геопространственного моделирования 1.3. Концептуализация пространственных отношений: дистанция, смежность, взаимодействие

I. ОСНОВЫ ПРОСТРАНСТВЕННОГО АНАЛИЗА

1. КОНЦЕПТУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ

1.1. Геопространственный анализ

Американскому профессору статистики и консультанту по менеджменту Уильяму Эдвардсу Демингу (W. Edwards Deming) приписывают замечательное в своем роде выражение "В Бога мы веруем. Все остальные пусть предоставят данные", смысл которого заключается в том, что без настоящих данных и работы с ними невозможно постижение истины. Наблюдения и измерения, параметры и характеристики (т.е., данные) - лежат в основе любого современного исследования и давно уже стали неотъемлемой частью управления, что, возможно, особенно ярко проявилось в самые последние годы в связи с разными кризисами: экономическими, экологическими, наконец - в связи с пандемией. Без надежных и правильным образом обработанных данных нет "доказательной науки", следовательно, нет и адекватной реакции, корректного управления ситуацией.

Статистика, как раздел математики, посвященный работе с данными, как известно, появилась не вчера, однако с момента изобретения географических информационных систем (ГИС) возникла возможность привязывания данных к местоположению - возможность, обогатившая географию методами так называемого пространственного анализа. Огромные массивы непространственных данных, получив координатную привязку, стали "работать" на объяснение в географии, что привело к пересмотру многих традиционных представлений и появлению новых теорий.


Рис. 1.1 Карта Джона Сноу (1854 г.), на которой отмечены случаи холеры и водозаборные колонки

Можно возразить, что интуитивный пространственный анализ существовал и ранее: достаточно вспомнить интригующую историю про открытие источника холеры в Лондонском Сохо Джоном Сноу, составившим карту (Рис. 1.1), на которой были отмечены места расположения водоразборных колонок и дома с заболевшими и умершими от холеры. Предполагается, что анализ увеличения плотности точек вблизи колонок привел врача к выводу об источнике возбудителя заболевания. Но согласимся - только относительно недавно мы получили возможность "привязывать" сотни тысяч и даже миллионы объектов и событий к географической "подоснове" и заниматься геопространственной статистикой.

Геопространственный анализ позволяет отображать множество отдельных событий (например - преступления, заболевания), так и множество различных свойств в пределах разных операционно-территориальных единиц (ОТЕ); например - преступность или заболеваемость в границах отдельных районов или кварталов города (Рис. 1.2).


Рис. 1.2 Онкологические заболевания (2005-2009) по кварталам Нью-Йорка (фрагмент) как пример отображения явления по матрице операционно-территориальных единиц

Согласно Л. Анселину [Anselin, 1989, стр. 2] пространственный анализ - это количественное изучение пространственно распределенных явлений. По П. Лонгли с соавторами пространственный анализ - это "процесс, посредством которого мы превращаем необработанные данные в полезную информацию в погоне за научными открытиями или более эффективным принятием решений" [Longley et al., 2011, p. 17]. Одно из последних определений принадлежит Г. Грекоузису : "пространственный анализ - это совокупность методов и статистических данных, которые объединяют такие понятия, как местоположение, площадь, расстояние и взаимодействие, для анализа, исследования и объяснения в географическом контексте" [Grekousis, 2020, p. 2.].

Так или иначе на сегодняшний день пространственный анализ это уже целая научная сфера которая включает [O’Sullivan, Unwin, 2010, p.3]:

  • манипулирование пространственными данными с помощью географических информационных систем (ГИС),
  • анализ пространственных данных описательным и исследовательским способом,
  • пространственную статистику, которая использует статистические процедуры для получения "объясняющих" выводов и причинно-следственных связей,
  • построение моделей для выявления взаимосвязей и прогнозирования результатов в пространственном контексте.

Методы пространственного анализа вносят ценный вклад в понимание как природных, так и социальных систем. В геоэкологии методы пространственного анализа могут быть применены в исследованиях самого широкого спектра природных явлений и процессов - от изменения глобального и регионального климата, до исследований геохимических полей, определения направленности и скорости неблагоприятных процессов экзогенной геодинамики, изучение загрязнения воздушного бассейна городов, оценки изменения ландшафтных метрик, характеризующих структуру природной среды и т.д. В экономике методы пространственного анализа могут быть использованы для анализа, картографирования и моделирования взаимосвязей между людьми и различными аспектами экономической жизни; таким образом мы можем изучать различные причины бедности, социального неравенства и т.д.. В социальных исследованиях пространственный анализ может оказаться полезным в изучения того, как люди взаимодействуют в социальном, экономическом и политическом контекстах, что позволяет, например, выявить причины преступности и девиантного поведения.

В отечественной практике ГИС-моделирования термин Пространственный Анализ появился как прямой перевод англоязычного термина Spatial Analysis, в этой связи не всегда легко провести различие между пространственным анализом и географическим или геопространственным анализом, тем более, что все три термина использовались множеством авторов в самых различных контекстах. В общем случае термин географический (или геопространственный) анализ относится к поверхности Земли с ее характерным рельефом суши, растительным покровом и акваторией Мирового Океана. Пространственный Анализ, вероятно, несколько шире, поскольку он может относится к разным типам объектов (например - к другим планетам), и, что важнее - к разным категориям пространств. Так для анализа визуальных свойств фрагментов городской среды (общественных пространств или кварталов с домами) важно представлять ее как совокупность трехмерных объемов, с экранирующими взгляд плоскостями и диапазонами развертки так называемых "вист" (вееров оптических осей созерцания). Подобный анализ в большей степени "пространственный" чем "географический", не случайно для его реализации существуют специальное программное обеспечение Depthmaps.

Основным преимуществом пространственного анализа является способность выявлять закономерности, которые ранее не были определены или даже не наблюдались. Например, используя методы пространственного анализа, можно определить кластеризацию возникающих заболеваний, а затем разработать механизмы для предотвращения его распространения. Точно также можно выявить причины наступающей ксерофитизации растительного покрова в регионе, факторы пожароопасности или заболачивания лесов и т.д. В этом отношении пространственный анализ приводит к лучшему принятию решений в пространственном планировании [Grekousis, 2019]. Не случайно многие методов пространственного анализа, например - MSPA|Структурный анализ все чаще включаются в арсенал инструментов архитектурного проектирования, градостроительства и районной планировки.

В широком смысле существует четыре типа пространственного анализа:

1) Анализ точечных данных с целью выявления одного из трех типов распределений: кластерного, рассеянного, случайного. Классический пример - распределение преступлений или заболеваний. Относительно обоих этих феноменов непустым является вопрос распределены ли они случайно или сгруппированы в кластеры или образуют некую другую, возможно - регулярную мозаику ("паттерн"). В случае обнаружения кластеров мы можем задаться следующим вопросом: какие факторы (экологические для заболеваемости и социальные - для преступности) могут служить причинами формирования кластеров? Анализ распределения точек также включает в себя различные меры центральности - так называемую центрографику - набор статистических переменных, используемых для определения центральных мест и выявления причин явления.

2) Пространственный анализ для полигональных (ареальных) данных, используемый для индивидуального и типологического районирования, а также для конфигурирования различного рода зональных сущностей как естественных (природных зон, экорегионов) так и социальных (участков переписи, почтово-индексных кварталов, планировочных городских районов, функциональных территориальных зон. Пространственная статистика помогает выявлять пространственную неоднородность и пространственную зависимость, демонстрируя, например, как группируются кварталы с различным уровнем доходов или как кластеры экорегионов с различными биоклиматическими показателями объединяются в природно-ландшафтные зоны. Таким образом, регионализация выступает основным проявлением концептуализации пространства в этом виде анализа.

3) Анализ геостатистических (непрерывных) данных можно считать частью теории поля, поскольку этот раздел статистики позволяет анализировать и моделировать непрерывные покрытия и гриды. Сюда можно отнести преобразования, проводимые над цифровыми моделями рельефа с целью получения геоморфометрических переменных (например, уклона и экспозиции). С геостатистикой связывают также интерполяцию, применяемую для заполнения разрывов в данных, таким образом например, обработкой данных многих сотен наземных метеостанций получают растры климатических переменных (например, среднегодовых температур или индекса влажности).

4) Пространственное моделирование (в узком смысле) иногда считают отдельным видом пространственного анализа, относя к нему причинно-следственный (например - регрессионный анализ) и так называемую пространственную эконометрику [Grekousis, 2020].

Все виды пространственного анализа имеют дело с пространственными данными. В свою очередь, пространственные данные относятся к пространственным объектам, которые обладают геометрическими параметрами и пространственной привязкой, но которые также могут характеризоваться и другими непространственными атрибутами [Bivand et al., 2008, p. 7]. Например, мы можем описать сельскую местность по целому спектру данных, характеризующих землепользование, социальную инфраструктуру и экологическую ситуацию, включив в разрабатываемую модель данные о локализации и планировочной структуре населенных пунктов, структуре сельскохозяйственных угодий, конфигурации дорожной сети, размещению социальных объектов (дошкольных учреждений, школ и больниц), локализации пожарных депо, контейнерных площадок для ТБО, сохраняющихся природных ландшафтах, и так далее. Когда эти данные связаны с местоположением с помощью пространственных атрибутов (координат, адресной системы), мы получаем пространственные данные с которыми можно оперировать различным образом - в зависимости от изучаемой проблемы.

Представление объектов в рамках геоинформационного моделирования достигается комбинированием данных двух типов: векторных геометрических примитивов с "подшитыми" атрибутами и так называемых полей - непрерывных мозаик растровых данных. Геометрические примитивы включают точки, полилинии и полигоны, за которыми в разных масштабах могут закрепляться разные семантики. Так точка может отображать отдельное дерево в модели крупного масштаба, биогруппу - в модели среднего масштаба или островной массив леса в мелкомасштабной модели. Точно также полигон может соответствовать отдельному строению, кварталу или целому населенному пункту. Поля (fields) презентуют объекты и явления как поверхность с непрерывно меняющимися свойствами: таковы поверхности рельефа (ЦМР), климатические характеристики или растры так называемых ландшафтных метрик.

Атрибуты или переменные - это взаимозаменяемые термины, обозначающие любую характеристику, которой может обладать тот или иной объект (например площадь, высота, уровень содержания гумуса в почве и т.д.). Конкретное выражение переменной принято называть значением.


1.2. "Что", "Где" и "Почему" - три этапа геопространственного моделирования

В руководствах по использованию пакета ArcGIS, разработанных известной американской компанией ESRI, традиционно предлагается рассматривать процесс пространственного анализа как рабочую последовательность, включающую постановку вопросов "What|Что", "Where|Где" и "Why-How|Почему". Этой последовательности соответствуют три раздела пространственной статистики: Descriptive Statistics|Дескриптивная Статистика, Exploratory Spatial Data Analysis|Исследовательский Анализ Пространственных Данных и, собственно, Inferential Statistics and Spatial Statistics|Выводная Статистика и Пространственное Моделирование. "Рабочей" эту последовательность делает простое обстоятельство невозможности приступить к последующему разделу не пройдя предыдущего.

На вопрос "Что?" можно получить ответ с использованием методов дескриптивной (описательной) статистики (Таблица 1.1), которая позволяет охарактеризовать данные, выявить характер распределения данных (нормальное, экспоненциальное, "паретианское"), обнаружить выбивающиеся значения (выбросы). Дескриптивная статистика использует карты (векторные и растровые слои ГИС) (Рис. 1.3), таблицы, графики, простые статистические процедуры для обобщения конкретной выборки (допустим - мест совершения преступлений в границах городского района), по этой причине ее результаты не являются репрезентативными для характеристики более обширного множества (преступлений в границах всего мегаполиса).


Рис. 1.3 Места ("точки") совершения преступлений в Нью-Йорке в кварталах Куинса за 2021 г. как пример отображения явления в рамках дескриптивной статистики


Таблица 1.1 ГИС-инструментарий дескриптивного анализа, задачи и использование

ЗАДАЧА ИНСТРУМЕНТЫ СОДЕРЖАНИЕ
Презентация слоя данных в ГИС Применение символов масштабирования и типологического различения объектов Выбор варианта оформления переменной\признака в соответствии с гипотезой модели, наличным набором данных и оформлением других переменных (как векторных, так и растровых)
Характеристика распределения данных, расчет Z-балла Фоновая картограммы (хороплет),
Гистограммы,
Основные статистические данные (асимметрия, эксцесс и др.),
Диаграммы размаха,
QQ-графики
Выявление мест с высоким или низким значением переменной (например уровня преступности или уровня заболеваемости);
Определение нормальности, искаженности либо ненормальности распределения;
Выявление выбросов значений
Анализ набора переменных на наличие попарной корреляции Точечные диаграммы,
Матрицы точечных диаграмм
Выявление наличия\отсутствия и определение знака (продолжительная\отрицательная) линейной связи между переменными;

Исследовательский анализ пространственных данных|Exploratory Spatial Data Analysis - ESDA применяется для изучения и картографирования данных, обнаружения выбросов, проверки базовых предположений или выявления тенденций и ассоциаций между ними, таких как наличие пространственной автокорреляции или пространственной кластеризации (Таблица 1.2). На этом этапе мы в основном отвечаем на вопрос "где?", выявляя, например, где располагаются ареалы с загрязненными почвами, или определяя где находятся районы с низкими/высокими значениями дохода, оценивая существует ли какая-либо пространственная кластеризация в распределении дохода по домохозяйствам, или анализируя где находятся "горячие точки" преступности в городе (Рис. 1.4).


Рис. 1.4 Анализ переменной Point Density|Плотность Точек совершений убийств за 15 лет в Нью-Йорке позволяет выявить своего рода - ареалы концентрации тяжелых преступлений
Таблица 1.2 ГИС-инструментарий исследовательского (ESDA) анализа, задачи и использование
ЗАДАЧА ИНСТРУМЕНТЫ СОДЕРЖАНИЕ
1 Анализ географического распределения объектов и событий Средний центр,
Медианный центр,
Стандартное расстояние,
Стандартный отклоняющийся эллипс
Выявление центральных местоположений для множества объектов;
Определение вектора (пространственного тренда) явлений и феноменов
2 Анализ точечного паттерна Среднее Ближайшее соседство,
K-Рипли статистика
Выявление случайного, рассеянного или кластерного характера пространственного распределения объектов;
Определение дистанции дисперсии или кластеризации
3 Создание карт плотности распределения множества объектов или явлений Плотность ядер,
Плотность точек
Выявление ареалов высокой и низкой плотности (концентрации) объектов и явлений
4 Выявление значений локальных выбросов в данных Признак в точки,
Ближайший объект (Near)
Выявление значений и пространственной локализации выбросов;
Удаление выбросов
5 Выявление пространственной автокорреляции переменных Матрица пространственных весов,
Пошаговая пространственная автокорреляция,
Пространственная автокорреляция (Глобальный индекс Морана I),
Анализ кластеров и выбросов (Anselin, Локальный индекс Морана I)
Концептуализация пространства посредством создания матрицы пространственных весов;
Выявление кластеров высоких и\или низких значений переменной в пространстве;
Определение горячих или холодных точек;
Оптимизированный анализ горячих точек;
Определение масштаба анализа
6 Мультифакторная (многомерная) кластеризация данных Анализ группирования,
Кластеризация k-средних
Определение кластеров (типологическое районирование) или индивидуальных районов (регионализация) в зависимости от условий соседства и определения расстояний
7 Анализ сходства Поиск сходства Поиск объектов аналогичных целевому, в качестве альтернативного потенциального местоположения

На последнем этапе мы пытаемся ответить на вопросы "почему?" или "как?" для объяснения и понимания причин и следствий с помощью моделей так называемой Explanatory Statistical Analysis - ESA|Объяснительной Статистики. В контексте объясняющего, или, употребляя более привычные в отечественной практике термины - причинно-следственного анализа - мы рассматриваем переменные как независимые или зависимые. Зависимая переменная (или эффект) - это явление/состояние/переменная, которую мы пытаемся объяснить. Например - почему события преступности сконцентрированы в определенной области, и как эта аномалия связана с уровнем дохода на душу населения, стоимостью домов, этническим\расовым составом населения, образованием и уровнем безработицы среди мужчин трудоспособного возраста.

Другой весьма распространенный пример зависимой переменной причинно-следственного анализа - заболеваемость, которую мы пытаемся объяснить такими факторами как загрязнение воздушного бассейна города промышленными выбросами, напряженность транспортного трафика, качество воды, используемой для водозабора и сохранность зеленой инфраструктуры. Устанавливаемые таким образом в регрессионных моделях связи-соотношения выявляют степень влияния фактора (независимой переменной модели) на эффект - зависимую переменную (Таблица 1.3). Такого рода модели помимо того, что они создают новые знания, обычно используются для предсказания и прогноза, и, следовательно, могут рассматриваться и как инструменты планирования. Например, если установлена связь между уровнем подтопления городских кварталов во время экстремальных осадков и площадью незапечатанных и озелененных территорий, то эта зависимость может быть использована для разработки стратегии "голубой инфраструктуры" города и проектирования дополнительных дренажных систем.


Таблица 1.3 ГИС-инструментарий "объяснительного" (ESA) анализа, задачи и использование

ЗАДАЧА ИНСТРУМЕНТЫ СОДЕРЖАНИЕ
Моделирование отношений Исследовательская регрессия,
Метод наименьших квадратов (OLS)
Моделирование зависимой переменной на основе набора факторов
Моделирование отношений с учетом веса географических факторов Географически взвешенная регрессия Моделирование зависимой переменной на основе набора факторов с учетом географической неоднородности пространства


1.3 Концептуализация пространственных отношений: дистанция, смежность, взаимодействие

География не могла бы претендовать на "звание" науки, если бы ее предметом не были пространственные отношения. Соответственно и географический (пространственный) анализ ничем не отличался бы от обычного статистического анализа, если бы в его основе не лежали простые (на первый взгляд) представления о расстоянии, и связанные с ними понятия "близко", "далеко", "рядом", "по соседству".

"Первый закон географии Тоблера (TFL)" был введен в географическую литературу в статье, которую Уолдо Тоблер опубликовал в журнале "Экономическая география" в 1970 году [Tobler, 1970]. В этой статье, описывающей моделирование роста численности населения в Детройте, Тоблер заявил, что для того, чтобы его модель заработала, он "применит первый закон географии: все связано со всем остальным, но близкие вещи связаны более, чем отдаленные". С тех пор это утверждение неоднократно подвергалось сомнению и критике (см. например [Waters, 2018], особенно в процессе разработки различных способов определения самого понятия близость, а также каких понятий как "похожесть", "соседство" и "взаимосвязь" для программных продуктов пространственного анализа, таких как GeoDa, пакета R-статистики и, наконец, ArcMAP10.x.

Однако, так или иначе, места не изолированы друг от друга. Экологические и физико-географические, социальные и экономические взаимодействия разворачиваются в пространстве и происходят между соседними или отдаленными положениями, следовательно сами эти взаимодействия/отношения имеют пространственное измерение. Когда мы применяем методы анализа пространственных данных, мы должны прозрачным образом и точно определить, насколько близок "близкой объект", как идентифицируется "смежность", каков размер окрестности и как мы можем интегрировать состояние объекта в моделях, включающих структуру. Это означает, что мы должны установить ряд географических параметров для определения пространственных отношений - совокупность которых принято называть концептуализацией географического пространства [Anselin, 2010].

Важнейшим свойством концептуализированного пространства является его масштабируемость. На самом простом уровне масштаб сцены моделирования определяет тип презентации объекта. Так река в мелком масштабе может быть отображена полилинией, в более крупном полигоном, стороны которого совпадают с урезом воды, а внутренняя площадь - с акваторией. Аналогично любой город на карте мира отображается точкой, но на карте региона город будет выглядеть как обширный полигон, разбивающийся на административные районы и полигоны наполняющих их кварталов.

Однако существует и более сложный эффект, связанный с масштабируемостью географического пространства. Применяя более обобщенный масштаб для отображения объектов или явлений, мы можем потерять внутреннюю неоднородность, обнаруживаемую на локальном масштабе. Такие утраты неизбежны и соответствуют классическим закономерностям генерализации в традиционной бумажной картографии: изображая гидрографическую сеть в мелком масштабе картографы "жертвуют" притоками низких порядков, и на итоговой карте мы наблюдаем только главные речные стволы. Однако такое решение приводит к странным эффектам, если информация одного слоя (слоя источника) подвергается обобщению по матрице, используемого в качестве операционно-территориальных единиц другого слоя, например, когда мы изучаем загрязнение, заболеваемость, доходы или преступность в рамках сетки административно-территориального деления.

Эффект подобного рода искажений получил название "Modifiable Areal Unit Problem MAUP)", что можно перевести как Проблема Меняющейся Размерности Операционно-территориальной Единицы". "Каноническим" примером MAUP являются президентские выборы в США 2000 года, в которых Эл Гор получил больше голосов, чем Джордж Буш, но проиграл выборы из-за сетки избирательных округов внутри каждого штата [O’Sullivan, Unwin, 2010, p. 38]. Иная размерность сетки могла бы привести к другому результату.

MAUP относится как к масштабу анализа, так и к агрегированию данных. Как правило, при использовании крупных территориальных единиц, мы агрегируем данные на более высоком уровне, чтобы обобщение было более очевидным, автоматически делая агрегированные значения, как правило, больше похожими на общее среднее (глобальное среднее), тем самым отклоняясь от медианных значений и делая выбросы значений менее заметными.


Рис. 1.5 Пример влияния сетки ОТЕ на представление и характер распределения данных: картограммы численности населения Нью-Йорка: a) по кварталам|tracts, b) по микрорайонам|neighborhood (7 классов, "геометрические интервалы")

На двух картограммах численности населения Нью-Йорка (Рис. 1.5) обобщенной по двум разным сеткам операционно-территориальных единиц (ОТЕ): кварталам (tracts) и микрорайонам (Neighborhood) можно видеть, как выраженный кластерный характер плотности заметно искажается на уровне "соседств" за счет, во-первых, включения в оценку кварталов с резко различной плотностью, во вторых, по причине учета на верхнем уровне ненаселенных (парковых, общественно-деловых и коммерческих) территорий.

Пространственная неоднородность как разница между значениями набора наблюдений внутри исследуемой области - другое свойство концептуализации пространства. Неоднородны любые географические данные - от биоклиматических показателей (температура, осадки) до поверхности "дневного" рельефа, от уровня заболеваемости до уровня доходов, при этом переходы значений могут быть как постепенными, так и резкими. Неоднородность пространства обостряет обычную задачу статистики - задачу выборки данных и, следовательно, интерпретацию результатов моделирования. Так например, мы можем получить в модели кластеры с аномально высокими показателями онкологической заболеваемости, но может оказаться, что выделенные кластеры связаны со значительной концентрацией и плотностью населения, т.е., поле одного из факторов модели само по себе обнаруживает неоднородность, и следовательно мы не можем делать какие-либо выводы об экологических факторах, которые (потенциально) могли бы выступать в роли причин данной аномалии.

Во многих случаях пространственную зависимость нелегко отличить от пространственной неоднородности: этот эффект Л. Анселин назвал invers problem [Anselin, 2010], что приблизительно можно перевести как "обратная задача". В географическом пространстве корреляция или ковариация между переменными в разных местах определяется расположением объектов. Другими словами, обнаруживая пространственные структуры (паттерны) изучаемого явления (например, заболеваемости) мы не можем сразу утверждать что они присущи именно этому явлению, а не являются результатом неоднородности вовлеченных в анализ факторов, имеющих собственную мозаику пространственного распределения.

Другая проблема пространственного анализа, так называемая Проблема краевых эффектов связана с выбором сцены моделирования: модели редко охватывают весь земной шар (хотя и такие существуют). Конфигурируя сцену в соответствии с задачами модели мы невольно создаем края (например краевые пиксели Цифровой Модели Рельефа), которые не имеют соседей со всех сторон, это обстоятельство может создавать искажения, например в задаче определения направления стока и моделирования эрозионно-речной сети.

Ecological Fallacy|Экологическое заблуждение - ошибка которая возникает когда предполагается, что связь, статистически значимая на одном уровне анализа, сохраняется и на более детальном уровне и когда используются агрегированные данные верхнего уровня для моделирования ситуации на более локальном. Данные о преобладании типов лесорастительных условий на уровне лесного квартала не могут быть использованы для типов леса по лесным выделам, хотя подобный соблазн может возникнуть, например в задачах интерполяции для заполнения недостающих данных. Одна из причин Ecological Fallacy - принципиально различный характер пространственного распределения одних и тех же объектов на разных масштабных уровнях и даже просто в разных ареалах на одном и том же уровне.

Существуют различные методы концептуализации пространственных отношений, каждый из которых позволяет лучше смоделировать внутреннюю структуру пространственного набора данных с точки зрения пространственной смежности и формирования окрестностей. Общепринятыми являются следующие три.

А. Расстояние - позволяет определить пороговое (критическое) значение расстояния или так называемую функцию расстояния, для характеристики этого фактора используются:
Тип расстояния - связано со способом его расчета (например, Евклидово, Манхэттенской, Минковского, Сетевое расстояние),
Фиксированный диапазон расстоянийпорог расстояния, критическим образом меняющий зависимость феномена от дистанции в ту или иную сторону (ослабление, усиление),
Прекращение влияния (decay) расстояния значение, за пределами которого расстояние не играет какой- либо роли.
B. Смежность - определяет условия смежности:
  • Смежность ребер полигонов(случай Ладьи),
  • Смежность углов (узлов) полигонов (случай Королевы),
  • Смежность более высокого порядка,
  • Смежность взаимодействия, включающее и расстояние и соседство.
  • C. Окрестности - определяет условия соседства:
  • k-ближайшие соседи,
  • Полигоны близости,
  • Триангуляция Делоне.
  • D. Пространственно-временные отношения - определяют пространственный охват и интервалы времени для модели

    В разных моделях используются разные пространственные отношения: для исследования пассажиропотоков наземного транспорта в большом городе используют манхеттенское расстояние, поскольку уличная сеть состоит из параллельных и поперечных отрезков; при изучении влияния эффекта "опушки" - уменьшения фактора тревожности для фауны птиц в лесном массиве решающее значение приобретает обычная прямая дистанция; функция decay полезна для исследования влияния лесополосы на микроклимат сельскохозяйственных угодий.

    Концепция Distance Decay, пожалуй, наиболее интересна для ГИС-моделирования, ибо она позволяет учесть изменение силы влияния фактора расстояния для разных переменных и явлений. Интуитивно мы склонны приписывать непрерывное, плавно ослабляющееся влияние расстояния на значения атрибутов соседних пространственных объектов; таково, например, воздействие водохранилища на водно-воздушный режим почв в прибрежном лесном массиве. В действительности связь между фактором и расстоянием может быть более сложной, например, нелинейной или экспоненциальной. Кроме того, функция расстояния может иметь пороговое значение, после которого влияние расстояния уже не меняется. Еще один вариант, когда функции свойственно "плато" - дистанция, в пределах которой значения не меняются, а за границей - начинают уменьшаться (так выглядит функция уровня шума для железной дороги с шумоподавляющим экраном, выставленном на некотором расстоянии от полотна).

    Понятие смежности важно, например, в процедурах группирования, кластеризации и районирования. Определяя условия граничности (т.е., выставляя условие, что полигоны принадлежащие к одному класс должны иметь общее ребро и\или угол) мы можем формировать так называемые индивидуальные районы. Отказываясь от этих условий, мы получим результат, который ближе к типологическому районированию, когда отдельный район, принадлежащий к тому или иному типу, может быть представлен единственным изолированным полигоном. Следует иметь ввиду, что условия смежности неплохо "работают" в сценах с приблизительно равновеликими полигонами (например - городскими кварталами), но если перед нами очень разные по площади сущности (скажем, лесные массивы разной размерности, или страны разной величины), то необходимы более сложные способы.

    Итак, то, каким именно образом мы концептуализируем (трактуем, интерпретируем) пространство в значительной степени определяет корректность и содержательность любого ГИС-моделирования. В одном из ранних (но отнюдь не устаревших!) изданий, посвященных философии и методологии ГИС-моделирования С.Опеншоу и Г. Кларк описывают (с изрядной долей юмора) следующую коллизию. "Различия отражают дифференциацию в изучаемом явлении, а также в выборе регионов исследования и способов возможного взаимодействия между ними - последствия этих обстоятельств казалось бы очевидны, тем не менее, их часто полностью игнорируют. Например, если вы хотите выявить распределение пабов в Лидсе по статистике "ближайшего соседства", то результаты зависят от определения границ Лидса и выбранного ареала. На севере это может быть пространственно равномерное (дисперсное) распределение, на юге оно может оказаться случайным, а в центре города - кластерным, причем в каждом ареале будут свои причины именно такого распределения. Результат же для всего Лидса усредняет все эти различия и почти наверняка будет бессмысленным..." [Openshaw, Clark, 2005, p.31] Эффект такого рода моделей авторы номинировали как Statistical geographic hangovers|Похмелье геопространственной статистики. Чтобы не страдать от последствий подобного "похмелья" необходимо ясно и четко, еще до этапа моделирования, представить характер исследуемого пространства.