Исследовательский анализ данных на наборе данных осевого возраста Сешат

"90% of the data ever created was created in the last two years."

Эта цитата из Петтера Бэ Брандтцога, сколь бы пугающей она ни была, выдает еще более пугающее наблюдение: У нас в десять раз меньше данных, записанных за последние 2,8 миллиона лет истории человечества, чем за 2016-2018 годы. Учитывая эту предполагаемую экспоненциальную скорость роста данных с начала компьютерной эры, у нас на 10 ^ 15 меньше данных, записанных с начала истории до падения Берлинской стены, чем у нас. за последние 30 лет. Если мы посмотрим на то, что было до изобретения современной статистики в середине 1600-х годов, объем данных, которые мы можем проанализировать, ничтожен. Если мы обратимся к книге Судный день 1086 года, она станет совершенно удручающей.

К счастью, ничто не мешает современным историкам и ученым создавать новые данные о прошлом. Из оцифрованных фотографий и текста, документации об археологических раскопках и даже собранных краудсорсингом агрегатов академического консенсуса относительно исторических периодов историки (и любители, подобные мне) могут создавать и исследовать наборы данных, используя передовые аналитические инструменты для рисования новое понимание прошлого и помощь в ответах на такие вопросы, как:

  • Какие социально-политические нормы развивались с течением времени в разных обществах Средиземноморья и Азии по сравнению друг с другом?
  • Какие из этих норм с наибольшей или наименьшей вероятностью соблюдались в одном месте и в одно и то же время?
  • Каковы некоторые из различных траекторий связанных норм, по которым развивались одни группы обществ, но не другие?

Данные

Для этого анализа я использую относительно небольшой набор данных Осевой возраст от Seshat, большой международной многопрофильной группы ученых-эволюционистов, историков, антропологов, археологов, экономистов и других социологов. Общедоступный набор данных отслеживает различные социально-политические нормы и их развитие в ключевых регионах Афроевразии. Конкретные баллы для каждой социально-политической нормы для каждой даты (варьирующиеся промежутки времени между 5300 г. до н.э. и 1800 г. н.э. с шагом 100 лет) в пределах 10 NGA (естественная географическая область) были согласованы группой экспертов и включены в набор данных.

Но сначала блок информации, который Сешат просит меня включить в обмен на использование их набора данных:

 This research employed data from the Seshat Databank (seshatdatabank.info) under Creative Commons Attribution Non-Commercial (CC By-NC SA) licensing.Turchin P. et al. 2015. “Seshat: The Global History Databank.” Cliodynamics 6(1): 77–107Mullins, D., Hoyer, D. et al. 2018. “A Systematic Assessment of ‘Axial Age’ Proposals Using Global Comparative Historical Evidence.” American Sociological Review 83(3): 596–626

К сожалению, периоды времени, охватываемые для каждого NGA в наборе данных, различаются, начиная с 5300 г. до н.э. и вплоть до 200 г. н.э. И не все они заканчиваются одновременно:

Более того, общества, похоже, со временем накапливают культурные особенности, а не имеют атрибуты, которые появляются и исчезают равномерно, что также может усложнить наш анализ по количественным причинам, которые я здесь не буду вдаваться.

Тем не менее, в данных достаточно разброса, чтобы ответить на три наших вопроса. Итак, без лишних слов…

Вопрос 1. Какие социально-политические нормы развивались с течением времени в разных обществах Средиземноморья и Азии по сравнению друг с другом?

За исключением Камбоджи и равнины Качи соответственно, средние оценки в наборе данных для моралистических наказаний и веры во всеведущие сверхъестественные существа были сильной стороной в классическом мире, но не в обществах Южной и Восточной Азии.

Нормы морали и, в меньшей степени, продвижение просоциальности, вера в то, что правители не были богами, формальный правовой кодекс, общая применимость закона, ограничения на исполнительную власть и штатные бюрократы были чертами, общими для всех НГА, кроме Кансайского, возможно из-за большого количества нулевых значений (по сути, пустых ячеек) в наборе данных для этого NGA (я до сих пор не уверен, почему они включили 5000 лет нулей и пустых ячеек для Кансая).

Галилея, равнина Качи, равнина Конья, Сусиана, Верхний Египет и, в меньшей степени, Крит, все из которых, за исключением Крита, подпадали под исламское правление к современному периоду, получили значительно более высокие оценки при приравнивании правителей и простых людей к элите.

Ограничения на исполнительную власть и импичмент, по-видимому, являются заметно римскими чертами: Лациум впереди всех с большим отрывом, за ним следуют районы Крита, Галилеи, Верхний Египет и Конья, бывшие под властью римлян, хотя долина Желтой реки это сделала. импичмент чуть больше, чем в Верхнем Египте. Это перевернулось с точки зрения штатных бюрократов. За исключением Кансая по причинам, упомянутым ранее, в каждой NGA есть гораздо больше штатных бюрократов, чем в Лацио.

Чтобы преодолеть проблемы, вызванные нулевыми значениями, как в случае с Kansai, я также построил относительный профиль соответствующих функций для каждого NGA:

Камбоджийский бассейн со временем характеризовался продвижением группы над собой и формализованной, обычно применяемой правовой структурой, в рамках которой действовала продвинутая бюрократия. Неравенство, похоже, было высоким, при ограниченных проверках властных структур.

Крит также характеризовался всеобъемлющими и формализованными законами, хотя индивидуальные блага пользовались большим спросом, чем в Камбодже. Было большое расхождение в восприятии ценности правителей и простолюдинов, хотя в некоторых случаях правители могли быть смещены. Иногда также существовала некоторая вера во всеведущего бога.

В Галилее опять-таки была хорошо структурированная правовая база, обычно применяемая и бюрократизированная, но с гораздо большим упором на групповое добро и моралистическое наказание. Равенство поощрялось сильнее, руководители были более ограничены, а правители с меньшей вероятностью считались богами, поскольку вера во всеведущее сверхъестественное существо была широко распространена. Тем не менее, когда правители приходили к власти, их редко можно было смещать институциональными средствами.

На равнине Качи общество было относительно маловероятно, чтобы наказать вас по моральным, а не по юридическим причинам, хотя давление, чтобы придерживаться общественных моральных норм было чрезвычайно высоким. Правители, элиты и простолюдины имели в глазах общества удивительно равную внутреннюю ценность, хотя законы были немного взаимозаменяемыми.

В Кансай было велико социальное давление, чтобы соответствовать требованиям, что наряду с формализованным и широко применяемым правовым кодексом и сильной бюрократией, вероятно, означало, что люди в целом знали, чего от них ждут в обществе. Хотя элиты и простолюдины были относительно равны, правителем был Бог.

Профиль равнины Конья был очень похож на Галилею, с некоторым верховенством закона, упором на групповое благо, умеренным равенством, ограниченным исполнителем и верой в то, что правители не были божественными, наряду с верой во Всеведущее сверхъестественное существо. Однако моралистические наказания были менее распространены, чем в Галилее.

Лацио олицетворяет верховенство закона, где формальные правовые кодексы предпочитают моралистическому наказанию, ограничения на исполнительную власть и даже сильную традицию импичмента. Правители не были божественными, и была широко распространена вера во всеведущее сверхъестественное существо. Однако неравенство было безудержным, и простые люди, как правило, не считались обществом столь же ценными, как элиты или правители.

Подобно Камбодже и Кансай, долина Средней Желтой реки является примером сочетания просоциальных норм, прочной правовой базы и бюрократии. Однако правители часто не считались божествами, и иногда их можно было ограничивать институционально. Социальное расслоение также могло быть выше в долине Хуанхэ, чем в Кансай, поскольку элиты меньше приравнивались к простолюдинам.

Хотя в Сузиане были сильные просоциальные и моральные нормы, формальный правовой кодекс и армия бюрократов, законы, похоже, применялись менее широко. Руководители были умеренно ограничены, а социальное расслоение было относительно низким.

В Египте морализаторские нормы имели большое значение, хотя существовала формализованная и общая правовая база. Была сильная бюрократия, и равенство между элитами и простыми людьми было относительно высоким. Хотя правители временами считались божествами, они могли быть жестко ограничены институциональными ограничениями.

Ух! Итак, теперь, когда у нас есть самый длинный и самый сложный вопрос, давайте перейдем к ...

Вопрос 2: Какие из этих норм с наибольшей и наименьшей вероятностью соблюдались в одном месте и в одно и то же время?

Чтобы ответить на этот вопрос, я составил матрицу корреляции соответствующих функций. Как и следовало ожидать от набора данных, в котором функции имеют тенденцию накапливаться с течением времени, корреляции искажаются положительно.

Формальный правовой кодекс, продвижение просоциальности и общая применимость права, скорее всего, наблюдались вместе, при наличии прочных позитивных взаимоотношений. Обычно применяемый формальный правовой кодекс является поощрением просоциальности и стимулом «играть по правилам», так что это имеет смысл. Импичмент был наименее вероятной особенностью, которая могла возникнуть одновременно с уравниванием элит и простолюдинов и уравниванием правителей и простых людей, у каждого из которых были умеренно негативные отношения. Импичмент также отрицательно, хотя и гораздо слабее, коррелировал с наличием штатных бюрократов. Кажется, что сильная бюрократия и относительное социальное равенство частично устранили необходимость ограничивать исполнительную власть, которая была далека от всесильности и нуждалась в легитимности и сотрудничестве со стороны других, чтобы править. Наименее коррелированными чертами были импичмент и всеведущее сверхъестественное существо, продвижение просоциальности и моралистическое наказание, что означает, что последние три действительно никак не коррелировали с присутствием или отсутствием первого.

Это подводит нас к:

Вопрос 3: Каковы некоторые из различных траекторий связанных норм, по которым развивались одни группы обществ, но не другие?

Выполняя так называемый анализ основных компонентов данных с помощью кода, вольно основанного на предыдущем проекте, который я выполнял для Udacity Инженер по машинному обучению Nanodegree, я смог выделить три независимых культурных профиля, которым общества в данных либо соответствуют, либо не в той или иной степени, или на техническом жаргоне, не сворачивал измерения в три измерения, которые лучше всего объясняли расхождения в данных. Первое измерение, объясняющее 48% дисперсии данных с течением времени, было чем-то вроде ненужного и действительно просто показало, что NGA имеют тенденцию накапливать все больше и больше характеристик с течением времени. Однако более интересными были следующие два измерения, отражающие 14% и 10% дисперсии в наборе данных соответственно. Общества второго измерения характеризовались умеренным отсутствием веры во всеведущее существо и твердой верой в то, что правители не божественны и могут быть ограничены институционально. Социальное расслоение было высоким, бюрократия была слабой, хотя существовала прочная правовая база. Это измерение, вероятно, будет знакомо многим классицистам как классическая древнегреческая политическая философия. Напротив, общества третьего измерения характеризовались строгими морализаторскими нормами и просоциальностью. Вера во всеведущего бога была низкой, но вера в божественных правителей была высокой, а правители пользовались большим уважением, чем простолюдины, относительно непринужденными и безупречными. Была очень сильная бюрократия и очень сложная правовая база. Это измерение также звучит очень знакомо азиатам как конфуцианская политическая философия. Обозначение этих двух философий как отдельных измерений означает, что они не исключают друг друга, поэтому разные общества могут отображать сочетание характеристик одного, обоих или ни одного из измерений (т. Е. На общество могут влиять оба Греческая и конфуцианская политические идеи одновременно. Или только одна. Или ни то, ни другое!).

Оценка и развертывание

Хотя данные несколько проблематичны по своей субъективности, краткости, разным временным рамкам и всем этим чертовски пропущенным значениям, набор данных Seshat Axial Age действительно демонстрирует нашу способность создавать новые данные о прошлом, чтобы рисовать новые идеи, которые могут привести к новым теориям о прошлом, включая выводы из вопроса 2 о том, что законы и просоциальность имеют тенденцию появляться вместе, а бюрократия и социальное равенство, как правило, проявляются отдельно от импичмента или выводов из вопроса 3 о том, что классические греческие и конфуцианские социально-политические модели могут рассматриваться как независимые измерения, по которым развивались средиземноморские и азиатские общества, иногда одновременно и синкретически. . Коллективный характер сбора набора данных придает большую объективную легитимность и может и должен быть воспроизведен для создания более крупных наборов данных по другим историческим темам, для которых у нас недостаточно количественных данных. та.

Что касается этого анализа, результаты, полученные на основе данных об истории, данных, которые ранее не существовали, могут направить будущие исследования в направлениях, которые ранее не исследовались. Я приветствую читателей, чтобы они подтвердили или оспорили идеи, изложенные в этой статье, и расширили границы применимости науки о данных до эпохи до информации!

Ссылка на репозиторий GitHub, чтобы увидеть код этого проекта