ПРИЛОЖЕНИЕ 3 МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ МОДЕЛИ РАСПРЕДЕЛЕНИЯ ИМЕН В ДЛИННЫХ ИСТОРИЧЕСКИХ ХРОНИКАХ ПРЕДИСЛОВИЕ Эта работа посвящена проблеме распознавания глобальных зависимостей в больших совокупностях исторических текстов. В настоящем Приложении ссылки даются на отдельный список литературы в конце Приложения. Проблема была сформулирована А. Т. Фоменко в [5epr3-1] [5epr3--5] в связи с математико-статистическим анализом и проверкой принятой сегодня глобальной хронологии древности и средневековья. Развитые А. Т. Фоменко и его соавторами концепции и методы, предназначенные для решения проблемы, могут применяться и в других отраслях знаний ── например, в генетике и задачах распознавания образов. Практика показала, что эти методы успешно работают при анализе зависимостей самой разной природы. Однако в данной работе мы рассматриваем лишь приложения к хронологии и истории древности. Для математиков особый интерес представляет то обстоятельство, что здесь возникают совершенно новые и очень интересные математические задачи. Одна из наших целей ── привлечь внимание математиков к возможности использования методов математической статистики в нетрадиционных ситуациях гуманитарных наук. Основы теории и истории вопроса читатель может найти в монографии А. Т. Фоменко [5epr3-18]. При работе с историческими текстами под ЗАВИСИМОСТЬЮ, как правило, понимается ЗАВИСИМОСТЬ ОТ ОБЩЕГО ИСТОЧНИКА. Таким первоисточником, вообще говоря, не обязательно должен являться общий письменный источник (протограф). Это может быть одна и та же совокупность событий, описываемых в текстах с разных позиций, общие традиции школы, единый стиль и т. п. Главными задачами, которые мы здесь изучаем, таковы: 1) ВЫЯВИТЬ СРЕДИ БОЛЬШОГО ЧИСЛА РАЗЛИЧНЫХ ИСТОРИЧЕСКИХ ХРОНИК ЗАВИСИМЫЕ И НЕЗАВИСИМЫЕ ХРОНИКИ; 2) ДАТИРОВАТЬ СОБЫТИЯ, ОПИСАННЫЕ В ДРЕВНИХ ТЕКСТАХ, ОПИРАЯСЬ ЛИШЬ НА СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЭТИХ ТЕКСТОВ; 3) ПО ВОЗМОЖНОСТИ СОЗДАТЬ НА ЭТОЙ ОСНОВЕ ДОСТОВЕРНУЮ <<МАТЕМАТИКО-СТАТИСТИЧЕСКУЮ ХРОНОЛОГИЮ>> ДРЕВНОСТИ И СРЕДНЕВЕКОВЬЯ. Мы употребляем термин <<зависимость>> в широком смысле. Он долен уточняться на стадии содержательной интерпретации получающихся формальных отождествлений. Это следует иметь в виду при обсуждении наших результатов. Для решения проблемы распознавания зависимых исторических текстов А. Т. Фоменко в 1976-1985 гг. было предложено несколько различных концепций и соответствующих им эмпирико-статистических методик [5epr3-1]-[5epr3-9]. Результаты, полученные этими методиками, согласуются между собой, и позволили построить глобальную хронологическую карту (ГХК), отражающую распределение обнаруженных зависимостей статистического характера в совокупности доступных нам сегодня исторических текстов, описывающих древнюю и средневековую историю Европы, Средиземноморья, Египта, Ближнего Востока [5epr3-6], [5epr3-7]. Первоначальным толчком к этим исследованиям послужили высказанные в разное время крупными учеными обоснованные сомнения в правильности принятой сегодня хронологической версии древности. Здесь в первую очередь нужно назвать И. Ньютона, Н. А. Морозова, Э. Джонсона, Р. Ньютона, Т. Моммзена (см. подробности в [5epr3-18]). Новый основной вывод, который следует из анализа ГХК, состоит в следующем [5epr3-6], [5epr3-7], [5pr3-18]. ОБЩЕПРИЗНАННАЯ СЕГОДНЯ ГЛОБАЛЬНАЯ ХРОНОЛОГИЯ ДРЕВНОСТИ И СРЕДНЕВЕКОВЬЯ, ПО ВСЕЙ ВИДИМОСТИ, НЕВЕРНА. ЧТОБЫ ИСПРАВИТЬ ЕЕ, ПРИДЕТСЯ ПРОВЕСТИ НЕСКОЛЬКО КРУПНЫХ СЕРИЙ ОТОЖДЕСТВЛЕНИЙ И СДВИГОВ СОБЫТИЙ, В РЕЗУЛЬТАТЕ КОТОРЫХ ЭТА ХРОНОЛОГИЯ СУЩЕСТВЕННО УКОРОТИТСЯ. ПОДАВЛЯЮЩЕЕ БОЛЬШИНСТВО ИЗВЕСТНЫХ НАМ СЕГОДНЯ СОБЫТИЙ ПРОШЛОГО ПРИДЕТСЯ ОТНЕСТИ КО ВРЕМЕНИ ПОСЛЕ 900 Г. Н. Э. В настоящем Приложении дается краткий обзор и излагаются новые результаты, полученные авторами за последнее время. При этом, здесь рассматривается лишь одна группа методик, предназначенных для анализа хронологии. Это ── методы распознавания зависимостей. Они основаны на статистическом анализе закономерностей распределения собственных имен персонажей в исторических текстах. Методики этого типа были впервые предложены А. Т. Фоменко в [5epr3-6] и в их основе лежит фундаментальный ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ, сформулированный им в [5epr3-5], [5epr3-6]. Дальнейшее развитие эти методики получили в работах авторов [5epr3-10], [5epr3-11]. Применение методов этой группы к реальным историческим данным оказалось достаточно эффективным. В частности, с их помощью удалось детально проанализировать древнюю хронологию указанных выше регионов и обнаружить в ней повторы (дубликаты). Затем были вычислены характерные временны'е сдвиги между дубликатами. Более того, наши методы позволяют конкретно указать, ── какие именно хронологические эпохи повторяют (дублируют) друг друга. Этим методам присуща достаточно высокая <<разрешающая способность": они выявляют дубликаты, разнесенные всего на 80-100 лет. Для понимания некоторых деталей от читателя здесь потребуется знание основ теории вероятностей. ВВЕДЕНИЕ Предметом нашего исследования является структура исторической хроники как составного, слоистого документа. Слово <<хроника>> мы понимаем широко: это может быть произвольный текст, описывающий в хронологическом порядке последовательность действительных или легендарных событий и имеющий разбивку по времени (по годам, десятилетиям, поколениям и т. п.). Например, <<Повесть временных лет>> ── хроника. Хроникой является также текст Библии, разбитый на главы-поколения. Такая разбивка была выполнена А. Т. Фоменко. В этом смысле хроникой является также текст практически любого современного учебника или монографии по истории. Любая ДОСТАТОЧНО ДЛИННАЯ историческая хроника, описывающая ДЛИТЕЛЬНЫЙ промежуток времени (А, В), является по необходимости составной (компилятивной), поскольку не может основываться на жизненном опыте только ОДНОГО человека. Автор (компилятор) длинной хроники вынужден использовать предшествующие письменные источники (другие хроники). Обрабатывая и дополняя их, он составлял свой собственный труд. Те хроники, которые он использовал, в свою очередь могли быть составными и т. д. Таким образом, длинные хроники имеют структуру, схематично изображенную на рис.5eВ1. Здесь хроника Х, описывающая события длительного периода времени (А, В), изображена в виде длинного отрезка, над которым расположена совокупность коротких отрезков - исходных текстов, лежащих в основе хроники Х. Таким образом, изображено <<расслоение>> хроники Х на исходные ее первоисточники, написанные очевидцами событий. А если хроника Х содержит также и вымышленные события, ── то и авторами вымыслов. Поскольку при описании одних и тех же событий в хронике Х могли использоваться сразу несколько исходных текстов, то над каждой точкой отрезка Х на рис.5eВ1 расположено, вообще говоря, несколько коротких отрезков. Представим себе, например, летопись, которая велась на протяжении длительного времени в одном и том же месте, в одних и тех же традициях (например ── в одном монастыре). Предположим, что в нее ежегодно включались события, произошедшие в текущем году. Структура такой летописи наиболее проста ── она условно изображена на рис.5eВ2. Короткие отрезки, <<накрывающие>> летопись Х (см. рис.5eВ2), соответствуют промежуткам деятельности отдельных летописцев, дополнявших летопись описаниями современных им событий. Несмотря на смену летописцев, такая летопись длительное время могла оставаться однородной по стилю, характеру отбора материала, объему описаний и т. п. Эта однородность условно отражена на рис.5eВ2 тем, что все короткие отрезки, <<накрывающие>> летопись Х изображены на одном и том же уровне. При составлении же глобальной хронологии большое количество разнородных летописей (хроник, мемуаров и т. п.) каким-то образом согласовывалось, летописи <<сшивались>> и включались во всеобщую хронику. При этом, естественно, нарушалась однородность текста. Эта ситуация схематично изображена на рис.5eВ3: длинная хроника Х является <<суммой>> трех разнородных хроник Х, Х, Х. 1 2 3 Результат этой окончательной хронологической деятельности, проведенной, в основном, в XIV-XVII вв., мы и имеем сегодня в качестве <<современного учебника по истории древности и средних веков>>. Нашей задачей является: 1) РАСПОЗНАВАНИЕ МЕСТ СТЫКОВ ВНУТРЕННЕ ОДНОРОДНЫХ ЧАСТЕЙ В <<СОВРЕМЕННОМ УЧЕБНИКЕ>> ПО ИСТОРИИ С ПОМОЩЬЮ ФОРМАЛЬНЫХ МАТЕМАТИКО-СТАТИСТИЧЕСКИХ ПРОЦЕДУР; 2) ФОРМАЛЬНОЕ РАСПОЗНАВАНИЕ ЗАВИСИМЫХ МЕжДУ СОБОЙ ЧАСТЕЙ ЭТОГО <<УЧЕБНИКА>>. В настоящей работе мы почти не касаемся содержательной интерпретации получаемых формальных результатов. Отметим, что математико-статистические процедуры, предлагаемые в данной работе, основаны на некоторой вероятностной модели и наши результаты имеют смысл лишь в пределах этой модели (то есть в предположении, что она соответствует историческим данным). Поэтому мы обращали особое внимание на то, чтобы модель была как можно проще, естественнее, и не требовала бы специальных предположений. Глава 1 ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ 1. ФОРМУЛИРОВКА ПРИНЦИПА ЗАТУХАНИЯ ЧАСТОТ И ДУБЛИРОВАНИЯ ЧАСТОТ. ПРИМЕРЫ 1. 1. ФОРМУЛИРОВКА ПРИНЦИПА В работах [5epr3-1]-[5epr3-5] А. Т. Фоменко сформулировал фундаментальный ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ, позволяющий строить естественные статистические модели эволюции во времени собственных имен исторических персонажей, упоминаемых в хрониках, летописях и т. п. Этот принцип состоит в следующем. Предположим, что исследуется большая совокупность текстов (фрагментов), каждый из которых описывает события приблизительно одного поколения. Пусть задан некий их хронологический порядок, правильность которого необходимо проверить. При правильном хронологическом порядке текстов, имена персонажей в них должны постепенно меняться при последовательном переходе от одного фрагмента к другому. Дело в том, что с течением времени речь начинает идти о все новых и новых людях, причем имена новых деятелей вытесняют имена прежних. В самом деле, рассмотрим какое-нибудь одно определенное поколение. При описании событий, предшествующих этому поколению, имена персонажей этого поколения, как правило, не упоминаются, так как они еще не родились. Затем, при описании событий самого этого поколения, именно персонажи этого поколения упоминаются наиболее часто, поскольку с ними связаны описываемые события. Наконец, переходя к описанию следующих поколений, хронисты все реже упоминают о прежних персонажах, так как описывают уже новые события, персонажи которых сменяют умерших. ЭТО ОЗНАЧАЕТ, ЧТО ПРИ ПРАВИЛЬНОМ ХРОНОЛОГИЧЕСКОМ ПОРЯДКЕ ФРАГМЕНТОВ, ЧАСТОТА УПОТРЕБЛЕНИЯ ИМЕН ПЕРСОНАЖЕЙ ДАННОГО ПОКОЛЕНИЯ ДОЛЖНА В СРЕДНЕМ УМЕНЬШАТЬСЯ, <<ЗАТУХАТЬ>>, ПРИ ПЕРЕХОДЕ К ОПИСАНИЮ ВСЕ БОЛЕЕ ОТДАЛЕННЫХ ОТ НЕГО ВО ВРЕМЕНИ ПОКОЛЕНИЙ. Таким образом, каждое поколение рождает свои, новые исторические персонажи (имена); а при смене поколений эти лица сменяются. Несмотря на внешнюю простоту, этот принцип (нуждающийся в проверке) оказался чрезвычайно полезен при создании методов датировки текстов. ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ допускает более строгую переформулировку. 1. 2. ЧАСТОТНЫЕ ГРАФИКИ ИМЕН. ИДЕАЛЬНЫЙ ЗАТУХАЮЩИЙ ГРАФИК Предположим, что анализируемая совокупность фрагментов текста, каждый из которых описывает события приблизительно одного поколения, расположена и занумерована в некотором хронологическом порядке. Эти фрагменты мы в дальнейшем будем называть ГЛАВАМИ-ПОКОЛЕНИЯМИ, поскольку каждый из них представляет собой как бы главу совокупного длинного текста и описывает в нем лишь одно поколение. Рассмотрим группу имен, впервые появившихся в главе-поколении с номером Т (напомним, что главы занумерованы в 0 хронологическом порядке). В эту группу входят те и только те имена, которые ни в каких главах с меньшими чем Т номерами не 0 появлялись, но появились в главе Т. 0 Условно назовем имена этой группы Т -именами. Подсчитаем 0 затем, сколько раз эти же имена упомянуты в произвольной главе-поколении с некоторым номером Т. Получившееся число обозначим через К(Т, Т). При этом, если одно и то же имя 0 повторяется в главе с номером Т несколько раз (то есть с кратностью), то все эти упоминания будем подсчитывать и включать в общее количество К(Т, Т). 0 Построим график, отложив по горизонатали номера глав-поколений, а по вертикали ── числа К(Т, Т). Номер Т считаем 0 0 при этом фиксированным (таким образом, для каждого номера Т 0 получится свой график). Принцип затухания частот формулируется тогда так: ПРИ ХРОНОЛОГИЧЕСКИ ПРАВИЛЬНОЙ НУМЕРАЦИИ ГЛАВ-ПОКОЛЕНИЙ ГРАФИКИ К(Т, Т) ПРИ ВСЕХ Т ДОЛЖНЫ ИМЕТЬ СЛЕДУЮЩИЙ ВИД (рис.5e1): 0 0 СЛЕВА ОТ ТОЧКИ Т ГРАФИК РАВЕН НУЛЮ, В ТОЧКЕ Т ── АбСОЛЮТНЫЙ 0 0 МАКСИМУМ, А ЗАТЕМ ГРАФИК ПОСТЕПЕННО ПАДАЕТ, ЗАТУХАЕТ (МОНОТОННО УБЫВАЕТ). Буквой N на рис.5e1 обозначено общее количество поколений в данной совокупности фрагментов текста. График на рис.5e1 назовем ИДЕАЛЬНЫМ (ТЕОРЕТИЧЕСКИМ). Сформулированный принцип должен быть проверен экспериментально на достоверных данных. Если он верен, то мы сможем пользоваться следующим важным следствием этого принципа. ЭКСПЕРИМЕНТАЛЬНЫЕ ГРАФИКИ К(Т, Т) ПРИ ПРАВИЛЬНОМ 0 ХРОНОЛОГИЧЕСКОМ ПОРЯДКЕ ГЛАВ-ПОКОЛЕНИЙ ДОЛЖНЫ БЫТЬ (КАЧЕСТВЕННО) БЛИЗКИ К ИДЕАЛЬНОМУ. 1. 3. ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ НА КОНКРЕТНОМ ИСТОРИЧЕСКОМ МАТЕРИАЛЕ В ходе обширного численного эксперимента, выполненного А. Т. Фоменко на реальных достоверных исторических данных XVI-XX вв., а также на части более ранних данных, принцип затухания частот полностью подтвердился. Приведем здесь некоторые примеры [5epr3-6], [5epr3-8]. 1. 3. 1. ПРИМЕР ИЗ АНТИЧНОЙ РИМСКОЙ ИСТОРИИ ПРИМЕР 1. (А. Т. Фоменко). Тит Ливий <<Римская история>> М., 1887-1889, тт. 1-6. (Имеется современное издание: Тит Ливий. <<История Рима от основания города. Тт. 1, 2. М. :Наука, 1989, 1991). Это ── фундаментальный текст по истории города Рима, охватывающий период от основания города (753 г. до н. э.) до II в. до н. э. Весь текст <<Истории>> был разбит на главы-поколения. Оказалось, что все графики К(Т, Т), относящиеся к тем частям 0 <<Истории>>, которые описывают 240-летний период 750-510 гг. до н. э. и 220-летний период 510-293 гг. до н. э., ПРАКТИЧЕСКИ СОВПАЛИ С ИДЕАЛЬНЫМ. Следовательно, данные отрезки истории описаны Ливием в полном соответствии с принципом затухания частот: подавляющее большинство имен, впервые использованных Ливием при описании того или иного поколения, упоминалось затем наиболее часто при описании именно этого поколения. А в дальнейшем изложении они постепенно сменялись другими, <<забывались>>. 1. 3. 2. ПРИМЕР ИЗ СРЕДНЕВЕКОВОЙ КЛЕРИКАЛЬНОЙ РИМСКОЙ ИСТОРИИ ПРИМЕР 2. (А. Т. Фоменко). Liber Pontificals. Gestorum Pontificum Romanorum, 1898 (издание Т. Моммзена). Из этого набора текстов, описывающего клерикальную историю Рима, были выделены куски, соответствующие периодам: 1) 300-560 гг. н. э. ; 2) 560-900 гг. н. э. ; 3) 900-1250 гг. н. э. Для каждого из этих периодов были построены графики К(Т, Т). 0 ВСЕ ОНИ ОКАЗАЛИСЬ БЛИЗКИ К ИДЕАЛЬНОМУ. Следовательно, и в этом случае принцип затухания частот подтверждается для исторических описаний, охватывающих несколько столетий. Из проведенного А. Т. Фоменко эксперимента, между прочим вытекает, что на интервалах времени в несколько столетий, как правило, не было <<моды>> на одни и те же имена (само по себе это отнюдь не очевидно). Конечно, некоторые древние имена (Петр, Мария) часто употребляются и до сих пор. Но как выяснилось, доля этих имен среди общего числа древних имен, вошедших в употребление одновременно с ними, очень мала. Существование таких <<долгоживущих>> имен означает, что экспериментальные графики К(Т, Т) падают при движении слева направо не до нуля, а до 0 некоторого ненулевого уровня. 1. 3. 3. ПРИМЕР ИЗ ВИЗАНТИЙСКОЙ ИСТОРИИ ПРИМЕР 3. (А. Т. Фоменко). В качестве текста X была взята следующая последовательность первоисточников, описывающая историю Византии в период 976-1341 гг. н. э. : 1) МИХАИЛ ПСЕЛЛ <<Хронография>> (М., 1978) ── охватывает период 976-1075 гг. ; 2) АННА КОМНИНА <<Сокращенное сказание о делах царя Алексея Комнина>> (Спб., 1879) ── период 1081-1118 гг. ; 3) ИОАНН КИННАМ <<Краткое обозрение царствования Иоанна и Мануила Киннама>> (Спб., 1860) ── период 1118-1185 гг. ; 4) НИКИТА ХОНИАТ <<История со времен царствования Иоанна Киннама>>, том 1 (Спб., 1862) ── период 1186-1206 гг. ; 5) ГЕОРГИЙ АКРОПОЛИТ <<Летопись>> (Спб., 1863) ── период 1203-1261 гг. ; 6) ГЕОРГИЙ ПАХИМЕР <<История о Михаиле и Адронике Палеологах>> (Спб., 1862) ── период 1285-1282 гг. ; 7) НИКИФОР ГРИГОРА <<Римская история>> (Спб., 1862) ── период 1204-1341 гг. Перечисленные тексты содержит несколько десятков тысяч упоминаний полных имен (с учетом повторных упоминаний). ОКАЗАЛОСЬ, ЧТО ВСЕ ГРАФИКИ К(Т, Т) ДЛЯ ПЕРВОЙ ЧАСТИ ТЕКСТА X 0 ОТ 976 ДО 1206 ГГ. (хроники 1-4) ПРАКТИЧЕСКИ СОВПАДАЮТ С ИДЕАЛЬНЫМ. АНАЛОГИЧНОЕ УТВЕРЖДЕНИЕ ВЕРНО И ДЛЯ ВТОРОЙ ЧАСТИ ТЕКСТА Х: ОТ 1206 ДО 1341 ГГ. (хроники 5-7). Принцип затухания частот подтвердился также и для современных исторических текстов (учебников). 1. 3. 4. ПРИМЕР ИЗ СРЕДНЕВЕКОВОЙ РИМСКОЙ ИСТОРИИ ПРИМЕР 4. (А. Т. Фоменко). Фердинанд Грегоровиус <<История города Рима в средние века>>, тома 1-6 (Спб., 1902-1912) ── один из самых обширных и информативных современных текстов по истории Рима. Из него были выделены и разбиты на главы-поколения куски, описывающие периоды: 1) 300-560 гг., 2) 560-900 гг., 3) 900-1250 гг., 4) 1250-1500 гг. Общее количество упоминаний имен ── несколько десятков тысяч. ОКАЗАЛОСЬ, ЧТО ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ ВЕРЕН В КАЖДОМ ИЗ УКАЗАННЫХ КУСКОВ ТЕКСТА ПО ОТДЕЛЬНОСТИ. Отметим, что они описывают события на протяжении нескольких столетий каждый и их величина вполне достаточна, для того, чтобы собрать представительную статистику. Поэтому можно было бы ожидать, что статистический принцип (каким является принцип затухания частот), подтвердившийся на каждом из таких объемных кусков текста, будет верен и для всего текста Грегоровиуса. ОДНАКО ОКАЗЫВАЕТСЯ, ЧТО ЭТО НЕ ТАК. ДЛЯ ВСЕГО ТЕКСТА ГРЕГОРОВИУСА ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ УЖЕ НЕ ВЫПОЛНЯЕТСЯ. Это ── отражение того обстоятельства, что история Рима содержит статистические дубликаты (см. ниже). Аналогичное утверждение справедливо и для монографии Кольрауша <<История Германии>>, тома 1-2 (М., 1860), в которой было выделены куски описывающие следующие периоды времени: 1) 600-1000 гг. н. э. ; 2) 1000-1273 гг. н. э. ; 3) 1273-1700 гг. н. э. Всего А. Т. Фоменко было обработано несколько десятков исторических текстов и во всех случаях принцип затухания частот подтвердился. На его основе в работе [5epr3-5] был предложен метод хронологически правильного упорядочивания глав-поколений в хронике (или наборе хроник), где этот порядок нарушен или неизвестен. 1. 4. КАК МОЖНО ДАТИРОВАТЬ НЕИЗВЕСТНЫЕ ИЛИ СОМНИТЕЛЬНЫЕ ХРОНИКИ 1. 4. 1. ЧАСТОТНАЯ МАТРИЦА ИМЕН И МЕТОД ДАТИРОВАНИЯ МЕТОДИКА ДАТИРОВАНИЯ (А. Т. Фоменко [5epr3-6]). Рассмотрим совокупность глав-поколений хроники X (пусть их будет N штук) и занумеруем их в каком-либо, произвольном порядке. После этого для каждой главы-поколения Х(Т ) подсчитаем график К(Т, Т), который, 0 0 естественно, зависит от выбранной нумерации глав. Весь набор значений К(Т, Т) при различных Т и Т расположим в виде 0 0 квадратной матрицы размера NxN. Именно, на пересечении i-й стороки и j-го столбца этой матрицы поставим число К(i, j). Обозначим полученную матрицу {K} и будем называть ее квадратной матрицей частот хроники (текста) Х. В случае, когда каждый из графиков К(Т, Т) совпадает с 0 идеальным, матрица {K} будет иметь вид, показанный на рис.5e2: а) ниже главной диагонали ── нули, б) на самой главной диагонали ── абсолютные максимумы в каждой строке, в) при движении по любой строке вправо от главной диагонали значения монотонно уменьшаются. Конечно, экспериментальные графики должны лишь качественно совпадать с теоретическим (идеальным). В реальных хрониках имена персонажей могут впервые встречаться несколько раньше описания основных связанных с ними событий, затем частота употребления этих имен будет нарастать, достигая максимума при описании событий, в которых они в наибольшей мере участвовали, и лишь затем монотонно убывать ── рис.5e3. Другими словами в реальных графиках К(Т, Т) рост от нуля до 0 максимума не обязательно должен происходить мгновенно. Если в хронике Х меняется нумерация глав-поколений, то соответственно изменятся и все графики К(Т, Т), а, следовательно, 0 и матрица {K}. В самом деле, при изменении нумерации глав, в хронике происходит сложное перераспределение <<впервые появившихся имен>>, что влияет на значения К(Т, Т). 0 Меняя порядок глав с помощью различных перестановок и вычисляя каждый раз новую матрицу {K}, будем искать такой порядок глав-поколений, при котором матрица будет иметь вид, наиболее близкий к идеальному. Тот порядок глав, при котором отклонение экспериментальной матрицы {K} от теоретической (идеальной) будет наименьшим, и следует признать ХРОНОЛОГИЧЕСКИ ПРАВИЛЬНЫМ (в рамках данной модели). Этот метод позволяет датировать события, например, в следующей ситуации. Пусть дана хроника Y, о которой известно, что она описывает какие-то события приблизительно одного поколения из продолжительной эпохи (А, В) ── от года А до года В. Но более точная датировка этих событий неизвестна. Предположим, что эпоха (А, В) целиком описана в некоторой другой хронике Х, разбитой на главы-поколения, причем порядок глав в тексте Х хронологически правилен. Требуется указать <<место>> текста Y среди глав-поколений текста Х. Другими словами, требуется точно (с точностью до одного поколения) датировать события текста Y в предположении, что хронология текста Х верна. Для решения этой задачи присоединим хронику Y к хронике Х в качестве новой главы и меняя ее место среди глав текста Х будем каждый раз вычислять матрицу {K}. Сравнивая экспериментальный вид матрицы {K} с теоретическим (идеальным) найдем такое положение текста Y в тексте Х, при котором согласование будет наилучшим. Тем самым мы определим место событий хроники Y среди событий хроники Х. Датировка событий из Х нам, по предположению, известна. ТЕМ САМЫМ, МЫ ДАТИРУЕМ СОБЫТИЯ, ОПИСАННЫЕ В Y. Метод был проверен на текстах с заранее известной датировкой [5epr3-5]-[5epr3-8]. 1. 4. 2. ПРИМЕР ИЗ ИСТОРИИ АНТИЧНОЙ ГРЕЦИИ ПРИМЕР 5. (А. Т. Фоменко). Рассмотрим период от 500 до 200 гг. до н. э. в истории Греции. В качестве текста Х, описывающего весь этот период, возьмем <<Сравнительные жизнеописания>> Плутарха (тома 1-3, М., 1963-1964). Использование описанного метода показало, что все главы-поколения в этом тексте расположены хронологически правильно (друг относительно друга). Это не означает, впрочем, что верна их АБСОЛЮТНАЯ датировка (она, как раз, ошибочна). Но в этом примере мы говорим пока лишь об ОТНОСИТЕЛЬНОЙ хронологии. В качестве текста Y, события которого надо датировать, возьмем текст Плутарха <<Пирр>>. Описываемые в нем события обычно датируют 319-272 гг. до н. э. (см. том 2 <<Сравнительных жизнеописаний>>, с. 502-503, комментарий 5, 89). Разыскивая для <<Пирра>> правильное положение среди других глав-поколений, находим, что следует поместить <<Пирра>> в конец IV ── начало III вв. до н. э. Это хорошо согласуется с известной ранее (ОТНОСИТЕЛЬНОЙ! ) датировкой. (Однако, АБСОЛЮТНАЯ датировка здесь не совпадает с традиционной [5epr3-2]). Полученный результат достаточно грубый, так как мы имели дело с главами, описывающими целые поколения, а не отдельные годы, но зато мы датировали <<Пирра>> ОТНОСИТЕЛЬНО других жизнеописаний Плутарха не вникая в его смысловое содержание, чисто формальным методом. 1. 4. 3. ПРИМЕР ИЗ ВИЗАНТИЙСКОЙ ИСТОРИИ ПРИМЕР 6. (А. Т. Фоменко). Возьмем в качестве <<датирующего>> текста Х последовательность византийских хроник, перечисленную в примере 3. ОТНОСИТЕЛЬНО ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ были датированы следующие хроники, описывающие крестовые походы: 1) Y = <> Робера де Клари. (М., 1986). В обоих случаях относительная датировка, полученная с помощью описанной методики совпала с традиционной. Вопрос же об абсолютной датировке этих текстов, как и хроник, перечисленных выше в качестве <<византийской шкалы>>, - вопрос особый. Как мы увидим, эти документы были, скорее всего, написаны существенно позднее, чем предполагается в скалигеровской истории. Таким образом эффективность методики подтвердилась на средневековых текстах с заранее известной датировкой. 1. 5. КАК МОЖНО ОБНАРУЖИТЬ ДУБЛИКАТЫ-ПОВТОРЫ В ХРОНИКЕ МЕТОДИКА ОБНАРУЖЕНИЯ ДУБЛИКАТОВ (А. Т. Фоменко, [5epr3-6], [5epr3-18]). Следуя работам [5epr3-1]-[5epr3-8], сформулируем следствие принципа дублирования частот для хроник, содержащих повторы (дубликаты). Этот принцип позволяет предложить метод выявления <<скрытых>> дубликатов, которые из-за существенных различий в подаче материала не заметны при смысловом восприятии текста. Описанная ниже методика является с некотором смысле частным случаем предыдущей, но ввиду ее важности для датировки, мы выделим ее как самостоятельный прием обнаружения дубликатов. Пусть интервал времени (А, В) ── от года А до года В, ── описан в хронике Х, разбитой на главы-поколения, которые мы обозначаем Х(Т), где Т ── номер поколения. Предположим, что в целом главы-поколения Х(Т) в тексте Х занумерованы хронологически верно, за одним лишь исключением: среди них есть два дубликата, то есть две главы, помещенные в РАЗНЫХ частях хроники Х, но говорящие ОБ ОДНОМ И ТОМ ЖЕ ПОКОЛЕНИИ, по сути дела повторяющие друг друга. Рассмотрим простейший случай, когда оба дубликата тождественны, то есть одна и та же глава-поколение встречается в тексте Х два раза ── один раз с номером Т, а второй раз с номером 0 С. 0 Ясно, что графики К(Т, Т) и К(С, Т), определение которых 0 0 было дано выше, имеют в этом случае вид, качественно показанный на рис.5e4. В самом деле, все имена ВПЕРВЫЕ появившиеся в главе с номером Т (первой в паре глав-дубликатов) повторяются затем еще 0 раз в главе с номером С (второй главе этой пары). Поэтому 0 частота употребления <<имен главы Т << в последующих главах хроники 0 Х скачком возрастет, когда при движении слева направо по оси абсцисс мы дойдем до номера С. 0 График К(Т, Т) будет иметь в точке С характерный ВСПЛЕСК, 0 0 говорящий о появлении в тексте дубликата главы с номером Т . 0 Что же касается графика К(С, Т), то ясно, что все значения 0 К(С, Т) просто равны нулю, так как глава Х(С ), являясь точным 0 0 повтором уже бывшей главы Х(Т ), не содержит ни одного нового 0 имени (все ее имена уже появились в Х(Т )) ── см. рис.5e4. 0 Первый график на рис.5e4 явно не удовлетворяет принципу затухания частот (так нет монотонного убывания справа от Т ). 0 Следовательно, для восстановления правильного хронологического порядка глав следует переставить главы-поколения в хронике Х так, чтобы добиться соответствия с теоретическим графиком (рис.5e1). Ясно, что наилучшее совпадение с теоретическим графиком получится, если мы поместим главы-дубликаты Х(Т ) и Х(С ) рядом 0 0 или просто отождествим их. Итак, если среди глав-поколений некоторой хроники Х обнаружились две главы Х(Т ) и Х(С ), для которых их графики 0 0 К(Т, Т) и К(С, Т) имеют вид приблизительно как на рис.5e4, то эти 0 0 главы являются дубликатами (в рамках рассматриваемой модели). Скорее всего, эти главы говорят об одних и тех же событиях и их следует отождествить. Все сказанное переносится на случай, когда в хронике Х содержится три и более дубликатов. 1. 6. ПРИМЕР ИЗ СРЕДНЕВЕКОВОЙ ИСТОРИИ ИТАЛИИ Метод был экспериментально проверен на реальных исторических данных. В качестве простого примера, в частности, была взята книга <<Истории Флоренции>> Н. Макьявелли (Л., 1973), снабженная развернутым комментарием. Ясно, что комментарии можно рассматривать как серию дополнительных глав-поколений, ДУбЛИРУЮЩИХ основной текст (так как в них в основном говорится о тех же событиях, что и в основной хронике). Текст <<Истории>> вместе с комментариями был разбит на главы-поколения. Для получившегося совокупного текста (охватывающего как саму <<Историю>>, так и комментарии к ней) была построена матрица {K}, определенная выше. Оказалось, что она имеет вид, качественно показанный на рис.5e5, где жирным отмечены клетки матрицы, заполненные максимумами в ее строках (то есть максимумами, всплесками в графиках К(Т, Т)). Комментарии к основной хронике ясно выделяются на рис.5e5 0 в виде СПЛОШНОГО ЖИРНОГО ОТРЕЗКА, ПАРАЛЛЕЛЬНОГО ГЛАВНОЙ ДИАГОНАЛИ. В данном случае методика успешно обнаружила ЗАРАНЕЕ ИЗВЕСТНЫЕ дубликаты ── комментарии к тексту Макьявелли (при обработке этого текста принимал участие А. Макаров). Описанные методы распознавания зависимостей ("статистических дубликатов>>), основанные на принципе затухания частот, были предложены А. Т. Фоменко в работах [5epr3-5]-[5epr3-8]. С их помощью, а также с помощью других, независимых методик, в 1980-1988 гг. А. Т. Фоменко и его коллегами была проделана исключительно объемная вычислительная работа по глобальному статистическому анализу совокупности текстов, описывающих древнюю и средневековую историю. Результаты этой работы суммированы в виде разложения ГХК (глобальной хронологической карты) [5epr3-6]. 2. ХРОНОЛОГИЧЕСКИЕ СПИСКИ ИМЕН. ПРИМЕРЫ. 2. 1. ПОНЯТИЕ СПИСКА ИМЕН. ПРАВИЛЬНЫЕ, КРАТНЫЕ, ПРОСТЫЕ СПИСКИ ИМЕН В дальнейшем мы будем рассматривать не сами хроники (тексты), а СПИСКИ ИМЕН, извлеченные из них. Это означает, что каждый фрагмент хроники, описывающий события некоторого выбранного периода времени (одного поколения, 10-ти, 20-ти летия и т. п.) заменяется на список собственных имен, упоминаемых в данном фрагменте. При этом, в каждом фрагмента любое имя учитывается столько раз, сколько оно упомянуто в нем ── то есть учитывается <<с кратностью>>. Предположим, что общее число глав в рассматриваемой хронике равно N. Выстроив и занумеровав списки имен, извлеченных из каждого фрагмента этого текста, в том порядке, как они следовали в нем, получим список имен Х, являющийся объединением последовательности более коротких списков имен Х, Х,..., Х : 1 2 N Х = Х +Х +... +Х. 1 2 N Списки имен Х (1\Д<\Аi\Д<\АN) мы в дальнейшем будем называть i ГЛАВАМИ-ПОКОЛЕНИЯМИ или просто ГЛАВАМИ списка Х. Список Х является упорядоченным списком имен и его можно рассматривать также и без разбиения на главы: Х = {a, a,..., a }. 1 2 n Здесь через a обозначено i-тое по порядку имя в списке Х. i Мы будем придерживаться следующих обозначений для характеристик списков имен: n ── общее число имен в списке Х (с учетом кратности их вхождения в список); m ── число РАЗЛИЧНЫХ имен списка Х; N ── число глав списка Х (если используется разбиение списка имен на главы). Итак, основной объект нашего исследования ── список имен Х, разбитый на следующие одна за другой в хронологическом порядке главы Х, Х,..., Х. Такие списки мы будем называть 1 2 N ХРОНОЛОГИЧЕСКИМИ СПИСКАМИ ИМЕН. Хронологические списки имен, удовлетворяющие принципу затухания частот, являются (в рамках нашей модели) списками с ПРАВИЛЬНОЙ хронологией. В дальнейшем мы будем называть такие списки имен ПРАВИЛЬНЫМИ СПИСКАМИ. Допустим, что в списке имен нарушен принцип затухания частот (или следствия этого принципа). Пусть это нарушение достаточно ярко выражено и позволяет выделить в списке имен систему <<статистических дубликатов>> (после отождествления которых справедливость принципа затухания частот восстанавливается). Тогда назовем такие хронологические списки имен ── СПИСКАМИ С ДУБЛИКАТАМИ. Хронологический список имен назовем ПРОСТЫМ, если имя (имена) каждого исторического деятеля входит в каждую главу списка не более, чем один раз. В тех случаях, когда в главах списка содержатся по нескольку раз имена одного и того же лица, мы будем называть его КРАТНЫМ списком. Таким образом, ПРОСТЫЕ СПИСКИ ── это просто перечисление имен (скажем, некоторой династии правителей) в хронологическом порядке. КРАТНЫЕ СПИСКИ имен получаются, как правило, при выписывании всех имен из исторического источника, разбитого на фрагменты (главы-поколения). При этом, в каждом фрагменте имя (имена) одного и того же персонажа обычно повторяются НЕСКОЛЬКО РАЗ. 2. 2. ПРИМЕРЫ СПИСКОВ ИМЕН Мы изучим следующие хронологические списки имен, которые для удобства ссылок снабдим сокращенными обозначениями данными в скобках. 2. 2. 1. ИМЕНА РИМСКИХ ИМПЕРАТОРОВ 1. (РИ) ── список ИМЕН ИМПЕРАТОРОВ РИМА, начиная с Ромула (753 г. до н. э.) и кончая императором Леопольдом Габсбургом (1705 г. н. э.). В этот список последовательно включены все известные имена всех императоров и фактических правителей царского Рима (по Титу Ливию), Римской империи I в. до н. э. ── IV в. н. э. включая династию готов, империи каролингов, Священной римской империи германской нации X-XIII вв., империи Габсбургов XIII-XVII вв. Список был составлен А. Т. Фоменко. Список имен римских императоров был разбит на главы по 10 лет каждая. При этом, в каждую главу списка попали имена тех императоров, время правления которых пересекалось с соответствующим 10-летним промежутком. Так, в первую главу вошли имена императоров, время правления которых перекрывалось с отрезком времени 760-750 гг. до н. э., во вторую ── с отрезком 750-740 гг. до н. э. и т. д. При этом вписывались все известные имена каждого императора. В случае, если время правления императора перекрывалось сразу с несколькими десятилетиями, его имена входили во все соответствующие этим десятилетиям главы. Поскольку история императорского Рима содержит две лакуны ── две римских республики (античная и средневековая), то в списке имен римских императоров есть две серии пустых глав (имен императоров в соответствующих десятилетиях нет). Общее число глав этого списка имен: N = 246, общее число имен n = 555, число различных имен m = 193. Список простой. Рассматривались также разбиения списка имен римских императоров на более крупные главы ── по 20, 30 и 40 лет. 2. 2. 2. ИМЕНА РИМСКИХ ПАП 2. (П1) ── список ИМЕН РИМСКИХ ПАП до 1950 г. В этот список включены имена всех пап и антипап Рима начиная с апостола Петра. Список имен римских пап разбит на главы по 10 лет. Список составлен А. Макаровым по [5epr3-14]. Общее число глав этого списка имен: N = 190, общее число имен n = 293, число различных имен m = 89. Список простой. 2. 2. 3. НАЦИОНАЛЬНОСТИ РИМСКИХ ПАП 3. (П2) ── список НАЦИОНАЛЬНОСТЕЙ РИМСКИХ ПАП до 1950 г. Этот список составлен так же, как и список имен римских пап, но только вместо имен взяты данные о происхождении (например, <<римлянин>>, <<француз>>, <<генуэзец>> и т. п.). Таким образом, в качестве <<имени>> в списке П2 выступает национальность (происхождение) того или иного папы. Список национальностей римских пап составлен А. Макаровым по [5epr3-14]. Общее число глав списка: N = 246, общее число <<имен>> n = 293, число различных <<имен>> m = 51. Список простой. 2. 2. 4. ИМЕНА ВИЗАНТИЙСКИХ ИМПЕРАТОРОВ 4. (ВИ) ── список ИМЕН ИМПЕРАТОРОВ ВОСТОЧНОЙ РИМСКОЙ ИМПЕРИИ (ВИЗАНТИИ). Список начинается с императора Константина Великого (306 г. н. э.) и кончается императором Константином XI Палеологом, погибшим при взятии Константинополя турками в 1453г. Список имен императоров Византии составлен А. Т. Фоменко и разбит на главы по 10 лет. Рассматривались также и более крупные разбиения ── по 20 и 40 лет. Общее число глав списка: N = 116, общее число имен n = 151, число различных имен m = 63. Список простой. 2. 2. 5. ИМЕНА КОНСТАНТИНОПОЛЬСКИХ ПАТРИАРХОВ 5. (ВП) ── список ИМЕН КОНСТАНТИНОПОЛЬСКИХ ПАТРИАРХОВ до начала XIX в. Список начинается с патриарха Александра (317 г.) и кончается патриархом Неофитом VII (1809 г.). Список составлен Г. В. Носовским по [5epr3-19] и разбит на главы по 10 лет. В него включены также названия церковных соборов. Общее число глав списка: N = 150, общее число имен n = 310, число различных имен m = 129. Список простой. 2. 2. 6. ИМЕНА В БИБЛИИ 6. (Б1) ── список ВСЕХ СОБСТВЕННЫХ ИМЕН, УПОМИНАЕМЫХ В БИБЛИИ. При разбиении этого списка на главы использовано разбиение текста Библии на главы-поколения, выполненное А. Т. Фоменко [5epr3-6]. Каждая из этих глав говорит о событиях приблизительно одного поколения людей. В главу 1 списка имен Библии были включены все собственные имена из первой главы-поколения Библии, в главу 2 ── из второй и т. д. Список составлен В. П. Фоменко и Т. Г. Фоменко. Общее число глав списка: N = 218, общее число имен n примерно равно 15500, число различных имен m примерно равно 5000. Список кратный. 2. 2. 7. ПАРАЛЛЕЛЬНЫЕ СТИХИ В БИБЛИИ 7. (Б2) ── список ПАРАЛЛЕЛЬНЫХ МЕСТ (ПОВТОРОВ) В БИБЛИИ. В XVIII-XIX вв. комментаторы Библии проделали обширную работу по выявлению повторяющих друг друга по смыслу стихов библейского текста. Эти повторы указаны в современных изданиях Библии в виде так называемого аппарата параллельных мест. А именно, для каждого стиха указано, какие именно стихи Библии являются <<повторами>> данного стиха, близки ему по смыслу (если такие повторы есть). При построении списка повторов в Библии в качестве <<имен>> взята вся совокупность стихов Библии и те стихи, которые являются повторами друг друга (согласно аппарату параллельных мест в синодальном издании) были формально отождествлены. Получилась последовательность <<имен>>, среди которой есть одинаковые, повторяющиеся. Этот список <<имен>> разбит на главы так же, как и список Б1 имен Библии ── в соответствии с разбиением текста Библии на главы-поколения. Вся огромная работа по составлению списка Б2 и подсчету графиков К(Т, Т) для него (см. о них выше) проделана 0 В. П. Фоменко и Т. Г. Фоменко. Общее число глав списка: N = 218, общее число <<имен>> n примерно равно 22000, число различных <<имен>> m примерно равно 5200. Список кратный. 2. 2. 8. ИМЕНА АРМЯНСКИХ КАТОЛИКОСОВ 8. (АК) ── список ИМЕН КАТОЛИКОСОВ АРМЕНИИ от 50 г. н. э. до начала XX в. Список разбит на главы по 10 лет. Общее число глав списка: N = 175, общее число имен n = 391, число различных имен m = 215. Список простой. 2. 3. ТАБЛИЦА ОСНОВНЫХ ИСТОРИЧЕСКИХ СПИСКОВ ИМЕН Для удобства читателя мы сведем перечисленные списки имен с их обозначениями и основными характеристиками в таблице 1. Таблица 1. ────────────────────────────────────────────────────────────── Услов- Краткое Промежуток Размер Число Общее Число ное описание времени, главы глав число раз- обозна- списка охватыва- в имен личных чение емый спис- спис- имен ком ке ────────────────────────────────────────────────────────────── РИ Имена -753 г. 10 лет 246 555 193 императоров ... Список простой. Рима 1705 г. П1 Имена 50 г. 10 лет 190 293 89 римских ... Список простой. пап 1950 г. П2 Националь- 50 г. 10 лет 190 293 51 ности ... Список простой. римских 1950 г. пап ВИ Имена 306 г. 10 лет 116 151 215 императоров ... Список простой. Византии 1453 г. ВП Имена 317 г. 10 лет 150 310 129 константино- ... Список простой. польских 1809 г. патриархов Б1 Собственные -5500 г. <<поколе- 218 15500 5000 имена упо- или ние>> минаемые -4000 г. (по Список кратный. в Библии ... [5epr3-6]) II в. до н. э. Б2 Стихи Библии -5500 г. <<поколе- 218 22000 5200 с отождест- или ние>> влением па- -4000 г. (по Список кратный. раллельных ... [5epr3-6]) мест II в. до н. э. АК Имена 50 г. 10 лет 175 391 215 католикосов ... Список простой. Армении 1800 г. 3. СРЕДНИЙ ВОЗРАСТ ИМЕНИ В ХРОНОЛОГИЧЕСКОМ СПИСКЕ 3. 1. ОПРЕДЕЛЕНИЕ ВОЗРАСТА Разбиение хронологического списка имен на главы позволяет определить для каждого имени числовую характеристику, которую мы назовем ВОЗРАСТОМ данного имени (как элемента хронологического списка). Эта характеристика оказывается очень полезной на первоначальном этапе исследования <<внутренней>> хронологии списка имен. ОПРЕДЕЛЕНИЕ. ВОЗРАСТОМ ИМЕНИ в хронологическом списке Х называется разность номера главы, куда входит данное имя и номера главы, в которой такое же имя встретилось в списке в первый раз ("родилось>>). Возраст уникального имени в списке по определению полагается равным нулю. Таким образом, ВОЗРАСТ ИМЕНИ ── это целое неотрицательное число, не превосходящее номера главы, куда входит данное имя, уменьшенного на единицу (поскольку самые <<старые>> имена это те, которые родились в первой главе). Значение возраста показывет, сколько глав-поколений прошло с момента первого появления такого же имени в списке. ОПРЕДЕЛЕНИЕ. Имя в хронологическом списке будем называть СТАРЫМ ИМЕНЕМ, если его возраст больше нуля. СТАРЫЕ ИМЕНА (элементы списка) ── это такие имена, которые УЖЕ ВСТРЕЧАЛИСЬ в каких-то предыдущих главах списка. ОПРЕДЕЛЕНИЕ. СРЕДНИМ ВОЗРАСТОМ ИМЕНИ в i-той главе Х списка Х назовем i сумму возрастов всех имен данной главы, деленную на общее количество имен в главе (с учетом повторных вхождений). Аналогично, СРЕДНИМ ВОЗРАСТОМ СТАРОГО ИМЕНИ в главе Х назовем i сумму возрастов всех старых имен главы Х, деленную на количество i этих имен. Если данная глава не содержит имен (старых имен), то средний возраст имени (старого имени) в ней по определению положим равным нулю. Значения СРЕДНЕГО ВОЗРАСТА ИМЕН (или СТАРЫХ ИМЕН) списка Х удобно изображать в виде графика, где по оси абсцисс отложены номера глав, а по оси ординат ── значения среднего возраста для них. Изучение хронологии списка имен с помощью графиков среднего возраста основано на следующих простых соображениях. 3. 2. ПРИНЦИП ЗАТУХАНИЯ ЧАСТОТ И ВОЗРАСТ ИМЕНИ Предположим сначала, что рассматриваемый список имен Х - ПРАВИЛЬНЫЙ, и в нем, СОГЛАСНО ПРИНЦИПУ ЗАТУХАНИЯ ЧАСТОТ происходит естественная смена имен ── новые имена возникают, а старые постепенно забываются. Кроме того, как правило, в хронологических списках присутствует небольшая доля имен, которые употребляются на протяжении всего списка или в значительных его частях. Такие (используемые глобально) имена назовем <<ВЕЧНЫМИ>> в отличие от <<ОБЫЧНЫХ>> (локально используемых) имен. Конечно, в реальных хрониках содержатся и имена, занимающие промежуточное положение между <<обычными>> и <<вечными>>, но сейчас, для простоты рассуждений, мы не будем о них говорить. Из принципа затухания частот следует, что ВОЗРАСТ <<ОБЫЧНЫХ>> ИМЕН СПИСКА ДОЛЖЕН СОХРАНЯТЬ ПРИБЛИЗИТЕЛЬНО ПОСТОЯННОЕ ЗНАЧЕНИЕ (со случайным разбросом около него) во всех главах, кроме самых первых глав списка. ВОЗРАСТ ЖЕ <<ВЕЧНЫХ>> ИМЕН ПОСТОЯННО РАСТЕТ СО ВРЕМЕНЕМ (ПО ЛИНЕЙНОМУ ЗАКОНУ). Суммируя эти замечания, можно высказать следующую гипотезу: ПРОЦЕСС ЭВОЛЮЦИИ ВОЗРАСТА ИМЕН В ПРАВИЛЬНОМ ХРОНОЛОГИЧЕСКОМ СПИСКЕ ДОЛЖЕН БЫТЬ СТАЦИОНАРНЫМ, ВОЗМОЖНО, ПОСЛЕ ВЫЧИТАНИЯ НЕКОТОРОЙ ЛИНЕЙНОЙ ФУНКЦИИ. ДЛЯ ТАКОГО ПРОЦЕССА ДОЛЖНА ХОРОШО РАБОТАТЬ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ. 3. 3. ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА ГИПОТЕЗЫ Гипотеза требует экспериментальной проверки на реальном достоверном материале. Она была проверена авторами на историческом материале XIV-XX вв. ГИПОТЕЗА ПОДТВЕРДИЛАСЬ. ОКАЗАЛОСЬ, ЧТО ВОЗРАСТ ИМЕН В ПРАВИЛЬНЫХ ХРОНОЛОГИЧЕСКИХ СПИСКАХ ДЕЙСТВИТЕЛЬНО ВЕДЕТ СЕБЯ В СООТВЕТСТВИИ С ТЕОРЕТИЧЕСКОЙ МОДЕЛЬЮ. Характерный коэффициент наклона линии регресии для правильных списков, охватывающих промежуток времени 300-400 лет составляет 0, 2 ── 0, 3. Таким образом, около четверти имен в них ── долгоживущие и около трех четвертей ── короткоживущие. 3. 4. МЕТОД ПРОВЕРКИ ПРАВИЛЬНОСТИ ХРОНОЛОГИЧЕСКОГО СПИСКА ИМЕН Сказанное позволяет предложить следующую формальную методику проверки правильности хронологических списков имен. 1) По данному списку строится реализация процесса возраста имен. 2) Для этой реализации проверяется гипотеза о стационарности процесса (отсутствии разладок). Если эта гипотеза в результате применения математико-статистической процедуры ОТВЕРГАЕТСЯ, данный список, по всей видимости, НЕ ЯВЛЯЕТСЯ ПРАВИЛЬНЫМ. Предположим теперь, что список имен Х содержит только одну, <<идеальную>> серию дубликатов ── две в точности повторяющие друг друга последовательности глав (рис.5e6). Тогда средний возраст имен во второй из этих последователльностей будет равен расстоянию между этими последовательностями в списке (рис.5e7). На графике среднего возраста имен возникает в этом случае характерная <<полка>>, высота которой соответствует расстоянию между дубликатами в серии ("сдвигу>> в серии) ── см. рис.5e7. (Особенно ярко такие полки выделяются на графиках среднего возраста старого имени. Ниже мы приведем некоторые примеры.) Если список имен Х содержит не ОДНУ, а НЕСКОЛЬКО серий дублирующих друг друга глав, на графике среднего возраста имен возникают полки РАЗЛИЧНОГО УРОВНЯ. По высоте этих полок можно судить о сдвигах между дубликатами в списке. 3. 5. МЕТОД ОБНАРУЖЕНИЯ ДУБЛИКАТОВ В ХРОНОЛОГИЧЕСКОМ СПИСКЕ ИМЕН В том случае, если для рассматриваемого списка Х графики среднего возраста имени и среднего возраста старого имени распадаются на серию <<полок>>, будем говорить, что в списке имен Х содержатся СТАТИСТИЧЕСКИЕ ДУБЛИКАТЫ. Их можно явно указать, пользуясь тем, что величины среднего возраста старых имен в главах списка позволяют найти (приблизительно) расстояния до прежде появившихся дубликатов этих глав. Качественное изучение графика среднего возраста в хронологических списках имен позволяет также определить места скрытой <<сшивки>> (места стыков) хроник в дошедших до нас хронологических компиляциях (<<современном учебнике>> по истории). Отметим, что в современном <<гладком>> изложении места этих сшивок (стыков) УЖЕ НЕ ВИДНЫ ── над ним поработало несколько поколений историков. Однако часто оказывается, что в местах таких сшивок процесс возраста имен (старых имен) скачком меняет свои параметры. Это СКАЧКООБРАЗНОЕ изменение легко улавливается даже <<на глаз>>, при качественном анализе графиков среднего возраста (см. примеры ниже). 3. 6. ВОЗРАСТ ИМЕН В БИБЛИИ 3. 6. 1. ГРАФИК СРЕДНЕГО ВОЗРАСТА ИМЕН В БИБЛИИ ПРИМЕР 7. График среднего возраста имен В СПИСКЕ ИМЕН БИБЛИИ (собственные имена в Библии). График показан на рис.5e8-а. По горизонтальной оси отложены номера глав-поколений, а также отмечены дубликаты серии Т, обнаруженные А. Т. Фоменко в [5epr3-6]. (В предыдущих публикациях эти дубликаты обозначались МТ). График СРЕДНЕГО ВОЗРАСТА СТАРОГО ИМЕНИ В СПИСКЕ ИМЕН БИБЛИИ полностью аналогичен графику СРЕДНЕГО ВОЗРАСТА ИМЕН в нем. На рис.5e8б приведен график СРЕДНЕГО ВОЗРАСТА СТАРОГО ИМЕНИ в списке имен Библии, усредненный по текущему отрезку длины 4 (то есть в каждой точке i значение функции f(i) заменено на среднее [f(i)+f(i+1)+f(i+2)+f(i+3)]/4 ). Хорошо видно, что график распадается НА СЕРИЮ ПОЛОК, причем дубликаты Т-серии как правило попадают на границы между полками. Это прекрасно согласуется с результатами А. Т. Фоменко [5epr3-18], согласно которым короткие дубликаты Т-серии разделяют в современном учебнике (который, кстати, очень сильно зависит от Библии) дублирующие друг друга длинные хроники. 3. 6. 2. ПРОВЕРКА МЕТОДА НА ХОРОШО ИЗВЕСТНЫХ ДУБЛИКАТАХ В БИБЛИИ Укажем например, как проявляется на рис.5e8 ХОРОШО ИЗВЕСТНАЯ серия дубликатов в Библии: I-IV кн. Царств и I-II кн. Паралипоменон. Этим частям Библии соответствуют главы-поколения с номерами 98-137 (для I-IV Царств) и 138-167 (для I-II Паралипоменон). На рис.5e8 соответствующие отрезки списка имен четко выделены полками на графике, разность уровней которых равняется величине сдвига между указанными дубликатами (он равен приблизительно 35 главам). Точно так же, рис.5e8 показывает, что последовательность глав-поколений с номерами 169-195 (книги Пророков) является статистическим дубликатом: частично ── глав 99-113 (I-III Царств), а частично ── глав 79-97 (кн. Судей). Это ── ТОЖЕ ИЗВЕСТНЫЙ РЕЗУЛЬТАТ: в книгах Пророков описываются события одновременные с теми, что описаны в библейской хронике I-IV Царств или же в книге Судей. 3. 6. 3. НЕОЖИДАННОЕ ОТКРЫТИЕ РАНЕЕ НЕИЗВЕСТНЫХ ДУБЛИКАТОВ В БИБЛИИ НЕОЖИДАННЫМ с точки зрения <<современного учебника истории>> является ярко выраженный <<шов>> (разладка процесса) в начале книги IV Царств, а также статистическое наложение на хронику I-III Царств глав-поколений с номерами 74-91 (IV Царств, начиная с глав, посвященных пророку Елисею) и глав-поколений с номерами 196-218 (Новый Завет). Согласно этим наложениям, ВСЕ СОБЫТИЯ, описанные в Библии начиная с книг Царств, как в Ветхом, так и в Новом Заветах, находятся В ТЕХ ЖЕ ВРЕМЕННЫХ ГРАНИЦАХ, что и события книг I-IV (или даже I-III) Царств. Другими словами, КНИГИ I-IV ЦАРСТВ ОХВАТЫВАЮТ ВСЮ БИБЛЕЙСКУЮ ИСТОРИЧЕСКУЮ ЭПОХУ (НО, РАЗУМЕЕТСЯ, НЕ ВСЕ СОБЫТИЯ, ОПИСАННЫЕ В БИБЛИИ), А НЕ МАЛУЮ ЧАСТЬ ЕЕ, КАК ЭТО ПРИНЯТО СЧИТАТЬ СЕГОДНЯ. Этот результат ИДЕАЛЬНО согласуется с результатами А. Т. Фоменко, полученными совсем другими методами [5epr3-18]. 3. 6. 4. БИБЛЕЙСКАЯ ИСТОРИЯ СПРЕССОВЫВАЕТСЯ В КОРОТКИЙ ИНТЕРВАЛ ВРЕМЕНИ На рис.5e9 приведен вид квадратной матрицы {К}, построенной по списку имен Библии. Жирными точками выделены клетки матрицы, содержащие локальные максимумы в отдельных строках. Паре известных ранее дубликатов (I-IV Царств) = (I-II Паралипоменон) соответствует сплошной жирный отрезок, параллельный главной диагонали. Рис.5e9 также говорит о том, что ОСНОВНАЯ МАССА БИБЛЕЙСКИХ СОБЫТИЙ ПРИ ФОРМАЛЬНОЙ ИХ ДАТИРОВКЕ ДОЛЖНА БЫТЬ ОТНЕСЕНА К ХРОНОЛОГИЧЕСКОМУ ПРОМЕЖУТКУ, ОХВАТЫВАЕМОМУ КНИГАМИ I-IV ЦАРСТВ, ПРИЧЕМ В ОСНОВНОМ ── К НАЧАЛУ И К КОНЦУ ЭТОГО ПРОМЕЖУТКА. 3. 7. ВОЗРАСТ ИМЕН В СПИСКЕ ВИЗАНТИЙСКИХ ПАТРИАРХОВ. ТРАДИЦИОННАЯ ХРОНОЛОГИЯ ЭТОГО СПИСКА НЕВЕРНА ПРИМЕР 8. Графики среднего возраста имени в списке ВП ИМЕН ВИЗАНТИЙСКИХ (КОНСТАНТИНОПОЛЬСКИХ) ПАТРИАРХОВ и в отдельных частях этого списка. См. рис.5e10-а, рис.5e10-б, рис.5e10-в. На рис.5e10-а представлен график среднего возраста в полном списке ВП. График сглажен по <<текущему>> отрезку длиной в 6 глав (= 60 лет). Очень хорошо выделяется скачкообразное изменение параметров процесса приблизительно в 950 г. н. э. Заметна также разладка (скачок параметров) процесса приблизительно в 1550 г. В это время создавалась всеобщая хронология и по-видимому в связи с этим возникало стремление использовать древние имена. На графике это отразилось в виде резкого массивного всплеска среднего возраста около 1550 г., который со временем постепенно стал затухать. ВЫВОД: В <<СОВРЕМЕННОМ УЧЕБНИКЕ>> ПО ИСТОРИИ ВИЗАНТИИ ГДЕ-ТО В СЕРЕДИНЕ X ВЕКА ПРОХОДИТ <<ШОВ>> (СТЫК) МЕЖДУ ДВУМЯ КРУПНЫМИ ХРОНИКАМИ-КОМПИЛЯЦИЯМИ. НАЧАЛО ПЕРВОЙ ИЗ НИХ В <<СОВРЕМЕННОМ УЧЕБНИКЕ>> ОТНЕСЕНО К НАЧАЛУ IV ВЕКА, А НАЧАЛО ВТОРОЙ ── К СЕРЕДИНЕ X ВЕКА (ПРИБЛИЗИТЕЛЬНО). На рис.5e10-б представлен график СРЕДНЕГО ВОЗРАСТА ИМЕНИ в урезанном списке имен КОНСТАНТИНОПОЛЬСКИХ ПАТРИАРХОВ. Была взята часть списка в хронологических границах от 980 г. до 1650 г. Заметим, что данный график не является просто частью предыдущего графика, построенного по полному списку. В самом деле, поскольку список был урезан в своем начале, то в нем изменились моменты первого появления имен, а следовательно мог измениться возраст имен в любой главе. График был сглажен аналогично предыдущему текущими средними по отрезку длины 6 (= 60 лет). График на рис.5e10-б содержит две полки: одну на интервале времени 1000-1250 гг., а другую ── на интервале 1300-1550 гг. (временные границы приблизительные). На первой из них значение среднего возраста составляет около 50 лет, на второй ── 100-150 лет. На стыке этих полок параметры процесса меняются скачком. ТАКИМ ОБРАЗОМ В ИСТОРИИ ВИЗАНТИИ ТАКЖЕ ОБНАРУЖИВАЕТСЯ РАЗРЫВ (СШИВКА РАЗНОРОДНЫХ ХРОНИК) ГДЕ-ТО В ПЕРВОЙ ПОЛОВИНЕ XIII ВЕКА. Это вполне естественно, поскольку в 1204-1261 гг., после завоевания в 1204 г. Константинополя крестоносцами, столица империи находилась в Никее (не в Константинополе), а вся обстановка в империи резко изменилась. Рис.5e10-б показывает, что последующими компиляторами были <<сшиты>> две крупные хроники ── одну из них они отнесли к до-никейской эпохе, другую ── к никейской и последующей эпохам. Еще одна <<сшивка>> на этом графике, так же как и на предыдущем, указывает на время составления окончательной хронологической версии европейской истории (эта версия оформилась около 1550 г.). Наконец, на рис.5e10-в представлен график среднего возраста имен в части списка ВП, относящейся к 1250-1800 гг. В этой части списка наша методика никаких дубликатов не обнаруживает. График имеет теоретический вид, характерный для правильных списков имен. 3. 8. ВОЗРАСТ ИМЕН В СПИСКЕ ЗАПАДНО-РИМСКИХ ИМПЕРАТОРОВ. ТРАДИЦИОННАЯ ХРОНОЛОГИЯ ЭТОГО СПИСКА НЕВЕРНА ПРИМЕР 9. График среднего возраста в списке имен императоров Западной Римской империи, разбитом на главы по 40 лет. См. рис 11. Список имен римских императоров имеет два пробела ── периоды античной и средневековой римских республик. В тех главах списка, которые папали в эти периоды, нет имен императоров ── эти главы пустые. На рис.5e11 изображен также график среднеквадратичного отклонения возраста старых имен в главе. Это отклонение подсчитывалось по формуле: ────────────── ┌ ─ - / \ВS\А (s ── s) v = i / ──────────── / k ┤ s где суммирование производится по возрастам s всех старых имен i - данной главы. Через s обозначен средний возраст старых имен, а через k ── число старых имен в данной главе. s График среднего возраста старого имени в списке имен римских императоров содержит ХОРОШО ЗАМЕТНУЮ <<ПОЛКУ>> на 900-летнем промежутке времени 750-1650 гг. Высота этой полки колеблется около значений 800-1000 лет и соответствует основным сдвигам в 780 и 1050 лет в истории Европы (см. разложение Глобальной Хронологической Карты в [5epr3-18]). На этой полке выделяется область пологого монотонного спада графика на 250-летнем временном промежутке 1000-1250 гг. В этой области график среднего возраста ведет себя существенно более регулярно, чем в остальных частях <<полки>>. Монотонный спад среднего возраста часто является признаком <<оригинала>>, <<дубликат>> которого , помещен на хронологической шкале раньше своего оригинала и существенно растянут во времени по сравнению с ним. Из-за такого растяжения имена дубликата <<догоняют>> имена оригинала, в результате чего имена оригинала <<молодеют>>, а средний возраст в нем монотонно падает (рис.5e12). Если сместить даты промежутка 1000-1250 гг. в прошлое на соответствующие им величины среднего возраста, то получим, что дубликат этого промежутка в списке имен римских императоров ' находится во временных границах приблизительно 0-650 гг. (Геометрически это смещение является косой проекцией на ось о времени вдоль направляющей, наклоненной к этой оси на 45 ── см рис.5e12.) ТАКИМ ОБРАЗОМ, ПЕРИОД 0-650 ГГ. Н. Э. В СПИСКЕ ИМЕН РИМСКИХ ИМПЕРАТОРОВ ЯВЛЯЕТСЯ РАСТЯНУТЫМ ВО ВРЕМЕНИ СТАТИСТИЧЕСКИМ ДУБЛИКАТОМ ПЕРИОДА 1000-1250 ГГ. Вывод справедлив в рамках данной модели. 4. МЕХАНИЗМ ВОЗНИКНОВЕНИЯ ДУБЛИКАТОВ В ИСТОРИИ. МОДЕЛЬНАЯ ЗАДАЧА С ТАСОВАНИЕМ КОЛОДЫ КАРТ 4. 1. ТАСОВАНИЕ КОЛОДЫ КАРТ Прежде, чем перейти к более сложным моделям распределения имен в больших хрониках и к методикам, основанным на этих моделях, попробуем разобраться в самом механизме возникновения дубликатов в хронологии (с формальной точки зрения). При этом, мы будем опираться на результаты А. Т. Фоменко, вскрывающие <<внутреннее строение>> принятой сегодня скалигеровской версии хронологии. В итоге, механизм возникновения дубликатов в хронологии будет смоделирован нами на простом, но весьма полезном формальном примере с ТАСОВАНИЕМ КОЛОДЫ КАРТ. Использование этого примера облегчает понимание достаточно сложных статистических моделей, рассматриваемых в главах 2 и 3. 4. 2. КАК МОГ ВОЗНИКНУТЬ СОВРЕМЕННЫЙ УЧЕБНИК ПО ИСТОРИИ. ХРОНОЛОГИЧЕСКИЕ СДВИГИ Зададимся естественным вопросом: как возник <<современный учебник>> по истории? Известно, что он является результатом длинного ряда компиляций. В процессе каждой из них историк-компилятор сопоставлял, отождествлял и <<сшивал>> имеющиеся в его распоряжении компиляции его предшественников. А также, возможно, привносил какие-то новые данные о современных ему событиях. Такая работа велась параллельно многими историками (возможно, несколькими школами историков и хронологов). Поэтому длинные хроники, описывающие один и тот же период времени могли появляться (и появлялись) сразу в нескольких, вообще говоря отличных друг от друга вариантах. Эти варианты отличались по языку, позиции автора, выбору собственных имен для обозначения персонажей и т. п. Отличия могли быть настолько сильными, что при содержательном восприятии текста уже невозможно было определить, что речь идет по сути дела об одних и тех же (или одновременных) событиях. При последующий компиляциях и согласованиях источников такие различия могли привести к значительным хронологическим ошибкам, перекосам. Исследования А. Т. Фоменко [5epr3-18] показали, что на последнем этапе формирования <<современного учебника>> по истории, во время компиляций XV-XVI веков, по-видимому произошло следующее: 1) НЕСКОЛЬКО крупных хроник-компиляций, описывавших приблизительно ОДИН И ТОТ ЖЕ исторический период времени (X-XIII вв. и XIII-XVI вв.), но существенно разнящихся по своему виду (скажем, выполненных в различных историко-хронологических традициях), ── были восприняты при итоговой компиляции как РАЗЛИЧНЫЕ хроники, описывающие различные эпохи и события и были СДВИНУТЫ В ПРОШЛОЕ, создав там <<искусственное освещение>> - ОТРАЖЕНИЕ более поздних средневековых событий. 2) Эти хроники были <<сшиты>> в итоговой компиляции НЕПРАВИЛЬНО, в результате чего полученный <<современный учебник>> по истории ИСКУССТВЕННО УДЛИНИЛСЯ, РАСТЯНУЛСЯ ВО ВРЕМЕНИ (рис.5e13). 3) В результате в <<современном учебнике>> появились длинные СЕРИИ ДУБЛИКАТОВ, сдвинутых друг относительно друга и иногда <<наползающих>> друг на друга. Итоговая картина получилась очень сложной и <<на глаз>>, при содержательном чтении <<учебника>>, она не воспринимается. Формальными методами А. Т. Фоменко обнаружено, что основные сдвиги между наиболее массивными слоями дубликатов в <<современном учебнике>> составляют приблизительно 330, 720, 1050 и 1800 лет (см. [5epr3-18]). Однако в хронологии присутствует и множество других, менее значительных сдвигов, спектр которых практически покрывает весь 2000-летний отрезок числовой оси (и это очень сильно осложняет итоговую картину). Итак, ПОДРОБНАЯ структура хронологии <<современного учебника>> достаточно сложна. И усложнена она тем, что дубликаты <<наползают>> друг на друга и описание той или иной хронологической эпохи является зачастую смесью описаний сразу нескольких других, более поздних эпох. По-видимому, был какой-то момент в истории, когда средневековые хронологи впервые <<потеряли опору>> в своих представлениях о глобальной хронологии и после этого они, сами того не понимая, начали <<тасовать>>, перемешивать хронологические слои, в результате чего хронология <<современного учебника>> приобрела СЛОЖНУЮ СЛОИСТУЮ СТРУКТУРУ (рис.5e14). Тем не менее, В ОБЩИХ ЧЕРТАХ, структура хронологии <<современного учебника>> оказывается достаточно простой. Грубо говоря, <<СОВРЕМЕННЫЙ УЧЕБНИК>> ЯВЛЯЕТСЯ СУММОЙ НЕСКОЛЬКИХ ДЛИННЫХ ХРОНИК-ДУБЛИКАТОВ, ОПИСЫВАЮЩИХ ПРИМЕРНО <<ОДНИ И ТЕ ЖЕ>> СОБЫТИЯ. Для создания правильной хронологии, их следовало бы поместить на оси времени <<параллельно>> (то есть покрыв ими несколько раз один и тот же интервал времени). Однако, средневековые хронологи (константинопольская школа хронологов XIV века, следы деятельности которой содержатся в предисловии к известному <<Собранию святоотеческих правил>> Матфея Властаря, а впоследствии и западно-европейская хронологическая школа ── Скалигер, Петавиус и другие) ошиблись и совместили их со значительными сдвигами, искусственно растянув тем самым описываемый исторический период во времени (см. разложение ГХК [5epr3-18]). 4. 3. ВОЗНИКНОВЕНИЕ НЕВЕРНОЙ ХРОНОЛОГИИ ПОХОЖЕ НА ТАСОВАНИЕ КОЛОДЫ КАРТ Итак, из-за неправильного согласования хроник при компиляции их совмещают со сдвигом, создавая при этом фиктивные исторические эпохи ── см. рис.5e15. Механизм возникновения такой структуры напоминает тасование колоды карт, когда одна часть колоды с некоторым смещением <<вдвигается>> в другую (рис.5e16). Пользуясь этой аналогией, мы сформулируем следующую модельную задачу о тасовании пачки одинаковых колод карт. 4. 4. МОДЕЛЬНАЯ ЗАДАЧА С НЕСКОЛЬКИМИ КОЛОДАМИ КАРТ Предположим, что вначале имелось несколько совершенно одинаковых по составу и порядку колод карт, которые затем сложили подряд в одну общую большую колоду и перетасовали ее <<блоками>> (рис.5e17). ЗАДАЧА СОСТОИТ В ТОМ, ЧТОБЫ ЗНАЯ СОСТАВ И ПОРЯДОК КАРТ В ПЕРЕТАСОВАННОЙ БОЛЬШОЙ КОЛОДЕ, ВОССТАНОВИТЬ (ХОТЯ БЫ ПРИБЛИЗИТЕЛЬНО) СОСТАВ И ПОРЯДОК В ИСХОДНЫХ МАЛЫХ КОЛОДАХ. Ясно, что поскольку тасование ── это случайная процедура, то поставленная задача не может иметь однозначного (детерминированного) ответа. Оказывается, что ее можно все же попытаться решить вероятностными методами. Естественный путь к такому решению состоит в исследовании похожих друг на друга кусков (отрезков) перетасованной большой колоды. В самом деле, рассмотрим некий отрезок (кусок) большой колоды и зададимся вопросом: насколько этот кусок был искажен при тасовании? Легко понять, что чем больше найдется в перетасованной колоде кусков, ПОХОЖИХ НА ДАННЫЙ, тем с большим основанием можно утверждать, что этот отрезок колоды не изменился (или слабо изменился) при тасовании. Но отрезок большой колоды, не изменившийся при тасовании, является, очевидно, также отрезком одного из экземпляров исходной малой колоды. Накопив информацию о большом количестве таких неискаженных кусков, мы сможем восстановить структуру исходных колод <<по частям>>. Это ── общая идея, которая лежит в основе методов, излагаемых ниже, в главах 2 и 3. 4. 5. КАК НАЙТИ ВЕЛИЧИНЫ ХРОНОЛОГИЧЕСКИХ СДВИГОВ Более простой задачей является определение не самой исходной структуры малых колод, а лишь ВЕЛИЧИН СДВИГОВ между этими колодами в большой колоде (рис.5e17). Идея решения этой задачи состоит в следующем. Предположим, что два экземпляра исходной малой колоды сдвинуты в большой колоде на величину \ВД\А (то есть между соответствующими картами этих колод расположено приблизительно \ВД карт в большой колоде). Это означает, что в большой колоде имеется очень много одинаковых (или похожих друг на друга, если допустить возможность искажений) кусков, <<разнесенных>> в ней на величину \ВД\А (карт). И обратно, если обнаружится, что в большой колоде содержится НЕОБЫЧНО МНОГО ПОХОЖИХ ДРУГ НА ДРУГА КУСКОВ, которые разнесены друг от друга на некоторую величину \ВД\А, то это означает, что \ВД по-видимому является величиной сдвига между двумя экземплярами малых исходных колод, распределенных в большой колоде. Величины таких <<НЕОБЫЧНО ЧАСТЫХ>> разнесений можно определить исследуя частоты появления различных значений разнесения между похожими друг на друга отрезками большой колоды. Для этого строятся графики зависимости количества подобных разнесений от величины разнесения ("гистограммы частот разнесений>>). В случае, когда какое-либо значение разнесения между похожими кусками в большой колоде встречается НЕОБЫЧНО ЧАСТО, такой график будет делать <<всплеск>> (резко выраженный локальный максимум) на этом значении. Простейший отрезок колоды ── это две последовательно расположенные в ней карты. (Такие карты мы в дальнейшем будем называть КАРТАМИ-СОСЕДЯМИ.) Если имеющаяся в нашем распоряжении большая колода действительно была получена с помощью описанного выше механизма <<блочного тасования>> из нескольких одинаковых малых колод, то многие из карт-соседей в ней БЫЛИ СОСЕДЯМИ И В ИСХОДНЫХ МАЛЫХ КОЛОДАХ. Конечно, в ходе тасования появятся и новые <<ложные>> пары карт-соседей. Но все же доля <<истинных>> (исходных) соседей среди всех пар карт-соседей большой колоды будет значительной. Для нас важно, что эта доля будет оказывать существенное влияние на статистический характер распределения подобных пар в большой колоде. При этом, <<ложные>> соседи создадут, естественно, некоторый <<случайный шум>>, смазывающий картину распределения в колоде <<истинных>> соседей. Однако систематическую часть этого шума удается скомпенсировать, а случайная оказывается невелика в реальных примерах (см. ниже). Используя описанную модельную задачу, перейдем к неформальному описанию методик статистического анализа хронологических списков. 4. 6. МЕТОД ГИСТОГРАММ ЧАСТОТ РАЗНЕСЕНИЯ СВЯЗАННЫХ ИМЕН. ОПРЕДЕЛЯЕТ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ДУБЛИКАТАМИ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на модельном примере изложим идею и основные шаги методики. На формальном уровне она изложена в главе 2. Обозначим буквой К большую перетасованную колоду карт, описанную выше. Наша задача ── ОПРЕДЕЛИТЬ ВЕЛИЧИНЫ СДВИГОВ МЕЖДУ ЭКЗЕМПЛЯРАМИ МАЛЫХ ИСХОДНЫХ КОЛОД В К. Пусть к к ── некая пара последовательных карт в К (то есть к и 1 2 1 к ── соседи). Предположим, что к и к ── <<истинные>> соседи, то есть 2 1 2 они были соседями также и в исходных малых колодах, до тасования. Тогда пары вида к к, разбросанные по колоде К, будут отмечать в 1 2 ней положения своих малых колод (откуда они пришли). Сдедовательно, расстояния (разнесения) между такими парами будут равны сдвигам (разнесениям) между экземплярами малых колод в К. Это ── идеальная ситуация. В реальности, конечно, по экземплярам одной только пары к к в колоде К судить о сдвигах 1 2 между дубликатами (малыми колодами) в К нельзя, даже если сама пара к к ── <<истинная>>. В самом деле некоторые экземпляры этой 1 2 пары могут случайным образом быть разбиты при тасовании и информация о соответствущем сдвиге в этом случае потеряется. С другой стороны, среди экземпляров пары к к могут 1 2 встретиться и <<ложные>>, случайно возникшие при тасовании, и в этом случае мы зарегистрируем ложный сдвиг. Кроме того, мы заранее не знаем ── <<истиная>> ли данная пара карт-соседей в К или нет. Поэтому поступим следующим образом. Чтобы исключить потерю информации при случайном разбиении пар к к в ходе тасования, 1 2 будем рассматривать карты к и к в колоде К по отдельности. 1 2 Итак, ПОДСЧИТАЕМ РАССТОЯНИЯ МЕЖДУ ВСЕМИ ПАРАМИ КАРТ В К, ПРИ УСЛОВИИ ОДНАКО, ЧТО ХОТЯ БЫ В ОДНОМ МЕСТЕ КОЛОДЫ К ЭТИ (ТАКИЕ ЖЕ) КАРТЫ ВСЕ ЖЕ СТОЯТ РЯДОМ (ЯВЛЯЮТСЯ СОСЕДЯМИ). В чем смысл этого условия? Оно позволяет выделить такую совокупность пар карт, в которой <<истинные>> карты-соседи составляют заметную долю. В самом деле, пусть к к ── <<истинная>> 1 2 пара карт-соседей. Поскольку все исходные малые колоды были до тасования одинаковы, то эта пара существовала перед тасованием в N экземплярах (где N ── число исходных малых колод). Чтобы данная пара карт НЕ ПОПАЛА в нашу совокупность, необходимо, чтобы ВСЕ N экземпляров этой пары были разъединены при тасовании. Вероятность этого события МАЛА. С другой стороны, для <<ложной>> пары карт-соседей условием ПОПАДАНИЯ в указанную совокупность является случайная встреча этих карт при тасовании, что при неполном <<блочном>> тасовании ТАКЖЕ МАЛОВЕРОЯТНО. Таким образом, большинство <<ИСТИННЫХ>> пар карт-соседей ПОПАДУТ в нашу совокупность, а большинство <<ЛОЖНЫХ>> ── НЕ ПОПАДУТ в нее. В итоге, существенную часть этой совокупности составят <<истинные>> пары карт-соседей. Рассмотрев все пары карт, которые где-либо в К оказались соседями, и вычислив для каждой такой пары значение разнесения (то есть количество карт, разделяющих эту пару в колоде К), мы получим набор целых чисел ── значений разнесения между соседями в К. По этому набору построим график ── ГИСТОГРАММУ ЧАСТОТ РАЗНЕСЕНИЙ КАРТ-СОСЕДЕЙ следующим образом. Отложим по горизонтальной оси все возможные значения разнесений между картами в колоде К (ясно, что разнесения не могут превосходить длины К), а по вертикальной оси ── частоту, с которой данное значение встречается в наборе разнесений. По такой гистограмме легко выделяются <<необычно>> частые значения разнесений: на местах таких значений гистограмма имеет ярко выраженный локальный максимум (всплеск). Например, если гистограмма частот разнесений карт-соседей имеет вид как на рис.5e18, то существует два <<необычно частых>> значения разнесений: р и р. 1 2 Если <<необычно>> частых значений разнесения между картами-соседями в колоде К нет, то соответствующая гистограмма ВООБЩЕ НЕ БУДЕТ СОДЕРЖАТЬ ВСПЛЕСКОВ (доказательство см. в главе 2). В ЭТОМ СЛУЧАЕ СЛЕДУЕТ ПРЕДПОЛОЖИТЬ, ЧТО ДУБЛИКАТОВ ОПИСАННОГО ВЫШЕ ТИПА В КОЛОДЕ К НЕТ. В противном случае, дубликаты по-видимому имеется и их следует проанализировать. Сдвиги между дубликатами (исходными колодами) в этой структуре определяются как значения, на которых гистограмма делает всплески. 4. 7. МЕТОД ПОСТРОЕНИЯ МАТРИЦ СВЯЗЕЙ. ПРЕДНАЗНАЧЕН ДЛЯ ПОИСКА ДУБЛИКАТОВ В ХРОНОЛОГИЧЕСКИХ СПИСКАХ Здесь мы на приведенном выше модельном примере изложим лишь ОБЩУЮ ИДЕЮ методики. Метод был предложена авторами в [5epr3-10]. Подробно он изложена в главе 3. Анализ дубликатов (исходных малых колод) в колоде К можно осуществить на основе следующих простых соображений. Предположим, что имеющаяся в нашем распоряжении колода К была действительно получена описанным выше способом из нескольких экземпляров более короткой (исходной) колоды. Рассмотрим два отрезка А и А колоды К. Будем называть отрезки А и А 1 2 1 2 ДУБЛИКАТАМИ, если они соотвественно содержат карты, которые в экземплярах исходной колоды находились рядом (рис.5e19). Заметим, что при этом может случиться, что отрезки А и А 1 2 вовсе не содержат одинаковых карт и тем не менее, являются дубликатами. Такая ситуация возникает, когда в отрезок А при 1 тасовании попали одни карты из некоторого малого отрезка А исходной колоды, а в отрезок А ── другие карты из того же 2 <<прообраза>> А (рис.5e19). Подобная ситуация возникает и в реальных хронологических списках имен, когда в одном дубликате использованы одни имена, а в другом ── другие имена одних и тех же людей. Однако в любом случае, если А и А ── действительно 1 2 дубликаты, то есть содержат части, восходящие к общему прообразу А в исходной короткой колоде, то среди множества экземпляров их прообраза А, разбросанных при тасовании по колоде К и как-то искаженных при этом, должны встретиться и такие экземпляры, которые содержат как карты, попавшие из А в А, так и карты, 1 попавшие в А (на рис.5e19 такой экземпляр А обведен кружком). 2 Следовательно, в том случае, когда А и А ── дубликаты, 1 2 вероятность встреч карт из А и А где-нибудь в колоде К, БОЛЬШЕ, 1 2 чем аналогичная вероятность в случае, когда А и А дубликатами 1 2 не являются (естественно, имеются в виду не сами экземпляры карт из А и А, а такие же карты). 1 2 В самом деле, в первом случае действует описанный механизм, объединяющий карты из А и А в колоде К, а во втором ── это 1 2 объединение может произойти лишь чисто случайным образом. Приведенные соображения позволяют предложить методику, разделяющую всевозможные пары отрезков А и А колоды К на два 1 2 множества: множество пар-дубликатов (в статистическом смысле) и множество <<независимых>> пар. Эта методика требует значительного объема вычислений на ЭВМ. При применении к хронологическим спискам имен ее результатом является так называемая МАТРИЦА СВЯЗЕЙ списка, дающая его разложение на систему дублирующих друг друга <<слоев>>. Методика была впервые предложена авторами в [5epr3-11]. Подробное изложение метода см. в главе 3.