Более подробно о теоретичеких построениях
Онкогены и геном ВИЧ, занимая определенные позиции в трехмерном пространстве хромосом клеток-хозяев, до какого-то времени не проявляют себя как патогенные факторы. В этом смысле поведение ВИЧ в организме инфицированного человека непредсказуемо. Инкубационный период ВИЧ может варьировать от недели до 10 лет. Считается, что есть определенный механизм индуцирования ВИЧ инфекции из латентного «спящего» состояния, но этот механизм не понят, а следовательно, упускается возможность заставить ВИЧ быть «спящим» в организме человека всегда. Организм и клетки их «не замечают» или даже, как в случае онкогенов, используют в благих целях как факторы роста. Почему они воспринимаемы адекватно (правильно) организмом до времени «X» и семантически перерождаются, вызывая управленческую катастрофу в клетках, после времени «X»? Следуя нашей логике, можно думать, что в патологических состояниях, равно как и в норме, работают, как минимум, четыре фактора — «голографичность» и «лингвистичность» генома, его фоновая (контектная) самоорганизация и его квантовая нелокальность.
Эволюция биосистем создала их собственные генетические «тексты» и геном-биокомпьютер как квази-разумный «субъект». Он на своем уровне «читает и понимает» эти тексты. Чрезвычайно важно для обоснования этой элементарной «разумности» генома, что естественные (не существенно на каком языке) человеческие тексты и генетические «тексты» имеют сходные математико-лингвистические и энтропийно-статистические характеристики. Это относится, в частности, к такому понятию как фрактальность распределения плотности частот встречаемости букв (для генетических «текстов» буквы – это нуклеотиды) [13].
Еще одно подтверждение лингвистической трактовки кодовых функций генома получено американскими исследователями [14]. Работая с «кодирующими” и «некодирующими” последовательностями ДНК эукариот (в рамках старых представлений о генах), они пришли к выводу, аналогичному нашему. Он противоречит догме о том, что знаковые функции сосредоточены только в белок-шифрующих участках ДНК. Они применили метод статистического анализа естественных и музыкальных текстов, известный как закон Ципфа-Мандельброта, а также известный постулат избыточности текстовой информации Шеннона, рассчитываемый как энтропия текстов (относительно энтропии текстов и статистики распределения слов в текстах см., например, работы [15-18]). В результате они выяснили, что «некодирующие” районы ДНК (спейсовые, интронные и другие) более схожи с естественными языками, чем «кодирующие”. Исходя из этого, авторы предполагают, что «некодирующие” последовательности генетических молекул являются основой для одного (или более) биологических языков. Кроме того, авторами был разработан статистический алгоритм поиска кодирующих последовательностей ДНК, который выявил, что белок-кодирующие участки обладают существенно меньшими дальнодействующими корреляциями по сравнению с зонами, разделяющими эти участки. Распределение ДНК-последовательностей оказалось настолько сложным, что использованные методы переставали удовлетворительно работать уже на длинах, превышающих интервал от 100 до 10000 пар оснований. Распределение Ципфа-Мандельброта для частот встречаемости «слов” с числом нуклеотидов от 3 до 8 показало большее соответствие естественному языку некодирующих последовательностей относительно кодирующих. Напомним, что кодирование авторы понимают как запись информации об аминокислотной последовательности, и только. И в этом парадокс, заставивший их заявить, что некодирующие регионы ДНК это не просто «junk” (англ. — «мусор”), а языковые структуры, предназначенные для каких-то целей с неясным пока назначением. Дальнодействующие корреляции в этих структурах авторам также не понятны, хотя и обнаружена нарастающая сложность некодирующих последовательностей в эволюции биосистем. И это продемонстрировано на примере семейства генов тяжелой цепи миозина при переходе от эволюционно низких таксонов к высоким. Приведенные данные [14] полностью соответствует нашим идеям, высказанным ранее и независимо [1, 2], о том, что «некодирующие” последовательности ДНК, а это около % генома, являются стратегическим информационным содержанием хромосом. Оно имеет материально-волновую природу и поэтому многомерно и выступает, в сущности, как голографическая ассоциативно-образная и одновременно как семантико-семиотическая программа эмбриологического начала, смыслового продолжения и логического конца любой биосистемы. Интуитивно поняв тупиковость старой модели генетического кодирования, авторы [14] с ностальгической грустью прощаются со старой и хорошо послужившей моделью генетического кода, не предлагая, правда, ничего взамен.
Омонимо-синонимические неоднозначности генетических текстов. Для чего они нужны организму.
Общим фундаментальным семиотико-семантическим свойством естественных и генетических текстов является их синонимии и омонимии. Это обеспечивает для хромосом, также как и для естественных текстов и речи, сверхизбыточность информации, ее многозначность, а поэтому приспособительную гибкость. Многозначность одних и тех же генетических текстов переходит в однозначность вследствие меняющегося положения ДНК-последовательностей в пространстве генома за счет их транспозиций и/или транспозиций соседствующего контекста. Это аналог ситуаций в естественных текстах и речи, когда синонимо-омонимические неоднозначности частей семантического поля снимаются контекстом или «фоном» (см. «фоновый притнцип» [19]).