Введение
Несмотря на огромный поток работ, посвященных изучению механизмов фиксации информации, эта проблема до сих пор остается terra incognito. Сторонники теории консолидации [1] считают, что информация может поступать в долговременное хранилище только после селекции, в то время как представители концепции сплошной записи [9] считают, что для запечатления предварительной селекции информации не требуется. Опираясь на импринтинговую концепцию формирования оценочного аппарата функциональной системы [10], мы решили рассмотреть эту проблему в рамках системно-информационного подхода [4] на поведенческой модели, позволяющей оперативно изменять в ходе опыта объем экспериментального пространства [5]. Хорошо известно, что в незнакомой ситуации все животные, в том числе и мыши, исходно предпочитают побежку по прямой. Если же ситуация не предоставляет такую возможность, то, как было показано ранее [5], первый выполненный маршрутный вариант в пределах 3-х мин знакомства со средой, являющийся обходным по отношению к исходному предпочтению, приобретал черты приобретенного пространственного предпочтения.
Цель исследования — выяснить как отразится на характере становления пищедобывательного поведения неожиданное расширение пространственного объема после предварительного кратковременного знакомства со средой, в которой отсутствовала возможность реализации исходного предпочтения.
Материалы и методы
Работа проводилась на половозрелых самцах мышей линии F1, гибридах первого поколения от DBA/2J и C57BL/6J в возрасте 4 месяцев, которые в многоальтернативной среде должны были сформировать пищедобывательное поведение в условиях свободного выбора. Использовались две конфигурации среды (рис. 1): лабиринт полного (Л-1) и малого (Л-2) объемов, различающиеся тем, что в Л-1 имелись как прямой, так и обходные варианты подхода к подкрепляемым кормушкам, в то время как в Л-1 — только обходные. Были проведены две серии: 1) контроль обучался в Л-1 на протяжении 15-ти опытов (n = 20); 2) опытных мышей предварительно на 1—2 пробы (n = 20) помещали в Л-2, после чего за счет снятия перегородок животные в пределах этого же опыта оказывались в Л-1, где продолжали дальнейшее обучение (15 опытов).
Рисунок 1 — Схема экспериментальной среды
1 — свободное поле (непищевая среда), 2 — лабиринтное поле (пищевая среда); крестик — стартовое положение животного в начале опыта; Вх — вход в лабиринт, Вых — выходы в свободное поле, К — подкрепляющие кормушки, Л — ложные; жирные пунктирные линии — перегородки; синяя сплошная линия — пример минимизированного маршрута, красная пунктирная — типичный вариант у опытного животного.
Во всех случаях животным предлагалось решить проблемную пищедобывательную задачу многократного получения подкрепления в пределах опыта: пища снова будет в тех же кормушках, если после получения подкрепления самопроизвольно без дополнительных стимулов покинуть пищевую среду и вновь зайти в лабиринт (рис. 1). Мыши должны были сформировать пищедобывательное поведение в циклической форме — Вх-К1-К2-Вых-Вх. Длительность опыта составляла 10 минут, межопытный интервал — 24 ч, уровень пищевой депривации — 24 ч.
Анализу подвергались следующие параметры: двигательная активность как число пройденных отсеков (NПР), число реальных (NП) и потенциально возможных подкреплений в опыте (2* NПР), вероятность подкрепления (как отношение NП/ (2* NПР)), поскольку не каждая проба может сопровождаться взятием пищи в двух кормушках, число ошибок (повторных заглядываний в пустые кормушки). Интенсивность исследовательской активности определяли по скорости нарастания ошибок до максимума — d (NMAX-NОП1), а скорость угашения — как d (NMAX-NMIN). Организованность навыка оценивали по доле минимизированных выполнений.
Кроме того, в процессе обучения регистрировали 18 психоэмоциональных реакций, которые по степени выраженности двигательной активности и психоэмоциональному напряжению были объединены в классы: 1 — ориентировочные (нюханье, стойки); 2 — ориентационные (остановки, колебания в развилках); 3 — груминг (умывание, чесание); 4 — двигательная заторможенность (сидение, лежание); 5 — пассивное избегание (замирание, скуление); 6 — смещенные (лизание, грызение предметов); 7 — стрессовые (чихание, отряхивание); 8 — невротические (тики, прыжки, чесотка — навязчивое чесание); 9 — активное избегание (карабканье вверх, выпрыгивание из камеры). Соответствующие классы были объединены в следующие типы: контекстные (1 и 2) и неконтекстные, включающие два подтипа: пассивные (3–5) и активные (6–9). Расчет осуществляли с помощью частотного анализа появления различных реакций в поведении с учетом весовых коэффициентов, которые предварительно были вычислены на основе большого массива данных по формуле Кi=1/Pi где Pi вероятность возникновения реакции [3]. Для анализа маршрутных реализации каждому отсеку лабиринта и зонам в свободном поле присваивался свой знак. Запись поведения животного в опыте представляла собой текст в виде последовательности символов, при анализе которого по показателю вероятности перехода (силы связи) между значимыми элементами Ы, А, Г, Р, и Т определяли момент распознавания животным отдельных звеньев задачи, целостного решения и вероятность их появления в опыте.
Видеорегистрацию и первичное преобразование данных осуществляли с помощью оригинального программного обеспечения: программы Labyrinth (Осипов А. И., Никольская К. А.) и Wood (Бережной Д. С.). Статистическая обработка данных выполнена в программе Microsoft Excel 2003 и Matlab (R2007a) с использованием t-критерия Стьюдента и показателя λ — Колмогорова-Смирнова для оценки кривой распределения.
Результаты и обсуждение
Контроль. Животные контрольной группы справились с предложенной задачей в среднем за 9–10 опытов. При этом познавательная деятельность проходила через пять основных этапов: 1) знакомство с пространственной структурой среды (1–2 опыты; М ± m = 5,1 ± 0,7 проб), 2) выделение значимых элементов (2–4 опыты, М ± m = 9,2 ± 0,8 проб), 3) аналитико-синтетический процесс порождения многообразия вариантов решения задачи (3–9 опыты, М ± m = 9,2 ± 0,8 проб), 4) выбор оптимального решения (9–10 опыты), 5) стабилизация навыка (9–18 опыты).
Проведенные исследования показали, что у всех животных, независимо от индивидуальных особенностей, повышенная двигательная активность, вызванная новизной обстановки, была непродолжительной и к 3-й мин значимо падала (рис. 2).
Рисунок 2 — Динамика двигательной активности в пределах 1-го и 2-го опытов
По горизонтали — опыты, мин. По вертикали — число пройденных отсеков. Синяя сплошная линия — контроль, синяя пунктирная — 2-й опыт, красная сплошная — опытная группа, 1 опыт, красная пунктирная — 2-й опыт; Л1 — лабиринт максимального объема, Л2 — уменьшенный вариант; стрелками показан момент изменения пространственной конфигурации лабиринта (только для опытной группы), вертикальная линия — доверительные интервалы (M ± ?) при р ? 0,05 по критерию t-Student.
В дальнейшем после кратковременного торможения двигательная активность мышей приобретала колебательный характер, 2-х минутная продолжительность возбуждения перемежалась одноминутным торможением. К концу опыта она постепенно стабилизировалась на уровне (М ± m) 56,2 ± 5,4 отсеков/минуту. Уже в 1-м опыте мыши начинали брать подкрепление в обеих кормушках и совершали большое число повторных заглядываний — ошибок (рис. 3А). Фактически, мыши сразу же знакомились с условиями задачи, а именно с тем, что не каждый подход к кормушке сопровождается подкреплением. В этот период в поведении присутствовали преимущественно реакции раздражительного типа (рис. 3) В пределах первого опыта животные практически полностью овладевали пространственной структурой лабиринта (92 ± 5% всех зон), используя инстинктивный кольцевой маршрут Вх-К-Вых.
Рисунок 3 — Динамика психоэмоциональных проявлений при обучении
По вертикали — доля различных классов в общем рисунке психоэмоциональных проявлений: ярко-голубой цвет — ориентационные, бледно-голубой — ориентировочные, зеленый — груминг, черный — двигательная заторможенность, серый — пассивное избегание, желтый — смещённые, оранжевый — стрессовые, красный — невротические. А — 1–2 опыты, Б — стабилизация.
Информационный анализ показал, что, начиная со 2-го опыта, начинался процесс распознавания звеньев структуры предложенной задачи и к 3 опыту отдельные звенья по своей значимости (силе связи) соответствовали местоположению в структуре задачи: РВхК = 0,86 > РК1К2 = 0,67 > РКВых = 0,57 (рис. 4, А).
Рисунок 4 — Динамика распознавания звеньев задач
По горизонтали — опыты, по вертикали — сила связи (вероятность перехода) звеньев задачи, синяя линия — побежка к кормушке при входе в лабиринт ВхК, красная — последовательный переход от одной подкрепляющей кормушке к другой КК, зеленая — подход к выходу после посещения кормушки; А — контроль, Б — опытные мыши, вертикальная линия — доверительные интервалы (M ± ?) при р ? 0,05 по критерию t-Student.
Примечательно, что уже на этом начальном этапе обучения в поведении мышей спонтанно возникала последовательность, соответствующая в будущем структуре минимизированного решения — Вх-К1-К2-Вых, сила связи которой в данный момент была высока (М ± m = 0,72 ± 0,05) при том, что вероятность ее появления в опыте была крайне мала (М ± m = 0,13 ± 0,04). В дальнейшем сила связи данной последовательности падала до РВхККВых = 0,32 ± 0,06 за счет порождения большого числа возможных вариантов решения (общее семантическое разнообразие М ± m = 22,3 ± 3,2 различных вариантов решения) и только к 9-му опыту исходно выделенная последовательность приобретала черты целенаправленного пищедобывательного решения.
Особенность аналитико-синтетического этапа (опыты 4–8) заключалась в том, что в контроле на фоне доминирования исходно инстинктивного маршрутного предпочтения — побежки по прямой — стали возникать кольцеобразные маршрутные структуры, включающие прямой и обходной варианты побежек к кормушкам (Р = 0,43 ± 0,03). Несмотря на большое число ошибок, связанное с посещением пустых кормушек (32,4 ± 0,5), возрастающая семантическая вариабельность (22,3 ± 3,2 различных вариантов) создавала оптимальные условия для выбора лучшего варианта решения задачи. Начиная с 7-го опыта вероятность воспроизведения такой структуры снижалась до Р = 0,23 ± 0,02, и в поведении начинал доминировать вариант, соответствующий структуре пищедобывательного поведения — ВхККВых (Р = 0,57 ± 0,02), составленный исключительно из прямых переходов между всеми значимыми звеньями задачи.
Опытная группа. Как показал анализ двигательной активности и психоэмоциональных реакций, опытные мыши проявили высокую чувствительность к процедуре изменения пространственной конфигурации в ситуации новизны (рис. 2). Обращает на себя внимание, что наиболее выраженный двигательный ответ у опытных мышей возникал не на новизну обстановки, как это наблюдалось в контроле, а на неожиданное изменение пространственной конфигурации лабиринта (? = 1,85; р < 0,01) при повторном заходе в лабиринтное пространство (рис. 2). Причем, во 2-м опыте, несмотря на 24-часовой перерыв, повышенная реакция на произведенное изменение, в отличие от контроля, продолжала сохраняться (рис. 2; ? = 2,62; р < 0,001). На фоне резкого возрастания психоэмоциональных проявлений качественно менялся характер их рисунка: уровень активных проявлений более чем в 2 раза превзошел соответствующие показатели в контроле, и данный эффект сохранялся на протяжении последующих трех опытов (рис. 3, А).
Кратковременная пространственная изменчивость в период запечатления информации серьезно повлияла на характер становления познавательного процесса у опытных животных. Процедура негативно сказалась на исследовательской активности: несмотря на повышенный психоэмоциональный и двигательный фон, уровень ошибок был существенно ниже, при том, что вероятность подкрепления в опыте была у обеих групп исходно высокой.
Рисунок 5 — Показатели вероятности успеха в процессе обучения
По горизонтали — опыты, по вертикали — вероятность успеха как число подкреплений в опыте, отнесенное к общему числу полученных подкреплений и ошибок, синяя линия — контроль, красная — опытная группа; вертикальной линией показаны значения доверительных интервалов (M ± ?) при р ? 0.05 по критерию t-Student.
Именно поэтому уже на начальном этапе (1–4 опыты), в отличие от контроля, значения вероятности успеха оказывались выше (рис. 4). Это предопределило дальнейший ход событий: процесс оценки значения отдельных звеньев задачи крайне затруднен (рис. 4 Б). Сравнительный анализ процесса распознавания 3-звенной структуры задачи — ВхК-КК-КВых показал, что в отличие от контроля, у которого уже к 3-му опыту отдельные звенья по своей значимости (силе связи) соответствовали местоположению в структуре задачи (рис. 4, А), опытные мыши так и не смогли в течение 15 опытов выяснить структуру пищедобывательной задачи (рис. 4 Б). На фоне большого числа ошибок и высокой семантической вариабельности (М ± m = 34,8 ± 3,4) в пределах опыта поведение опытных животных носило во многом ситуационный пищевой, а не пищедобывательных характер, когда решение относительно конкретного действия принималось в зависимости от места, в котором оказывалось животное.
Выбор в пользу минимизированного варианта решения затруднялся за счет навязчивого стремления постоянно объединять два варианта маршрутных предпочтений (прямого и обходного) в структуре своего решения, (например, Вх-К-Вх-КПРКОБХКПРВых). Причем, следует отдельно отметить, что на этапе реализации опытные животные предпринимали отчаянные попытки оптимизировать используемую кольцевую структуру, в основном, за счет уменьшения числа колец, иногда переходя на половинчатые варианты с финальной диагональной пробежкой к противоположному выходу по обходному пути (ВхПРКПРКОБХВых) (рис. 1), за счет чего вероятность подкрепления в опыте была заниженной относительно максимально возможной (М ± m = 0,62 ± 0,03 вместо 0,95± 0,03 в контроле). Резкое возрастание нехарактерных для данной линии пассивных психоэмоциональных проявлений на этапе стабилизации навыка (рис. 3 Б) указывает на значительные когнитивные трудности при попытке оптимизировать решение.
Заключение
Хорошо известно, что при попадании в незнакомую среду в момент максимальной неопределенности, согласно И. П. Павлову [6] все животные демонстрируют рефлекс осторожности, который проявляется либо в виде пассивно-оборонительного поведения либо в виде активной форме. Последнее характерно как для мышей линии BALB/c [2], так и для животных исследуемой линии. Согласно полученным данным реакция на новизну в контроле была непродолжительной, и со второго опыта начинался активный аналитико-синтетический процесс, заканчивающийся формированием пищедобывательного навыка в соответствии с принципом минимума действия.
Совсем другой результат оказался у опытных животных, которые в пределах первых трех минут знакомства с лабиринтом неожиданно столкнулись с тем, что исходно ожидаемая структура среды оказалась измененной. Такие факты, как неадекватно бурная и пролонгированная психоэмоциональная реакция на эту процедуру в сочетании с задавленностью исследовательской активности, завышенные значения успешности на начальном этапе в сочетании с индифферентностью к оценке совершаемых операций, вероятнее всего, были обусловлены именно фактором неожиданного изменения исходной структуры лабиринта в момент запечатления пространственной информации [5]. Ситуационный характер поведения вследствие отсутствия когнитивной динамики, неудачная попытка увязать инстинктивное маршрутное предпочтение с приобретенным в целостное решение дают нам основание предположить, что фактор пространственной нестабильности был зафиксирован наряду с информацией о структуре среды. Иными словами, вышеперечисленные факты позволяют предположить, что каждый раз попадая в лабиринт, животное находилось в ожидании очередного пространственного изменения. Неспособность найти адекватное решение, т. е. построить поведение в соответствии с принципом максимума подкрепления при минимуме действий, сопровождающееся нетипичными для мышей негативными психоэмоциональными проявлениями указывало на наличие когнитивного диссонанса.
Таким образом, полученные в настоящей работе данные свидетельствует о высокой уязвимости когнитивной системы на ранних этапах познавательного процесса. По нашему мнению, константность начальных пространственных условий может рассматриваться как системообразующий фактор, обеспечивающий успешность решения когнитивной задачи, которая не может быть решена в один операционный шаг [7].
Список литературы
- Аткинсон, Р., Шифрин, Р. Человеческая память: система памяти и процессы управления//Психология памяти. ред. Ю. Б. Гиппенрейтер и В. Я. Романова. М.: ЧеРо. 1998. С. 517–546.
- Никольская, К. А., Савоненко, А. В., Осипов, А. И., Ещенко, О. В., Карась, А. Я. Информационная роль инстинкта при организации целенаправленного поведения//Успехи соврем. биологии. 1995. Т.115. В.4. С. 390–396.
- Никольская, К. А. Системно-информационный подход к изучению познавательной деятельности животных//Большой практикум по высш. нервн. деят. и нейрофизиологии: Учебное пособие. М.: Изд-во Линор. 2009. С. 5–31.
- Никольская, К. А Системно-информационные аспекты познавательной деятельности позвоночных животных//Дисс. доктора. биол. наук. — М.: 2010. — 77с.
- Никольская, К. А., Бережной, Д. С. Запоминание информации по типу импринтинга во взрослом состоянии у мышей BALB/c//Росс. физиол. ж. им. И. М. Сеченова. 2011.93 (11): С. 914–922.
- Павлов, И. П. Полное собрание сочинений. М.: АН СССР., 1951 Т. 1., 596 с.
- Рапопорт, Г. Н. Искусственный и биологический интеллекты. М: КомКнига. 2005., 312с.
- Сеченов, И. М. Элементы мысли//Рефлексы головного мозга. СПб: Питер. 2001(1866). С. 3–117.
- Penfield, W. The Mystery of the Mind. New Jersey: Princeton Univ Press. 1975. 123 рр.
- Sudakov, K. V. «Imprints of Reality» in the Systems Mechanisms of Brain Activity//Neuroscience and Behavioral Physiology,. 6, 561–571, 2001