Как город учится
LTP, LTD, шипики и правило Хебба — где живёт долговременная память
Цели урока
К концу этого урока вы:
- Поймёте, почему память — это не файл, а конфигурация сети, и почему поэтому её нельзя «прочитать» как байты.
- Узнаете правило Хебба в его исходной формулировке 1949 года и в современной молекулярной форме.
- Запустите интерактивный виджет и сами увидите, как синхронные спайки усиливают связь, а асинхронные — ослабляют.
- Разберёте механизм LTP через NMDA-рецептор как «детектор совпадений» и поймёте, почему он идеально подходит под Хебба.
- Узнаете про LTD — обратный механизм точной настройки, который не «забывает», а отчищает шум.
- Услышите кейс H.M. — один из самых важных случаев нейронауки XX века.
- Поймёте, почему backpropagation в нейросетях — это не то же самое, что биологическое обучение, и почему это до сих пор открытая загадка.

О, ты здесь! Отлично — у меня для тебя кое-что есть.
Как город учится
Закройте глаза и вспомните адрес дома, в котором выросли. Запах подъезда. Лицо первого учителя. Где это всё хранится? Если бы это были компьютерные файлы, мы могли бы показать пальцем: вот сектор диска с воспоминанием о бабушке. Но в мозге такого сектора нет.
Память — это не место. Это состояние сети. Точнее: это набор сил связей между миллионами нейронов. Когда вы что-то запоминаете, какие-то синапсы становятся крепче, какие-то слабее. Когда вы вспоминаете — запускается тот же паттерн активности, что был во время запоминания, потому что связи теперь именно так и подкручены. Воспоминание не лежит в нейроне — оно проигрывается сетью.
Что вы возьмёте из этого урока
- Поймёте, почему память — это не файл, а конфигурация сети, и почему поэтому её нельзя «прочитать» как байты.
- Узнаете правило Хебба в его исходной формулировке 1949 года и в современной молекулярной форме.
- Запустите интерактивный виджет и сами увидите, как синхронные спайки усиливают связь, а асинхронные — ослабляют.
- Разберёте механизм LTP через NMDA-рецептор как «детектор совпадений» и поймёте, почему он идеально подходит под Хебба.
- Узнаете про LTD — обратный механизм точной настройки, который не «забывает», а отчищает шум.
- Услышите кейс H.M. — один из самых важных случаев нейронауки XX века.
- Поймёте, почему backpropagation в нейросетях — это не то же самое, что биологическое обучение, и почему это до сих пор открытая загадка.
Что у нас уже есть
Часть 1. Память — это не файл
В компьютере между «информация» и «память» нет пропасти: байты лежат в адресных ячейках. У ячейки есть номер, у байта — значение, всё прозрачно. В мозге так не работает.
Если бы воспоминание о бабушке хранилось в одной клетке, эту клетку можно было бы убить и удалить именно это воспоминание. Эксперименты с локальным повреждением мозга такого не показывают. Удаляешь маленький кусок коры — теряется не одно воспоминание, а целый класс способностей. Удаляешь побольше — функция деградирует постепенно. Это называется распределённое представление: информация размазана по сети, не свёрнута в одной точке.
То, что физически меняется при обучении, — это силы синапсов. У каждого из ваших ~100 триллионов синапсов есть «вес» — насколько эффективно сигнал через него проходит. Этот вес может расти (потенциация) или уменьшаться (депрессия). Память — это паттерн весов, а не отдельная сущность поверх сети.
Аналогия из ML, для разработчиков: в искусственной нейросети «знание» тоже не в одном месте. Это набор весов матриц. Если вы обучили GPT и потом потеряли веса — никакая часть архитектуры вам модель не вернёт. Веса — это и есть выученное знание. В мозге так же: связи и есть память.
Часть 2. Правило Хебба (1949)
В 1949 году канадский психолог Дональд Хебб в книге «The Organization of Behavior» сформулировал то, что сегодня знают почти все, кто хоть раз заходил в курс по нейросетям [1]:
Современная сжатая форма: «Cells that fire together wire together» — «клетки, которые стреляют вместе, связываются вместе». Хебб сформулировал правило за 24 года до того, как его получится увидеть в эксперименте. Это редкий случай, когда теоретик угадал механизм почти точно.
В нашем городе: жители, которые часто пожимают руки одновременно, со временем узнают друг друга крепче. Их рукопожатие усиливается. Если в день укуса комара в палец сработали одни и те же десять тысяч жителей — их связи стали чуть толще. В следующий раз они отреагируют быстрее. Вот и весь механизм: повторяющиеся совпадения превращаются в физическую дорожку.
Заметьте, что правило локальное: каждый синапс решает усилиться или нет на основе своих собственных пресинаптических и постсинаптических сигналов. Никакой «учитель» не приходит снаружи и не говорит, какие связи менять. Это глубокое отличие от того, как обучаются искусственные нейросети, — вернёмся к этому в Части 8.
Часть 3. Виджет: правило Хебба в действии
Запустите виджет. Жмите «синхронный спайк» — и смотрите, как вес связи между двумя нейронами растёт. Жмите «асинхронно» — вес падает. Сбросьте, поиграйте. Это не симуляция всего мозга — это карикатура одной пары клеток. Но она показывает суть Хебба буквально на пальцах.
Что важно поймать: привычка рукопожатия формируется не из одного события, а из повторений. Один синхронный спайк меняет вес чуть-чуть. Десять — уже заметно. Сто — связь становится «выученной». Так же работает любой навык. В первый раз вы переключаете передачу в машине, считая по шагам. На сотый — рука сама. Это не магия, это сто синхронных спайков в одних и тех же контурах коры и мозжечка.
Часть 4. LTP — long-term potentiation
В 1973 году британский физиолог Тимоти Блисс и норвежский нейробиолог Терье Лёмо вживили электрод в гиппокамп кролика и сделали то, чего никто раньше не делал: подали серию высокочастотных стимулов на пресинаптическую сторону. Записали ответ постсинаптической. И ответ остался увеличенным на часы. Связь была физически усилена [2].
Это и был первый прямой эксперимент, доказывающий Хебба. Феномен назвали long-term potentiation, LTP. К сегодняшнему дню это самый изученный молекулярный механизм памяти.
NMDA-рецептор как детектор совпадений
Сердцевина LTP — особый глутаматный рецептор, NMDA. У него есть редкое для рецепторов свойство: он открывается, только если выполнены два условия одновременно:
пресинапт. активен
В щель выброшен глутамат. Молекула цепляется за NMDA-рецептор — иначе ему не на что среагировать.
постсинапт. деполяризован
Мембрана уже частично возбуждена — например, потому что соседние синапсы только что сработали. Тогда из канала NMDA вылетает блокирующий магний, и канал открывается.
Это идеальный молекулярный AND-гейт: NMDA сработает, только если активны и A, и B одновременно. Природа собрала Хебба прямо в виде белка. Это до сих пор удивляет: правило обучения, описанное психологом в 1949, оказалось встроено в одну молекулу, которую открыли через 30 лет.
Что происходит с шипиком
Когда NMDA сработал, в постсинаптический нейрон зашёл кальций. Это запускает каскад: активируются киназы (CaMKII в первую очередь), они фосфорилируют существующие AMPA-рецепторы (другой глутаматный рецептор, который и делает основную работу), плюс встраивают новые AMPA в постсинаптическую мембрану. Через час-другой дендритный шипик — та маленькая «бляшка» на дендрите, на которой сидит синапс, — физически становится больше. Цитоскелет шипика перестраивается, в нём появляются новые молекулы актина [3].
Через несколько часов шипик не просто увеличился — он стал другим. Связь A→B теперь сильнее. Это и есть LTP в анатомическом виде.
Часть 5. LTD — long-term depression
У Хебба есть симметричная вторая половина, которую часто забывают. Если синхронность усиливает связь — асинхронность ослабляет. Слабая, длительная, не совпадающая по времени активация запускает обратный механизм: long-term depression, LTD.
На уровне молекул это работает так: при слабом, но продолжительном входе кальция в постсинапт активируются не киназы (фосфорилирующие), а фосфатазы (отщепляющие фосфаты). Они снимают активирующие модификации с AMPA-рецепторов. Шипик уменьшается. Часть AMPA выводится из мембраны внутрь клетки. Связь становится слабее.
Важно: LTD — это не «забывание» в плохом смысле. Это точная настройка. Без неё ваш мозг записывал бы как сигнал любой шум: каждое случайное совпадение, каждый редкий артефакт стимула. LTD — это статистический фильтр. Если связь между A и B не подтверждается регулярными совпадениями, она должна затухать. Иначе вместо памяти получится одна большая каша.
Не помнит.
Вечером того же дня помнит, какой коммит сломал прод в 2019 году.
LTD у каждого своё. Связи, которые вы перестали активировать, тихо ослабевают. Это не баг — это бюджетная политика мозга.
LTP и LTD работают вместе всё время. Прямо сейчас, пока вы читаете этот текст, в вашей коре одни синапсы усиливаются (те, что ловят новую для вас информацию), другие ослабевают (те, что были связаны с другими ассоциациями этих же слов). Память — не «накопление», а постоянная динамическая балансировка.
Часть 6. Шипики растут и исчезают
Самое поразительное доказательство, что память — это анатомия, появилось с прижизненной двухфотонной микроскопией. В 2000-х годах в лаборатории Карела Свободы в США научились вживлять мышам в череп прозрачное окошко и через флуоресцентный белок GFP, встроенный в нейроны, наблюдать за конкретными шипиками месяцами.
То, что увидели, перевернуло представление о стабильности мозга. Шипики — это не вечные структуры. Они появляются и исчезают за часы и дни. У молодой мыши за неделю обновляется до 10% всех шипиков в зрительной коре. У взрослой — меньше, но обновление идёт всю жизнь.
Самое красивое наблюдение: дайте мыши новый опыт — например, обучите её новому моторному навыку, — и за 12—24 часа в соответствующей моторной коре вы увидите новые шипики, которых раньше не было. Они вырастают на конкретных дендритах, в конкретных местах, в ответ на конкретное обучение. Если навык не повторяется — шипики через неделю исчезают. Если повторяется — стабилизируются.
Это значит, что каждое ваше впечатление сегодня — кафе, лицо собеседника, интонация фразы — пробует прорастить в коре маленькие шипики. Большинство уйдёт за пару дней. Те, что повторятся или окажутся эмоционально важными, — останутся. Воспоминания старше недели физически отличаются от воспоминаний возрастом в час.
Часть 7. Гиппокамп и случай H.M.
Все эти LTP и шипики работают в гиппокампе и в коре. Между ними есть разделение труда: гиппокамп пишет быстро, кора консолидирует медленно.
Гиппокамп — маленькая структура в височной доле, по форме и правда напоминающая морского конька. Он умеет за минуты сложить новое событие в эпизодическое воспоминание: «утром в среду я ел овсянку с черникой». Кора этого с такой скоростью не может — её работа идёт в фоне, ночью, во сне, и занимает дни и недели. Постепенно воспоминание переезжает из гиппокампа в кору. Это и есть консолидация.
Henry Molaison, 1953
В 1953 году нейрохирург Уильям Сковилл прооперировал 27-летнего пациента Генри Молейсона от тяжёлой эпилепсии. Удалил большую часть гиппокампа с обеих сторон. Эпилепсия отступила. А вместе с ней — способность образовывать новые эпизодические воспоминания. Первое систематическое описание этого случая было опубликовано Сковиллом и Брендой Милнер в 1957 году [5].
H.M. (так его называли в литературе до его смерти в 2008 году, чтобы сохранить анонимность) прожил после операции 55 лет. Он узнавал родителей. Помнил детство. Мог поддерживать беседу. Мог обучаться двигательным навыкам — например, рисовать в зеркальном отражении. Но каждый день для него был первым: утром он не помнил вчерашнего разговора с врачом. Прошло пятьдесят лет — он не знал, что прошло пятьдесят лет.
Что мы из этого поняли:
Гиппокамп нужен для записи
Без него новые эпизодические воспоминания не образуются. Запись эпизодов — не разлита по всей коре, у неё есть конкретный центр.
Старые воспоминания живут не в гиппокампе
H.M. помнил детство. Значит, к моменту операции эти воспоминания уже переехали в кору. Гиппокамп нужен для записи и консолидации — не для хранения.
Память бывает разной
Моторная память (как кататься на велосипеде) и декларативная (что я делал вчера) живут в разных местах. У H.M. моторная работала — декларативная нет.
До случая H.M. большинство учёных думало, что память — это одна общая функция мозга. После — стало ясно, что она расщеплена на подсистемы, у каждой свой механизм и свой адрес. Это один из самых важных кейсов в нейронауке XX века.
Часть 8. Алгоритмы и природа
Если вы знакомы с machine learning, у вас давно крутится вопрос: «то, что вы описываете, — это же градиентный спуск?» Нет. И это самая интересная нерешённая задача современной computational neuroscience.
В искусственных нейросетях обучение идёт через backpropagation: сеть делает предсказание, считается ошибка на выходе, эта ошибка распространяется обратно через все слои сети, и веса корректируются по градиенту. Backprop работает потрясающе хорошо — на нём построены все современные LLM, GPT и прочие. Но это глобальный алгоритм: каждому весу в первом слое нужна информация об ошибке на выходе через десятки слоёв.
В мозге так не получится. Синапс не знает, что происходит в моторной коре. У него нет канала, по которому ему передадут «ты ошибся на 0.37, скорректируй вес». Хебб — локальное правило: каждый синапс смотрит на свои собственные пре- и постсинаптические сигналы, и всё. Этого достаточно? До конца не ясно.
Это одна из больших нерешённых загадок нейронауки — наряду с вопросом о субъективном опыте, которому посвящён курс «Трудная проблема сознания»: как биология достигает того, что в ML делает backprop, без backprop? Мозг учится миру, который никогда не видел, на нескольких примерах, без размеченных меток — и при этом обходится локальными правилами. Современные нейросети для такого нуждаются в миллионах размеченных примеров и глобальном backprop.
Гипотезы про «биологически правдоподобный backprop»
Учёные пытаются понять, могут ли локальные правила в принципе делать то, что делает backprop. Несколько направлений:
Equilibrium Propagation (Хинтон, Бенжио)
Сеть приводят к равновесию (расслаблению), потом мягко «тянут» выход в сторону правильного ответа — и обновляют веса по разнице двух равновесий. Это локально и математически эквивалентно backprop в определённых условиях.
Predictive coding
Каждый слой коры всё время предсказывает, что увидит снизу. Если предсказание не сошлось — ошибка передаётся вверх. Веса меняются, чтобы минимизировать локальную ошибку предсказания. Часть нейробиологов считает, что вся кора так работает.
Three-factor rules
Хебб, плюс глобальный сигнал (например, дофамин — «премия!»), который модулирует, какие совпадения сейчас усиливать, а какие нет. Это локально для синапса, но глобальный сигнал распределяется широковещательно [6].
Ни одна из этих гипотез пока не считается окончательным ответом. Возможно, мозг использует разные механизмы в разных областях. Возможно, мы пока просто не нашли правильное обобщение Хебба. Это активная область, в которой будут открытия в ближайшие 10—20 лет.
Резюме
Память — не файл
Это распределённая конфигурация ~100 триллионов синаптических весов. Изменить связи = изменить память.
Правило Хебба
«Cells that fire together wire together». Жители города, часто пожимающие руки одновременно, узнают друг друга крепче. Локальное правило, без учителя.
NMDA — AND-гейт
Открывается, только когда активны и пресин., и постсин. сторона. Идеальный молекулярный детектор совпадений. Запускает LTP.
LTP и LTD
Усиление при синхронности (LTP, через киназы и новые AMPA), ослабление при слабой долгой активации (LTD, через фосфатазы). Не «помнить vs забывать», а постоянная балансировка.
Шипики растут за часы
Прижизненная микроскопия показывает: после нового опыта в коре за сутки появляются десятки новых шипиков. Память физически меняет анатомию.
H.M. и гиппокамп
Без гиппокампа новые эпизоды не записываются. Старые остаются. Память расщеплена на подсистемы — декларативная, моторная, эмоциональная — у каждой свой адрес.
Backprop ≠ Хебб
Машины учатся через глобальный градиент. Мозг — через локальные правила. Как биология достигает того же результата — открытая задача десятилетия.
Что дальше в Уроке 6: у нас есть нейроны, синапсы, обучение. Время собрать из этого работающую сеть. Возьмём самые простые нейронные системы, которые уже что-то умеют, — от 302 нейронов нематоды C. elegans до сетчатки и спинного мозга. Поймём, как из локальных правил собирается распределённое поведение и почему даже с полным чертежом сети мы пока не умеем её симулировать.
Источники / Sources
- books Donald Hebb (1949). «The Organization of Behavior». Wiley.
- research Tim Bliss, Terje Lømo (1973). «Long-lasting potentiation of synaptic transmission in the dentate area of the anaesthetized rabbit following stimulation of the perforant path». Journal of Physiology, 232(2): 331—356.
- books Eric Kandel, John Koester, Sarah Mack, Steven Siegelbaum (eds.) (2021). «Principles of Neural Science», 6th edition. McGraw-Hill.
- research Guang Yang, Feng Pan, Wen-Biao Gan (2009). «Stably maintained dendritic spines are associated with lifelong memories». Nature, 462: 920—924.
- research William Scoville, Brenda Milner (1957). «Loss of recent memory after bilateral hippocampal lesions». Journal of Neurology, Neurosurgery, and Psychiatry, 20: 11—21.
- research Wolfram Schultz, Peter Dayan, P. Read Montague (1997). «A neural substrate of prediction and reward». Science, 275(5306): 1593—1599.