Урок 4

Первые три минуты

Глава 4. Середина 1990-х. Готтман объявляет, что предскажет развод с точностью 83–91%. Газеты в восторге. Это пик соблазна — и начало проблем.

Цели урока

К концу этого урока вы:

Как устроено исследование 1998 года: 130 пар, шесть лет наблюдений, семь конкурирующих моделей
Откуда появились цифры 83% и 94% — и почему они не одно и то же
Что такое «жёсткий старт» (harsh startup) и как три минуты разговора попали в заголовки как предсказательная машина
Почему цифра 83% звучит как точный прогноз, хотя по природе она ближе к описанию в обратную сторону
Что именно не подтвердилось из гипотез Готтмана — и это не менее важно, чем то, что подтвердилось

Замри на секунду. Сейчас будет интересно.

0:00 / 0:00

Пресс-момент середины 1990-х: уверенный психолог у трибуны под софитами, журналисты с блокнотами

Сиэтл, 1998 год. Джон Готтман выходит на подиум и произносит фразу, которую завтра разберут все крупные газеты страны: «Посмотрев на пятнадцатиминутную запись разговора супружеской пары, я могу предсказать, разведутся ли они, с точностью 83 процента». В зале — журналисты, редакторы, несколько издателей. Когда он заканчивает, кто-то спрашивает: «А если смотреть только первые три минуты?» Сибил Каррер, ближайший соавтор Готтмана в те годы, к тому моменту уже знает ответ: ровно столько же. Воронка сужается — и число не падает.

На следующий день эта история попадёт на первые полосы. Никто не напишет, что точность получена на той же выборке, которую использовали для построения формулы. Никто не спросит, проверяли ли её на других парах. Готтману нравится это число — оно чистое, оно предсказывает, оно его. С 1983 года, когда он вместе с Левенсоном впервые посмотрел на самописец с четырьмя дёргающимися перьями, он шёл именно к этому.

Но у каждой красивой формулы есть дата истечения срока годности. Мы до неё доберёмся — в следующей главе. Пока же давайте разберёмся, как вообще получают такие числа, и почему они так убедительно звучат — пока не приходят люди с калькуляторами.

Быстрый recall перед новым материалом

Холодный старт — 3 вопроса без подглядывания

Из главы 3 (L3): Готтман назвал соотношение позитивных и негативных взаимодействий «магическим числом». Это 5:1 — описание того, что отличает счастливые пары, или рецепт того, как стать счастливым? Почему важна эта разница?

Из главы 1 (L1): Главная ось всего курса — описание против предсказания. Назовите один конкретный результат 1983 года, который относится к описанию, и один результат 1985 года, который столкнулся с проблемой предсказания.

Из главы 2 (L2): Какой из четырёх всадников Готтман считал наиболее разрушительным — и почему именно он опаснее критики или защитного поведения?

Не листайте назад. Ответы из памяти ценнее правильных ответов из текста.

Глава 1 Любовь под датчиками: физиологическое сцепление двух нервных систем — и первое столкновение описания с предсказанием уже в 1985-м.

Глава 2 Четыре всадника апокалипсиса: критика, презрение, защита, стоунволлинг — и почему презрение «серная кислота любви».

Глава 3 Соотношение 5:1: описание аффективного баланса в счастливых парах — не инструкция и не рецепт.

Глава 4 — сейчас Пик соблазна: 83–94% точности, первые три минуты разговора — и вопрос, который газеты не задали.

Что вы поймёте после этой главы

Как устроено исследование 1998 года: 130 пар, шесть лет наблюдений, семь конкурирующих моделей
Откуда появились цифры 83% и 94% — и почему они не одно и то же
Что такое «жёсткий старт» (harsh startup) и как три минуты разговора попали в заголовки как предсказательная машина
Почему цифра 83% звучит как точный прогноз, хотя по природе она ближе к описанию в обратную сторону
Что именно не подтвердилось из гипотез Готтмана — и это не менее важно, чем то, что подтвердилось

Часть 1. 130 пар и семь гипотез

К середине 1990-х у Готтмана уже есть «лаборатория любви» — квартира-студия в Сиэтле с видом на озеро и датчиками везде, куда смотришь. Но его волнует теперь не только что происходит в ссоре, а можно ли по ссоре предсказать, что случится с парой через несколько лет. Это следующий логичный шаг: от описания к прогнозу.

В 1998 году выходит ключевая статья: Готтман, Коан, Каррер и Свенсон. 130 новобрачных пар. Каждая пара приходит в лабораторию и обсуждает спорный вопрос своего брака. Исследователи фиксируют всё: поведение по системе SPAFF (кодирование аффекта секунда за секундой), физиологию, самоотчёты. Затем за парами наблюдают шесть лет. Некоторые разводятся, некоторые остаются вместе и счастливы, некоторые — вместе, но несчастны.

Исследователи ставят перед собой семь конкурирующих моделей. Какая из них лучше всего предсказывает, кто окажется в какой группе через шесть лет? Одна из гипотез — что гнев во время ссоры предсказывает плохие исходы. Другая — что активное слушание помогает. Третья — что если один супруг «уходит» в себя (стоунволлинг), это особенно опасно. Четвёртая — та самая ratio-модель: соотношение позитивных и негативных взаимодействий [1].

Результаты оказались неожиданными — даже для самих авторов. Три гипотезы не подтвердились.

Что НЕ подтвердилось в 1998 году [1]:

Гнев во время ссоры сам по себе — не предиктор плохого исхода. Это противоречило большой части предшествующей литературы. Активное слушание — роджерианский приём, которому учат на всех тренингах для пар, — в данных не предсказывало удовлетворённость. Реципрокность негатива (когда один уходит в негатив и другой отвечает тем же) — тоже не показала предсказательной силы. Эти три отрицательных результата вряд ли попали в газеты. Но они, пожалуй, самые важные в статье.

Часть 2. Что подтвердилось: ratio держится

Из семи моделей победила та, которую Готтман строил с конца 1980-х: balance-модель, или ratio-модель. Пары, у которых соотношение позитивного к негативному во время конфликта было выше определённого порога, чаще оказывались счастливы и стабильны через шесть лет [1]. Это согласуется с тем, о чём шла речь в главе 3: соотношение аффекта — описание реального паттерна, которое также обнаруживает проспективную связь.

Здесь важна оговорка, которую легко пропустить: то, что ratio-модель «победила» из семи конкурентов, не означает, что она победила в абсолютном смысле. Это значит, что на этой выборке она объяснила исходы лучше шести других моделей. Выборка — 130 новобрачных пар, рекрутированных в одном городе, в конкретные годы. Само по себе это ценный результат. Но он ещё не говорит нам, насколько хорошо та же модель объяснит исходы на других парах, в другом городе, в другом году.

Предскажите до ответа

Готтман получил 83% точности. Это означает: (а) из 100 пар в другой выборке он угадает исход у 83; (б) из 130 пар в его собственной выборке он угадал 83 правильно; (в) 83% дисперсии исходов объяснены моделью; (г) формула верна в 83% случаев независимо от выборки. Какой вариант точнее всего описывает, что на самом деле стоит за этой цифрой?

Подсказка: откуда берутся данные для проверки модели — из тех же пар, которых строили модель, или из новых?

Часть 3. 83% и 94%: откуда два числа

В публикациях тех лет и в популярных пересказах мелькают два числа — 83% и 94%. Они относятся к разным вещам, и путаница между ними сделала много шума в неправильных местах.

83% — это точность модели в работе 1998 года [1]: 130 новобрачных пар, прогноз развода vs стабильности, на тех же данных, из которых модель строилась.

94% — другое число, из более ранних работ: Buehlman, Gottman & Katz (1992) и из книги Готтмана 1994 года. Там использовалась иная методология: Oral History Interview — пару просили вспомнить историю отношений, рассказать, как они встретились. По тому, как они рассказывают — с теплотой или с дистанцией, с общим «мы» или с разобщёнными «я и он/а», — предсказывался исход. Авторы сообщили до 94% точности — тоже, разумеется, на той же выборке, которую использовали для построения классификатора.

В газетах эти два числа смешались в одно. Журналист хотел запомнившийся заголовок — и у Готтмана было два числа на выбор. Он обычно брал то, которое лучше звучит. Это не обман — оба числа реальны. Но оба они несут в себе один и тот же скрытый вопрос, который никто в прессе не задал.

Скрытый вопрос, который не задали. Оба числа — и 83%, и 94% — получены на той же выборке, из которой строилась модель. Это означает, что модель уже «видела» эти пары, когда её проверяли. Насколько точно она сработает на парах, которых ещё не видела? Этот вопрос не был задан — и не был проверен — ни в 1998, ни в 1999 году. Проверка пришла в 2001-м. О ней — в следующей главе.

Воронка сужается — точность не падает. Но обе цифры — in-sample. Это и есть нижняя дорога из карты главы 1.

Часть 4. Три минуты Каррер

Отдельного разговора заслуживает работа 1999 года — и отдельного уточнения атрибуция. Когда говорят «Готтман предсказал развод по первым трём минутам», имеют в виду статью Сибил Каррер и Готтмана, опубликованную в журнале Family Process в 1999 году [2]. Каррер — первый автор, и именно её работа создала главный нарратив.

Дизайн был изящен. 124 новобрачные пары. Разговор о конфликте записывали с самого начала. Потом каждую запись нарезали на пять трёхминутных интервалов и смотрели, по какому из них лучше предсказывается исход через шесть лет. Первый интервал — самые первые три минуты, когда пара только начинает разговор, — оказался не хуже, чем любой другой. Иными словами: то, как пара начинает спорить, уже несёт в себе информацию, которая есть и в остальных двенадцати минутах.

Каррер и Готтман назвали ключевой паттерн «жёстким стартом» (harsh startup). Это — когда разговор начинается с обвинения, критики, сарказма или презрения сразу, без попытки смягчить тон. В терминах главы 2: с первого всадника и не со второго. Данные показали, что пары, начинающие конфликт с жёсткого старта, с большей вероятностью попадали в плохие исходы через шесть лет [2].

Это красивая находка. Если бы она воспроизвелась на независимой выборке, мы бы говорили о настоящем прорыве: тридцать секунд начала разговора как прогностический маркер. Но здесь важно остановиться и задать вопрос, который никто в 1999 году ещё не задавал вслух: а проверяли ли вы эту модель на парах, которых не видели раньше?

Важно: harsh startup — это описание поведенческого паттерна, а не алгоритм прогноза. Связь с исходом была обнаружена на тех же 124 парах, из которых строилась классификация. Что произойдёт с точностью на другой выборке — этот вопрос останется без ответа до 2001 года.

Часть 5. Соблазн формулы — и что из него выросло

Почему Готтмана тянуло именно к таким числам? Это не капризный вопрос. Мы заложили ответ ещё в главе 1: Готтман пришёл в психологию из математики. Его мозг устроен так, чтобы искать функцию. На входе — поведение. На выходе — число. И когда выходное число получалось красивым — 83%, 94%, первые три минуты, — оно переставало быть просто описанием прошлых данных и превращалось во что-то похожее на закон природы.

Пресса сделала остальное. Популярные книги Готтмана — прежде всего «Семь принципов счастливого брака» — донесли цифры до миллионов читателей без оговорок. Интервью множились. Термины «Love Lab» и «предсказание развода» стали синонимами. К концу 1990-х Готтман был тем, чем редко становятся учёные-психологи: медийной звездой.

Это — не обвинение. Именно благодаря этой публичности его реальные, надёжные находки (о физиологическом сцеплении, о всадниках, о роли презрения) дошли до людей, которые никогда бы не прочитали журнал Marriage and Family. Но у публичности есть цена: она делает сложное простым, оговорки — невидимыми, а 83% — готовым рецептом.

📰

Газета 1998 года: «Учёный доказал, что развод можно предсказать с точностью 83%».
Учёный, читающий статью: «Я этого не говорил… хотя… ну, примерно так».
Разница между «я получил 83% на своей выборке» и «я могу предсказать 83% браков» — это вся следующая глава.

Часть 6. Что это было: верхняя или нижняя дорога?

Вернёмся к карте из главы 1. Мы говорили о двух дорогах: верхней (описание — что отличает несчастливые пары) и нижней (предсказание — точный прогноз будущего новых пар). В 1998–1999 годах Готтман и его команда двигались по нижней дороге — они заявляли предсказательную силу.

Проблема была не в том, что они измерили что-то неправильно. Проблема была в дизайне проверки. Когда вы строите формулу на ста парах и проверяете её на тех же ста парах, вы не проверяете предсказание — вы проверяете описание. Разница не видна в числах: 83% в обоих случаях выглядят одинаково. Разница видна только тогда, когда приходит кто-то с другой выборкой.

Именно это произошло в 2001 году. Ричард Хейман и Эми Смит Слеп взяли уравнение Готтмана и проверили его на независимых данных. Результат оказался не 83%. И даже не 50%. Но это — уже следующая глава [3].

Объясните своими словами

Представьте, что вас просят объяснить другу: почему «83% на своей выборке» не равно «83% точности при предсказании будущих пар»? Не цитируйте текст — сформулируйте сами, желательно через бытовой пример (не из психологии, не из брака — придумайте свой).

Подсказка: представьте, что вы решаете кроссворд, зная ответы заранее — и потом заявляете, что умеете решать кроссворды. Насколько это честно?

Итоги главы 4

83% и 94% — разные числа о разном

83% — из Gottman et al. 1998 (130 пар, развод vs стабильность). 94% — из Buehlman/Gottman 1992 и книги 1994 года (Oral History Interview). Оба числа real, оба in-sample.

Три гипотезы НЕ подтвердились

Гнев, активное слушание и реципрокность негатива — не предикторы в данных 1998 года. Подтвердилась ratio-модель (callback к L3: соотношение позитива и негатива).

Первые 3 минуты — это Каррер&Готтман 1999

Жёсткий старт (harsh startup) предсказывал плохие исходы по первым трём минутам. Но: 124 пары, та же in-sample логика — без кросс-валидации на независимых данных.

Это пик нижней дороги

Курс достиг максимальной точки предсказательного соблазна. Дальше приходят люди с калькуляторами.

В следующей главе. 2001 год. Ричард Хейман и Эми Смит Слеп берут уравнение с 90% точностью и применяют его к независимой выборке. Общая точность остаётся высокой. Но положительная предсказательная ценность — сколько из предсказанных разводов действительно разводов — падает до 21%. Это и есть переобучение: формула идеально легла на одно тело — и мешком висит на следующем. Глава 5 будет самой технически требовательной в курсе. И самой важной.

Источники этой главы

Peer-reviewedGottman, J. M., Coan, J., Carrère, S., & Swanson, C. (1998). Predicting marital happiness and stability from newlywed interactions. Journal of Marriage and the Family, 60(1), 5–22. 130 новобрачных пар; развод/стабильность 83%, удовлетворённость 80%; не подтвердились: гнев, активное слушание, реципрокность негатива; подтвердилась ratio/balance-модель. Базовая статья этой главы. DOI: 10.2307/353438
Peer-reviewedCarrère, S., & Gottman, J. M. (1999). Predicting divorce among newlyweds from the first three minutes of a marital conflict discussion. Family Process, 38(3), 293–301. 124 новобрачных, SPAFF, пять 3-минутных интервалов; исход за 6 лет «предсказан» по первым 3 минутам («harsh startup»). Атрибуция: первый автор — Каррер, а не Левенсон. DOI: 10.1111/j.1545-5300.1999.00293.x
Peer-reviewedHeyman, R. E., & Smith Slep, A. M. (2001). The hazards of predicting divorce without crossvalidation. Journal of Marriage and Family, 63(2), 473–479. Кросс-валидация уравнения Готтмана на независимой выборке: 90% общая точность → ~21% положительная предсказательная ценность. Канонический методологический разбор. Подробнее — в главе 5. DOI: 10.1111/j.1741-3737.2001.00473.x · PMC: 1622921
Peer-reviewedGottman, J. M., & Levenson, R. W. (1992). Marital processes predictive of later dissolution: Behavior, physiology, and health. Journal of Personality and Social Psychology, 63(2), 221–233. 73 пары, два замера (1983 и 1987): прото-всадники и каскадная модель распада. Промежуточное звено между 1983-м открытием и 1998-м обещанием предсказания. DOI: 10.1037/0022-3514.63.2.221 · PMID: 1403613

Глава информационно-просветительская. Данные по точности предсказания приводятся в паре с методологическими оговорками — это обязательное условие честного изложения науки. Это не индивидуальная психологическая консультация и не замена семейной терапии.