Podlodka #473 -- Каузальные модели
Никита Поваров, principal analyst в JetBrains, пришёл, чтобы рассказать об одной из самых коварных ловушек в работе с данными: мы привыкли видеть корреляции, но совершенно не умеем доказывать причинность. А разница между "связано" и "вызывает" – это разница между правильным решением и красивой иллюзией. В выпуске прошли по истории вопроса от Гальтона и Фишера до современных каузальных графов: почему исторически статистика и каузальность шли разными путями и как они всё-таки сошлись.

Разбираем d-сепарацию, конфаундеры, медиаторы и строим каузальные графы на конкретных примерах из A/B тестирования, медицины и продуктовой аналитики. Выпуск для всех, кто работает с данными и хочет не просто находить паттерны, а понимать, что на что влияет и уметь это обосновать.
Слушать выпуск
Полезные ссылки:

  • Фундамент — вероятность как логика E.T. Jaynes — «Probability Theory: The Logic of Science»

Вес и физическая активность — каузальные модели

  • Mendelian randomization, eLife 2022: «Mendelian randomization suggests a bidirectional, causal relationship between physical inactivity and adiposity»
https://pmc.ncbi.nlm.nih.gov/articles/PMC8975550/

  • Multivariable MR, Nature Comms Med 2023: «Distilling causality between physical activity traits and obesity via Mendelian randomization»
https://www.nature.com/articles/s43856-023-00407-5

  • E. Yudkowsky — «Causal Diagrams and Causal Models»
https://www.lesswrong.com/posts/hzuSDMx7pd2uxFc5w/causal-diagrams-and-causal-models

  • Выдуманный пример вес/активность/сидение-на-Reddit, как иллюстрация коллайдера
Herman Pontzer — «Constrained Total Energy Expenditure and Metabolic Adaptation to Physical Activity in Adult Humans»
https://pmc.ncbi.nlm.nih.gov/articles/PMC4803033/

Исторические байки

  • Ф. Гальтон — Регрессия к среднему — Regression towards Mediocrity in Hereditary Stature, Journal of the Anthropological Institute
https://galton.org/essays/1880-1889/galton-1886-jaigi-regression-stature.pdf

  • К. Пирсон — Корреляция наше всё — «The Grammar of Science»
https://archive.org/details/grammarofscience00pearrich/page/44/mode/2up

  • Р. Фишер — ген курильщика — «Cancer and smoking», Nature
https://www.nature.com/articles/182596a0

  • Ignaz Semmelweis — мытьё рук — https://en.wikipedia.org/wiki/Ignaz_Semmelweis — краткая биография
https://pmc.ncbi.nlm.nih.gov/articles/PMC11568873/

  • Джон Сноу — холера в Лондоне
https://pmc.ncbi.nlm.nih.gov/articles/PMC7150208/

  • Barbara Stoddard Burks — забытый пионер медиации
https://danamackenzie.com/barbara-stoddard-burks-pioneer-in-causality/

  • Бедность и когнитивные функции
https://pubmed.ncbi.nlm.nih.gov/23990553/

  • Дискриминация женщин — слепые прослушивания
https://www.aeaweb.org/articles?id=10.1257/aer.90.4.715

  • Курьёз — ретроспективный эффект молитвы — «Effects of remote, retroactive intercessory prayer on outcomes in patients with bloodstream infection: randomised controlled trial»
https://pubmed.ncbi.nlm.nih.gov/11751349/



Похожие выпуски