Корреляция против причинноследственной связи Что; s Разница (Примеры!)

Корреляция против причинно-следственной связи: в чем разница? (+ Примеры!)

Перейдите к тому, что вам интересно прочитать:

Супер краткое резюме.

Прежде чем мы начнем официально писать в блоге…

Я знаю, что некоторые из вас просто хотят получить быстрый, без суеты, ответ из одного предложения. Итак, если вы здесь, чтобы получить краткий ответ о том, в чем разница между причинно-следственной связью и корреляцией, вот она:

Корреляция — это связь между двумя переменными; когда одна переменная изменяется, другая переменная также изменяется. Причинность — это когда есть реальное объяснение того, почему это происходит логически; это подразумевает причину и следствие. Итак: причинно-следственная связь — это взаимосвязь с причиной. .

Если вам интересно прочитать полное объяснение, чтобы правильно понять термины, разницу между ними и извлечь уроки из реальных примеров, продолжайте прокручивать!

Прошли дни, когда данные в основном использовались исследователями или были доступны только тем, кто обладал огромным техническим мастерством. Времена, когда получение данных было тяжелым испытанием, требовавшим месяцев ручного отслеживания, разработки опроса или написания кода отслеживания с нуля, прошли. .

В наше время, когда все, что находится под солнцем, отслеживается и каталогизируется, каждый имеет широкий доступ к данным. Однако этот обширный доступ может стать большим барьером между компаниями, которые становятся великими, и компаниями, которые не.

Таким образом, люди, которые знают, как говорить на языке данных, имеют большое преимущество, потому что они могут владеть этим мощным инструментом..

Великие маркетологи больше не придумывают кампании, основанные на интуиции; вместо этого они позволяют своим данным сказать им, на какой кампании им следует сосредоточиться, а затем используют свой маркетинговый опыт для создания именно той оптимальной кампании, определенной с помощью данных..

Хорошие менеджеры по продукту предлагают тесты и изменения продукта на основе обширных исследований пользователей и данных об использовании продукта..

Каждый может использовать данные в своей роли, и получить доступ к актуальным для вас данным несложно..

Но часто самым большим препятствием является понимание: «Имея все эти данные, как мне узнать, что действительно важно, на чем сосредоточить свои усилия и какие шаги нужно предпринять?»

В этой записи блога, состоящей из двух частей, я покажу вам, как отвечать на эти вопросы и что означает правильное использование ваших данных..

В этом посте мы рассмотрим основы, такие как понимание того, что именно корреляция и причинно-следственная связь на самом деле, и более подробно рассмотрим свойства корреляции, различные типы и роль, которую играет шум..

Во втором сообщении в блоге мы рассмотрим формулы для определения силы корреляции, как они могут помочь нам определить причинно-следственную связь и как понять, насколько важна каждая переменная для конечного результата..

Что такое корреляция и причинно-следственная связь?

Ключ к правильному использованию ваших данных заключается в понимании разницы между причинно-следственной связью и корреляцией, поэтому давайте теперь рассмотрим каждый из этих терминов..

Что такое причинно-следственная связь?

Суть причинно-следственной связи заключается в понимании причины и следствия. .

Это такие вещи, как:

Дождевые облака вызывают дождь Физические упражнения вызывают рост мышц Переедание вызывает увеличение веса.

Это предполагает, что, поскольку произошло x, затем следует y; есть причина и следствие .

Однако это не особенно практично в деловой среде..

Когда вы просматриваете данные на практике, вы в основном ищете ответы на вопросы, в зависимости от вашей роли, например следующие:

Какой канал привлечения клиентов наиболее успешен и почему? Какие части моего продукта нравятся моим пользователям больше всего? Почему люди покупают мой продукт / платят за мои услуги?

И в конечном итоге вы хотите иметь возможность различать факторы, которые действительно способствовали созданию более успешного канала, лучшую часть продукта или причину, по которой клиенты покупают то, что вы продаете..

Здесь вы ищете индикаторы, которые подскажут, какое из ваших действий привело к желаемому результату..

Обычно это никогда не что-то одно, а скорее — комбинация множества факторов, каждый из которых в той или иной степени играет роль в конечном результате..

Так что на практике это может стать очень трудным, потому что у вас часто происходит много вещей одновременно..

Например, если вы работаете в маркетинговой команде и видите, что ваша последняя запись в блоге или видео привлекает большой веб-трафик на ваш сайт, вы можете задаться вопросом, действительно ли это произошло из-за ваших усилий или из-за:

Новое дополнение к продукту, которое команда разработчиков выпустила на прошлой неделе, или выступление вашего генерального директора в качестве гостя в подкасте, или приближающиеся праздники, или кто-то разместил положительный отзыв о вашем продукте на популярном веб-сайте и т. Д..

Или, если вы хотите быть более точным, какая часть этого увеличения трафика была связана с созданным вами фрагментом контента по сравнению с другими переменными факторами.?

Как вы понимаете, установить причинно-следственную связь может быть довольно сложно. Поскольку на практике эти вещи могут стать очень сложными, вы часто будете сталкиваться с родственным, но более общим понятием, называемым корреляцией..

Интересует наука о данных, но не уверен, с чего начать?

Присоединяйтесь к моему бесплатному классу, где я делюсь 3 секретами науки о данных и дам вам 10-недельный план действий.!

Что такое корреляция?

Корреляция описывает взаимосвязь между двумя разными переменными, которая гласит: когда одна переменная изменяется, меняется и другая..

Зависимые и независимые переменные.

Когда у вас есть пара коррелированных переменных, одна называется зависимой переменной, а другая — независимой переменной. .

Значение, которое принимает зависимая переменная, зависит от значения, которое имеет независимая переменная. Вы можете думать о независимой переменной как о той, которая задает сцену, и зависимая переменная должна реагировать соответствующим образом..

Например, если вы анализируете, сколько блюд готовят в вашем ресторане на основе количества клиентов, то количество приготовленных обедов является зависимой переменной, а количество клиентов — независимой переменной..

При большем количестве клиентов вам нужно готовить больше блюд, но если вы просто начнете готовить больше блюд, вы, вероятно, не собираетесь волшебным образом привлекать больше клиентов в свой ресторан..

Иногда эти отношения могут стать немного более туманными.

Например: если вы анализируете общее время просмотра ваших видео на Youtube по сравнению с количеством просмотров видео..

В этом случае зависимой переменной является время просмотра, а независимой переменной — количество просмотров, поскольку время просмотра зависит от количества просмотров и количества просмотров каждым человеком. .

Хотя вы можете оценить количество просмотров на основе времени просмотра, эта взаимосвязь не имеет большого смысла, поскольку зритель сначала должен нажать на ваше видео и начать просмотр, прежде чем он сможет внести свой вклад в время просмотра..

Основные свойства корреляций.

Корреляции могут быть:

Положительный Отрицательный (обратно коррелированный) Не коррелированный.

Их соотношение можно классифицировать как:

Слабый Сильный Совершенный.

В расширенном сообщении блога, которое выйдет на следующей неделе, мы рассмотрим статистические тесты, которые вы можете провести для определения силы корреляции, но здесь мы сначала сосредоточимся на том, чтобы лучше понять, что на самом деле означает и как выглядит корреляция..

На следующих графиках показаны упомянутые выше типы корреляций:

В каждом столбце мы показываем сначала отсутствие корреляции, затем слабую корреляцию, сильную корреляцию и идеальную корреляцию..

Первая и вторая строки показывают положительную и отрицательную линейную корреляцию соответственно..

Положительная корреляция означает, что когда одна переменная растет, другая растет. Отрицательная корреляция означает, что когда одна переменная растет, другая падает..

Как мы видим, отсутствие корреляции просто не показывает никакой взаимосвязи: перемещение влево или вправо по оси x не позволяет нам предсказать какие-либо изменения по оси y..

Например, нет корреляции между весом моей кошки и ценой нового компьютера; они не имеют никакого отношения друг к другу.

(Если бы между весом моей кошки и ценой на новый компьютер существовала положительная корреляция, у всех нас были бы большие проблемы.)

Слабая корреляция означает, что мы можем видеть положительный или отрицательный тренд корреляции, глядя на данные издалека; однако эта тенденция очень слабая и может исчезнуть, когда вы сосредоточитесь на определенной области..

Например, возьмем слабую положительную и слабую отрицательную линейную корреляцию сверху и увеличим область x от 0 до 4..

Вот что у нас может получиться:

И внезапно эта слабая корреляция, которую мы видели раньше, исчезла..

Это показывает нам, что, хотя слабая корреляция может сообщить нам информацию о более крупных тенденциях, эти правила могут не работать при просмотре в меньшем регионе..

Поэтому, когда у нас слабая корреляция, мы должны быть осторожны, чтобы не пытаться использовать ее в слишком маленьком масштабе..

Сильная корреляция означает, что мы можем увеличивать масштаб намного, намного дальше, пока нам не придется беспокоиться о том, что это соотношение не соответствует действительности. Если мы возьмем нашу сильную положительную и сильную отрицательную корреляцию сверху, а также увеличим масштаб до области x от 0 до 4, мы увидим следующее:

Верхний ряд показывает нам, как выглядят сильные корреляции, когда мы увеличиваем масштаб x в диапазоне от 0 до 4. Как мы видим, даже здесь корреляции все еще очень очевидны, и они все еще довольно сильны (хотя и не так сильно, как раньше)..

Чтобы попасть в область, где эта корреляция больше не соблюдается, нам нужно довольно сильно увеличить масштаб, что мы видим в нижней строке приведенного выше графика..

Здесь мы увеличили масштаб до области, где x находится в диапазоне от 0,5 до 1,5, что составляет 10% от нашего исходного диапазона. В этом масштабе наши корреляции больше не видны, даже в слабой форме..

И, наконец, идеальная корреляция — это корреляция без шума, и не имеет значения, насколько сильно мы увеличиваем масштаб, она всегда будет оставаться идеальной. Этот тип корреляции непрактичен, но все же важно знать, как выглядит «идеальная» корреляция..

Сила корреляции и наклон?

Еще одна вещь, которую часто неправильно понимают в отношении корреляций, заключается в том, что сила корреляции зависит от наклона .

Взгляните на следующие графики. Все они, кроме одного, демонстрируют сильную корреляцию с одинаковой силой..

Обратите внимание, как у нас может быть сильная корреляция независимо от того, большой ли у нас (левый столбец) или маленький (средний столбец) наклон..

В крайнем правом столбце показан график без корреляции, несмотря на то, что практически нет шума. Это связано с тем, как определяются корреляции: насколько изменение одной переменной влияет на другую. .

В этом случае значение y не зависит от значения x, следовательно, это еще один пример отсутствия корреляции (хотя более реалистичный пример отсутствия корреляции больше похож на случайный разброс точек, который мы видели в наглядно в предыдущем разделе.)

Что такое шум & Почему это важно для измерения корреляций.

Вы могли заметить, что средний столбец приведенного выше графика больше похож на идеальную корреляцию, чем крайний левый столбец. Это потому, что сила корреляции зависит от масштаба вашего шума относительно наклона.

Таким образом, чтобы средний и левый столбцы имели одинаковую силу корреляции, масштаб шума в среднем столбце должен быть меньше, чем масштаб шума в левом столбце, поскольку средний столбец имеет меньший (более мелкий) наклон..

Причина этого в том, что мы более подробно обсудим в расширенном сообщении в блоге, которое выйдет на следующей неделе, так что пока просто знайте, что у вас могут быть очень сильные корреляции, даже если ваш наклон не очень большой. .

Давайте сейчас сосредоточимся только на одном термине: шум .

Итак, что такое шум?

Шум указывает на изменение ваших данных. Он существует, потому что всегда есть много вещей, влияющих на данные, которые вы просматриваете..

На приведенных выше графиках мы заметили шум, особенно если посмотреть на разные силы корреляции..

Давайте снова поднимем это изображение:

В крайнем левом столбце мы видим много шума; данные сильно различаются, и все выглядит повсюду.

Второй столбец слева показывает общую тенденцию, как мы обсуждали выше, но есть еще много изменений. Мы можем видеть на нашей оси Y, что значения y меняются примерно от 0 до 4, но ширина нашей линии составляет примерно 2.

В третьем столбце слева («Сильная положительная / отрицательная линейная корреляция») мы видим гораздо более четкую тенденцию. Наши данные все еще немного колеблются, но не сильно. В этом случае у нас мало шума .

В крайнем правом столбце нет никаких колебаний и отображается идеальная прямая линия без шума..

Вот так «выглядит» шум. Мы также сравнили наш шум только со значениями y, но точки данных x и y будут иметь шум, который влияет на них..

Но давайте сделаем это более практичным.

Что такое шум на самом деле и откуда он?

Представим, что вы создали игру для смартфона и посмотрите, сколько времени каждый пользователь потратил на вашу игру при первой загрузке..

Лучше всего это представить в виде гистограммы, которая может выглядеть так:

Обычно после построения точек данных, которые у вас есть, появляется форма распределения, и вы можете оценить форму распределения на основе имеющихся у вас точек..

Идеальное распределение — это то, как ваше распределение выглядел бы, если бы у вас было бесконечное количество точек данных. Это распределение может принимать любую форму; это не обязательно должно быть нормальное распределение, подобное показанному выше.

Отклонение от идеального распределения, которое мы видим на гистограмме, — еще одна форма шума. Шум изменяет точки данных в зависимости от факторов, не зависящих от эксперимента..

Этот шум исходит от таких вещей, как:

Пользователь запускает вашу игру, а затем забывает ее выключить, заставляя их оставаться включенными подольше. Другого пользователя зовет на ужин его мама. Игра другого пользователя вылетает из строя, поэтому они не могут играть в первый раз..

Все это приводит к появлению шума, который заставляет ваши данные отклоняться от «идеальной» формы, которая была бы, если бы каждого пользователя просто поместили в пустую комнату и попросили играть в вашу игру до тех пор, пока они не перестанут ощущать это..

Таким образом, при любом анализе данных, который вы когда-либо проводите, следует помнить о шуме, и в идеале вы должны минимизировать влияние шума на свои данные..

Контроль шума.

На ваши данные всегда будет влиять шум, но если вы хотите попытаться уменьшить количество шума в своих данных, вы можете попытаться контролировать некоторые из источников шума..

Например, вы могли смотреть только на тех пользователей, приложение которых не закрылось из-за ошибки, так что вы можете контролировать шум, исходящий от сбоев приложений пользователей..

Для каждой переменной шума, которую вы контролируете, размер вашей выборки будет уменьшаться, поэтому, если вы попытаетесь контролировать слишком много вещей, у вас будет слишком мало точек данных, которые не позволят вам сделать что-либо полезное. либо.

Итак, что вы хотите сделать, это определить ваши самые большие источники шума, то есть какие переменные приводят к наибольшему количеству колебаний, и попытаться контролировать их. .

Таким образом вы сохраните размер выборки как можно большим, контролируя только несколько вещей, при этом устраняя как можно больше шума..

Конечно, поиск правильного баланса между допустимым количеством шума и желаемым размером выборки всегда зависит от того, что вы делаете, поэтому, в конце концов, вам нужно решить, будет ли количество шума, которое вы видите в ваш график приемлем для анализа, и если размер выборки достаточно велик.

Однако есть некоторые математические методы, которые вы можете использовать, чтобы помочь с этим, и об этом мы поговорим в расширенном сообщении в блоге на следующей неделе, если вам интересно..

Типы корреляции.

Выше мы видели примеры положительных и отрицательных линейных комбинаций при разной силе корреляции, но корреляции не обязательно должны быть линейными..

Они также могут иметь разные формы, такие как линейные, квадратичные, экспоненциальные, логарифмические и в основном любые другие функции, о которых вы только можете подумать..

На следующих графиках показано несколько примеров коррелированных переменных:

Мы можем видеть на крайнем левом графике, что, когда значение «x» увеличивается, значение «y» увеличивается на пропорциональную величину, и эта сумма всегда одинакова..

Связь между осью x и осью y может быть описана уравнением «y = mx + b», которое делает этот тип корреляции линейным (это также легко увидеть по прямой линии на графике)..

На среднем графике мы видим, что в зависимости от того, где мы находимся на графике, значение «y» уменьшается (на x.

На этом этапе очень важно отметить, что, хотя корреляции не обязательно должны быть линейными, стандартно искать только линейные корреляции, потому что их проще всего искать и легче всего проверять с помощью формул..

Давайте посмотрим на некоторые примеры корреляций, например:

Чем жарче погода, тем больше мороженого вы продаете Чем больше голосов получает ваш контент на Reddit, тем больше посетителей страницы вы получаете от этого сообщения Чем больше у вас подписчиков в Instagram, тем больше продаж вы делаете в своем бизнесе.

Чтобы лучше понять эти примеры, я визуализировал, как могут выглядеть графики для каждого из приведенных выше примеров..

Вот график зависимости количества покупателей мороженого от температуры:

Вот как посетители страницы сравнивают количество голосов на Reddit:

А вот ежемесячные продажи бизнеса в сравнении с подписчиками в Instagram:

Обратите внимание, что ни один из них не имеет реальной линейной формы..

И на самом деле — наши продажи мороженого, кажется, достигают максимума примерно на 200, посещения страниц из голосов Reddit, кажется, растут намного быстрее после того, как мы передаем 20-30 голосов, а продажи продуктов, похоже, растут медленнее, когда мы попадаем в тысячи подписчиков в Instagram..

Итак, чтобы быть более точным, мы могли бы сказать, что первый график выглядит как S (он же сигмовидная форма), второй график выглядит немного экспоненциальным или похожим на степенное отношение, а третий график выглядит немного логарифмическим, потому что он сглаживается.

Тем не менее, я все же рекомендую, чтобы, если он выглядит более или менее линейным, рассматривал некоторые его части как линейные для вашего анализа..

Моя точка зрения: эти корреляции выглядят достаточно близко к линейным, чтобы мы могли считать их части линейными, а не рассматривать их как более сложные формы, которые может быть труднее оценить и которые не приведут к значительным улучшениям ваших результатов..

Конечно, если связь слишком далека от линейной, вы не можете считать ее просто линейной..

Итак, из приведенных выше графиков мы можем прийти к следующим выводам, рассматривая их части как линейные корреляции как часть более сложных форм:

На графике мороженого есть определенный температурный диапазон, в котором потребительский спрос быстро растет (в центре), а во внешних регионах наблюдается небольшое изменение спроса. Нашему магазину мороженого не нужно планировать до последнего рожка мороженого, проданного в конкретный день, но было бы очень полезно знать, сколько ведер мороженого нужно приготовить в целом, исходя из завтрашнего прогноза погоды. С помощью Reddit мы можем подготовить наши серверы к увеличению трафика на случай, если наша публикация станет популярной, чтобы наши пользователи не слишком долго загружались на наш сайт. С помощью графика мы можем сделать обоснованные оценки ожидаемого трафика и минимизировать риск недо- или перекупленности. Или с нашими подписчиками в Instagram мы знаем, какую отдачу ожидать при определенном количестве подписчиков. Но с уменьшающейся отдачей, которую мы видим на графике выше, мы можем захотеть подумать о стратегиях, как сделать наших нынешних последователей более лояльными или заинтересованными, а не просто пытаться постоянно получать новых подписчиков..

В чем разница между причинно-следственной связью и корреляцией?

Итак, вопрос на миллион долларов: в чем разница между причинно-следственной связью и корреляцией.?

Короче говоря:

Корреляция — это мера того, как зависимая переменная реагирует на изменение независимой переменной. .

В конце концов, корреляция — это просто число, полученное из формулы .

Причинно-следственная связь — это особый тип отношений между коррелированными переменными, в котором говорится, что изменение одной переменной заставляет другую реагировать соответствующим образом..

Причинно-следственная связь добавляет реальный контекст и смысл корреляции .

Все причинные связи — это корреляции, но не все корреляции — это причинные связи..

У вас могут возникнуть корреляции между переменными чисто случайно, поэтому, размышляя о причинно-следственной связи, мы должны спросить себя:

Имеет ли смысл эта корреляция? Есть ли реальная связь между этими переменными? Сохранится ли / будет ли корреляция, если я посмотрю на некоторые новые данные, которые я не использовал в своем текущем анализе? Связь между этими переменными прямая, или они обе являются результатом какой-то другой переменной?

Примеры корреляции против причинно-следственной связи.

Вот несколько быстрых примеров корреляции и причинно-следственной связи ниже..

Примеры корреляции, а НЕ причинной связи:

«В те дни, когда я бегаю, я замечаю на дороге больше машин. «Лично я не ПРИЗЫВАЮ больше автомобилей выезжать на дорогу, когда я бегу. Просто потому, что я выбегаю на улицу, я вижу больше машин, чем когда остаюсь дома. Эта связь не является причинно-следственной, потому что ни машины, ни я не влияем друг на друга..

Хорошо, а как насчет примера, который на первый взгляд может показаться более связанным:

«В дни, когда я пью кофе, я чувствую себя более продуктивным. «Я, конечно, могу чувствовать себя более продуктивно благодаря кофеину. Но это также может быть связано с тем, что я хожу в кофейню, чтобы выпить кофе, и я более продуктивен в кофейне, чем дома, когда есть миллион отвлекающих факторов. Эта причинно-следственная связь НЕ подтверждена.

Примеры причинно-следственной связи:

После упражнений я чувствую себя физически истощенным. Это причинно-следственная связь, потому что я целенаправленно доводю свое тело до физического истощения, когда выполняю упражнения. Мышцы, которые я использовал для упражнений, истощены (эффект) после того, как я упражняюсь (причина). Эта причинно-следственная связь подтверждена. Когда я кормлю кошку более чем двумя лакомствами в день, она становится немного пухлее. Моя кошка толстеет, потому что я кормлю ее больше. Это причина и следствие. Причина в том, что я кормлю кошку лакомством, а в результате он становится немного круглее.

Различие между причинно-следственной связью и корреляцией может быть непростым, когда вещи имеют положительную или отрицательную корреляцию без причины или из-за, казалось бы, случайных, несвязанных причин..

Представим, что каждый раз, когда я пью кофе, в Испании цены на кукурузу растут..

Это будет положительная корреляция: когда я увеличиваю потребление кофе, цена на кукурузу растет..

Но делает ли это магическим образом причинно-следственную связь? Неа.

То, что я пью больше кофе, НЕ означает, что я вызываю рост цен на кукурузу в Испании..

Между мной и ценами на кукурузу нет причинно-следственной связи.

Хотя … если по какой-то странной, сложной логистической причине глобальной цепочки поставок, связанной с моим спросом на кофе, увеличивающим производство кофе в Испании, что затем каким-то образом увеличивает стоимость на соседних кукурузных полях, тем самым фактически увеличивая цены на кукурузу, и, НА ФАКТЕ, была причинная связь тогда это была бы другая история.

Но, к счастью, в этом сценарии, вероятно, нет причинно-следственного эффекта, только корреляция..

Эти примеры немного более анекдотичны с целью установления разницы между ними, но давайте рассмотрим более практический сценарий, в котором граница между причинно-следственной связью и корреляцией может быть размыта..

Например, давайте рассмотрим две переменные: 1) количество лайков на видео Youtube и 2) общее время просмотра видео..

Мы можем увидеть, что с увеличением количества лайков на видео увеличивается и общее время просмотра видео. Аналогичным образом, с увеличением общего времени просмотра увеличивается и количество лайков..

Следующее изображение представляет собой построенный мною график взаимосвязи между временем просмотра и количеством лайков для выбранной группы видео на Youtube, чтобы помочь нам визуализировать эту взаимосвязь:

Здесь мы видим слабую положительную корреляцию, которая не является полностью линейной, но для простоты мы будем приближать ее к линейной..

Но что это значит? И в каком направлении идет эта корреляция? Какая из них является зависимой, а какая независимой.?

Что ж, эти переменные могут быть слабо связаны друг с другом:

Чем больше лайков, тем больше людей смотрели видео дольше, потому что оно им понравилось, или что больше людей понравилось видео, потому что они смотрели его дольше и им понравилось..

Объяснения в обоих направлениях имеют смысл, но можно с уверенностью сказать, что ни одно из них на самом деле не вызывает друг друга..

Лучшая причинная переменная, которая также коррелирует с обеими этими переменными, — это переменная «количество просмотров» в видеороликах Youtube. Зрители несут ответственность за то, чтобы лайкать и смотреть видео, и, следовательно, они заставляют эти цифры расти..

В этом случае на самом деле может происходить то, что переменная «количество просмотров» ВЫЗЫВАЕТ более высокое время просмотра и увеличение количества лайков на видео. И переменные «время просмотра» и «лайки» коррелируют друг с другом только из-за их случайной связи с переменной «количество просмотров», но сами переменные «время просмотра» и «лайки» не связаны между собой причинно..

Итак, как вы понимаете, есть много случаев, когда мы можем получить корреляции между переменными, которые напрямую связаны с причинной связью между двумя..

Важно отметить, что если у вас есть причинная переменная, которая коррелирует с несколькими другими переменными, то эти другие переменные также могут быть коррелированы друг с другом просто из-за их зависимости от одной и той же причинной переменной..

Это то, что мы видели в примере выше..

Короче говоря, корреляция — это очень важная взаимосвязь между переменными, которая может указывать на причинно-следственные связи, но сами корреляции иногда могут вводить в заблуждение или неинформативно..

Если мы не оценили эту взаимосвязь и не нашли фактическое значение, которое связывает две переменные, нам не следует начинать принимать решения, основываясь на том, как мы нашли коррелированную, но в остальном, казалось бы, несвязанную переменную для поведения..

И это все, что написано в блоге на этой неделе.!

Следите за обновлениями на следующей неделе, и выйдет вторая часть этого сообщения в блоге, где мы более подробно рассмотрим эту тему..

Похожие статьи