Коллерировать это – Как вам слово «коррелироваться»? Почему именно такая форма? / Грамота
Корреляция — Википедия

Корреля́ция (от лат. correlatio «соотношение, взаимосвязь»), или корреляционная зависимость — статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.[1]
Математической мерой корреляции двух случайных величин служит корреляционное отношение η{\displaystyle \mathbf {\eta } }
Впервые в научный оборот термин корреляция ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века[4].
Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанёс пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «увеличение количества пожарных приводит к увеличению причинённого ущерба», и тем более не будет успешной попытка минимизировать ущерб от пожаров путём ликвидации пожарных бригад [5]. Корреляция двух величин может свидетельствовать о существовании общей причины, хотя сами явления напрямую не взаимодействуют. Например, обледенение становится причиной как роста травматизма из-за падений, так и увеличения аварийности среди автотранспорта. В этом случае две величины (травматизм из-за падений пешеходов и аварийность автотранспорта) будут коррелировать, хотя они не связаны причинно-следственно друг с другом, а лишь имеют стороннюю общую причину — гололедицу.
В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи. Например, зависимость может иметь сложный нелинейный характер, который корреляция не выявляет.
Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и её направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.
Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент корреляции Пирсона (корреляция моментов произведений). Если по меньшей мере одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую корреляцию Спирмена или τ{\displaystyle \mathbf {\tau } } (тау) Кендалла. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими — четырёхполевая корреляция. Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, когда связь между ними линейна (однонаправлена).
Параметрические показатели корреляции[править | править код]
Ковариация[править | править код]
Важной характеристикой совместного распределения двух случайных величин является ковариация (или корреляционный момент). Ковариация является совместным центральным моментом второго порядка.[6] Ковариация определяется как математическое ожидание произведения отклонений случайных величин[7]:
covXY=M[(X−M(X))(Y−M(Y))]=M(XY)−M(X)M(Y){\displaystyle \mathrm {cov} _{XY}=\mathbf {M} \left[(X-\mathbf {M} (X))(Y-\mathbf {M} (Y))\right]=\mathbf {M} (XY)-\mathbf {M} (X)\mathbf {M} (Y)},где M{\displaystyle \mathbf {M} } — математическое ожидание (в англоязычной литературе принято обозначение E{\displaystyle \mathbf {E} } от expected value).
Свойства ковариации:
- Ковариация двух независимых случайных величин X{\displaystyle \mathbf {X} } и Y{\displaystyle \mathbf {Y} } равна нулю[8].
- Абсолютная величина ковариации двух случайных величин X{\displaystyle \mathbf {X} } и Y{\displaystyle \mathbf {Y} } не превышает среднего геометрического их дисперсий: |covXY|⩽DXDY{\displaystyle |\mathrm {cov} _{XY}|\leqslant {\sqrt {\mathrm {D} _{X}\mathrm {D} _{Y}}}}[9].
Доказательство
Введём в рассмотрение случайную величину Z1=σYX−σXY{\displaystyle \mathbf {Z} _{1}=\mathbf {\sigma } _{Y}\mathbf {X} -\mathbf {\sigma } _{X}\mathbf {Y} } (где σ{\displaystyle \mathbf {\sigma } } — среднеквадратическое отклонение) и найдём её дисперсию D(Z1)=M[Z−mZ1]2{\displaystyle \mathbf {D} (Z_{1})=\mathbf {M} [\mathbf {Z} -m_{Z1}]^{2}}. Выполнив выкладки получим:
D(Z1)=2σ2Xσ2Y−2σXσYcovXY.{\displaystyle \mathbf {D} (Z_{1})=2\mathbf {\sigma ^{2}} _{X}\mathbf {\sigma ^{2}} _{Y}-2\mathbf {\sigma } _{X}\mathbf {\sigma } _{Y}\mathrm {cov} _{XY}.}
Любая дисперсия неотрицательна, поэтому
2σ2Xσ2Y−2σXσYcovXY⩾0{\displaystyle 2\mathbf {\sigma ^{2}} _{X}\mathbf {\sigma ^{2}} _{Y}-2\mathbf {\sigma } _{X}\mathbf {\sigma } _{Y}\mathrm {cov} _{XY}\geqslant 0}
Отсюда
covXY⩽σXσY.{\displaystyle \mathrm {cov} _{XY}\leqslant \mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}.}
Введя случайную величину Z2=σYX+σXY{\displaystyle \mathbf {Z} _{2}=\mathbf {\sigma } _{Y}\mathbf {X} +\mathbf {\sigma } _{X}\mathbf {Y} }, аналогично
covXY⩾−σXσY.{\displaystyle \mathrm {cov} _{XY}\geqslant -\mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}.}
Объединив полученные неравенства имеем
−σXσY⩽covXY⩽σXσY.{\displaystyle -\mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}\leqslant \mathrm {cov} _{XY}\leqslant \mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}.}
Или
|covXY|⩽σXσY.{\displaystyle |\mathrm {cov} _{XY}|\leqslant \mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}.}
Итак,
|covXY|⩽DXDY.{\displaystyle |\mathrm {cov} _{XY}|\leqslant {\sqrt {\mathrm {D} _{X}\mathrm {D} _{Y}}}.}
- Ковариация имеет размерность, равную произведению размерности случайных величин, то есть величина ковариации зависит от единиц измерения независимых величин. Данная особенность ковариации затрудняет её использование в целях корреляционного анализа[8].
Линейный коэффициент корреляции[править | править код]
Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон в 90-х годах XIX века. Коэффициент корреляции рассчитывается по формуле[10][8]:
rXY=covXYσXσY=∑(X−X¯)(Y−Y¯)∑(X−X¯)2∑(Y−Y¯)2.{\displaystyle \mathbf {r} _{XY}={\frac {\mathbf {cov} _{XY}}{\mathbf {\sigma } _{X}{\sigma }_{Y}}}={\frac {\sum (X-{\bar {X}})(Y-{\bar {Y}})}{\sqrt {\sum (X-{\bar {X}})^{2}\sum (Y-{\bar {Y}})^{2}}}}.}где X¯=1n∑t=1nXt{\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{t=1}^{n}X_{t}}, Y¯=1n∑t=1nYt{\displaystyle {\overline {Y}}={\frac {1}{n}}\sum _{t=1}^{n}Y_{t}} — среднее значение выборок.
Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы[11].
Доказательство
Разделив обе части двойного неравенства −σXσY⩽covXY⩽σXσY{\displaystyle -\mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}\leqslant \mathrm {cov} _{XY}\leqslant \mathrm {\sigma } _{X}\mathrm {\sigma } _{Y}} на σXσY{\displaystyle \mathbf {\sigma } _{X}\mathbf {\sigma } _{Y}} получим
−1⩽rXY⩽ 1.{\displaystyle -1\leqslant \mathbf {r} _{XY}\leqslant \ 1.}
Линейный коэффициент корреляции связан с коэффициентом регрессии в виде следующей зависимости:rXY=aiσXiσY,{\displaystyle \mathbf {r} _{XY}=\mathbf {a} _{i}{\frac {{\sigma }_{Xi}}{{\sigma }_{Y}}},} где ai{\displaystyle \mathbf {a} _{i}} — коэффициент регрессии, σXi{\displaystyle \mathbf {\sigma } _{Xi}} — среднеквадратическое отклонение соответствующего факторного признака[12]. Отношение коэффициента регрессии к среднеквадратичному отклонению Y не зависит от единиц измерения Y.
Непараметрические показатели корреляции[править | править код]
Коэффициент ранговой корреляции Кендалла[править | править код]
Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кендалла:
τ=2Sn(n−1){\displaystyle \tau ={\frac {2S}{n(n-1)}}},
где S=P−Q{\displaystyle S=P-Q}.
P{\displaystyle P} — суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y.
Q{\displaystyle Q} — суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются!)
τ∈[−1;1]{\displaystyle \tau \in [-1;1]}
Если исследуемые данные повторяются (имеют одинаковые ранги), то в расчетах используется скорректированный коэффициент корреляции Кендалла:
τ=S[n(n−1)2−Ux][n(n−1)2−Uy]{\displaystyle \tau ={\frac {S}{{\sqrt {[{\frac {n(n-1)}{2}}-U_{x}][{\frac {n(n-1)}{2}}-U_{y}}}]}}}
Ux=∑t(t−1)2{\displaystyle U_{x}={\frac {\sum {t(t-1)}}{2}}}
Uy=∑t(t−1)2{\displaystyle U_{y}={\frac {\sum {t(t-1)}}{2}}}
t{\displaystyle t} — число связанных рангов в ряду X и Y соответственно.
Коэффициент ранговой корреляции Спирмена[править | править код]
Степень зависимости двух случайных величин (признаков) X{\displaystyle X} и Y{\displaystyle Y} может характеризоваться на основе анализа получаемых результатов (X1,Y1),…,(Xn,Yn){\displaystyle (X_{1},Y_{1}),\ldots ,(X_{n},Y_{n})}. Каждому показателю X{\displaystyle X} и Y{\displaystyle Y} присваивается ранг. Ранги значений X{\displaystyle X} расположены в естественном порядке i=1,2,…,n{\displaystyle i=1,2,\ldots ,n}. Ранг Y{\displaystyle Y} записывается как Ri{\displaystyle R_{i}} и соответствует рангу той пары (X,Y){\displaystyle (X,Y)}, для которой ранг X{\displaystyle X} равен i{\displaystyle i}. На основе полученных рангов Xi{\displaystyle X_{i}} и Yi{\displaystyle Y_{i}} рассчитываются их разности di{\displaystyle d_{i}} и вычисляется коэффициент корреляции Спирмена:
ρ=1−6∑di2n(n2−1){\displaystyle \rho =1-{\frac {6\sum d_{i}^{2}}{n(n^{2}-1)}}}
Значение коэффициента меняется от −1 (последовательности рангов полностью противоположны) до +1 (последовательности рангов полностью совпадают). Нулевое значение показывает, что признаки независимы.
Коэффициент корреляции знаков Фехнера[править | править код]
Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.
i=C−HC+H{\displaystyle i={\frac {C-H}{C+H}}}
C — число пар, у которых знаки отклонений значений от их средних совпадают.
H — число пар, у которых знаки отклонений значений от их средних не совпадают.
Множественный коэффициент корреляции[править | править код]
Коэффициент множественной ранговой корреляции (конкордации)[править | править код]
W=12Sm2(n3−n){\displaystyle W={\frac {12S}{m^{2}(n^{3}-n)}}}
S=∑i=1n(∑j=1mRij)2−(∑i=1n∑j=1mRij)2n{\displaystyle S=\sum _{i=1}^{n}{(\sum _{j=1}^{m}{R_{ij}})^{2}}-{\frac {(\sum _{i=1}^{n}{\sum _{j=1}^{m}{R_{ij}}})^{2}}{n}}}
m{\displaystyle m} — число групп, которые ранжируются.
n{\displaystyle n} — число переменных.
Rij{\displaystyle R_{ij}} — ранг i{\displaystyle i}-фактора у j{\displaystyle j}-единицы.
Значимость:
χ2=m(n−1)∗W{\displaystyle \chi ^{2}=m(n-1)*W}
χ2kp=(α;(n−1)(m−1)){\displaystyle {\chi ^{2}}_{kp}=(\alpha ;(n-1)(m-1))}
χ2>χ2kp{\displaystyle \chi ^{2}>{\chi ^{2}}_{kp}}, то гипотеза об отсутствии связи отвергается.
В случае наличия связанных рангов:
W=12Sm2(n3−n)−m∑j=1m(t3j−tj){\displaystyle W={\frac {12S}{m^{2}(n^{3}-n)-m\sum _{j=1}^{m}{({t^{3}}_{j}-t_{j})}}}}
χ2=12Smn(n+1)−∑
коррелировать — это… Что такое коррелировать?
- коррелировать
- коррелировать
- рую, рует, несов. (нем. korrelieren лат. — см. корреляция).
спец. Соотноситься, быть взаимосвязанным с чем-н. Увеличение числа сердечных заболеваний коррелирует с усилением солнечной активности.
|| Ср. корреспондировать.
Толковый словарь иностранных слов Л. П. Крысина.- М: Русский язык, 1998.
.
- корреальный
- кортикализация
Смотреть что такое «коррелировать» в других словарях:
коррелировать — сопоставлять устанавливать — [http://slovarionline.ru/anglo russkiy slovar neftegazovoy promyishlennosti/] Тематики нефтегазовая промышленность Синонимы сопоставлятьустанавливать EN correlate … Справочник технического переводчика
Коррелировать — то есть производить расчет корреляции (математической или статистической взаимосвязи) между признаками … Физическая Антропология. Иллюстрированный толковый словарь.
коррелировать — коррел ировать, рует … Русский орфографический словарь
коррелировать — (I), коррели/рую, руешь, руют … Орфографический словарь русского языка
коррелировать — рую, руешь; нсв. Книжн. Находиться в отношениях корреляции. Эти процессы коррелируют друг с другом … Энциклопедический словарь
КОРРЕЛИРОВАТЬ — Помещать что то в ситуацию, в которой оно находится в известном соотношении с другими вещами. 2. Вычислять коэффициент корреляции … Толковый словарь по психологии
Коррелировать — устанавливать корреляцию между взаимосвязанными явлениями … Словарь экономических терминов и иностранных слов
коррелировать — рую, руешь; нсв.; книжн. Находиться в отношениях корреляции. Эти процессы коррелируют друг с другом … Словарь многих выражений
коррелировать — коррел/ир/ова/ть … Морфемно-орфографический словарь
Валидность конвергентная и дискриминантная — (лат. convergens – приближаться, сходиться; discrivinans – различающий, разделяющий) – степень, в какой любой определённый инструмент тестирования обладает валидностью, если мера значения, полученная по этому тесту будет: а) коррелировать с… … Энциклопедический словарь по психологии и педагогике
Корреляция — это… Что такое Корреляция?
Корреля́ция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.[1] Математической мерой корреляции двух случайных величин служит корреляционное отношение [2], либо коэффициент корреляции (или )[1]. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической[3].
Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.[4]
Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и ее направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.
Корреляция и взаимосвязь величин
Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанес пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «бо́льшее количество пожарных приводит к бо́льшему ущербу», и тем более не имеет смысла попытка минимизировать ущерб от пожаров путем ликвидации пожарных бригад.[5]В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи.
Показатели корреляции
Параметрические показатели корреляции
Ковариация
Важной характеристикой совместного распределения двух случайных величин является ковариация (или корреляционный момент). Ковариация являетcя совместным центральным моментом второго порядка.[6] Ковариация определяется как математическое ожидание произведения отклонений случайных величин[7]:
,где — математическое ожидание.
Свойства ковариации:
- Ковариация двух независимых случайных величин и равна нулю[8].
Доказательство
- Абсолютная величина ковариации двух случайных величин и не превышает среднего геометрического их дисперсий: [9].
Доказательство
Введём в рассмотрение случайную величину (где — среднеквадратическое отклонение) и найдём её дисперсию . Выполнив выкладки получим:
Любая дисперсия неотрицательна, поэтому
Отсюда
Введя случайную величину , аналогично
Объединив полученные неравенства имеем
Или
Итак,
- Ковариация имеет размерность, равную произведению размерности случайных величин, то есть величина ковариации зависит от единиц измерения независимых величин. Данная особенность ковариации затрудняет её использование в целях корреляционного анализа[8].
Линейный коэффициент корреляции
Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон (англ.)русск. в 90-х годах XIX века. Коэффициент корреляции рассчитывается по формуле[10][8]:
где , — среднее значение выборок.
Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы[11].
Доказательство
Разделив обе части двойного неравенства на получим
Линейный коэффициент корреляции связан с коэффициентом регрессии в виде следующей зависимости: где — коэффициент регрессии, — среднеквадратическое отклонение соответствующего факторного признака [12].
Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая пара значений маркируется при помощи определенного символа. Такой график называется «диаграммой рассеяния».
Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент корреляции Пирсона (корреляция моментов произведений). Если по меньшей мере одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую корреляцию Спирмена или (тау) Кендалла. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими: четырёхполевая корреляция. Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, когда связь между ними линейна (однонаправлена).
Непараметрические показатели корреляции
Коэффициент ранговой корреляции Кендалла
Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кендалла:
,
где .
— суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y.
— суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются!)
Если исследуемые данные повторяются (имеют одинаковые ранги), то в расчетах используется скорректированный коэффициент корреляции Кендалла:
— число связанных рангов в ряду X и Y соответственно.
Коэффициент ранговой корреляции Спирмена
Каждому показателю X и Y присваивается ранг. На основе полученных рангов рассчитываются их разности и вычисляется коэффициент корреляции Спирмена:
Коэффициент корреляции знаков Фехнера
Подсчитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения.
C — число пар, у которых знаки отклонений значений от их средних совпадают.
H — число пар, у которых знаки отклонений значений от их средних не совпадают.
Коэффициент множественной ранговой корреляции (конкордации)
— число групп, которые ранжируются.
— число переменных.
— ранг -фактора у -единицы.
Значимость:
, то гипотеза об отсутствии связи отвергается.
В случае наличия связанных рангов:
Свойства коэффициента корреляции
- если принять в качестве скалярного произведения двух случайных величин ковариацию , то норма случайной величины будет равна , и следствием неравенства Коши — Буняковского будет:
- .
- Коэффициент корреляции равен тогда и только тогда, когда и линейно зависимы (исключая события нулевой вероятности, когда несколько точек «выбиваются» из прямой, отражающей линейную зависимость случайных величин):
- ,
- где . Более того в этом случае знаки и совпадают:
- .
Доказательство
Рассмотрим случайные величины X и Y c нулевыми средними, и дисперсиями, равными, соответственно, и . Подсчитаем дисперсию случайной величины :
Если предположить, что коэффициент корреляции
то предыдущее выражение перепишется в виде
Поскольку всегда можно выбрать числа a и b так, чтобы (например, если , то берём произвольное a и ), то при этих a и b дисперсия , и значит почти наверное. Но это и означает линейную зависимость между X и Y. Доказательство очевидным образом обобщается на случай величин X и Y с ненулевыми средними, только в вышеприведённых выкладках надо будет X заменить на , и Y — на .
- Если независимые случайные величины, то . Обратное в общем случае неверно.
Корреляционный анализ
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям (используя коэффициент детерминации).[1][2]
Ограничения корреляционного анализа

- Применение возможно при наличии достаточного количества наблюдений для изучения. На практике считается, что число наблюдений должно быть не менее, чем в 5-6 раз превышать число факторов (также встречается рекомендация использовать пропорцию не менее, чем в 10 раз превышающую количество факторов). В случае, если число наблюдений превышает количество факторов в десятки раз, в действие вступает закон больших чисел, который обеспечивает взаимопогашение случайных колебаний.[13]
- Необходимо, чтобы совокупность значений всех факторных и результативного признаков подчинялась многомерному нормальному распределению. В случае, если объём совокупности недостаточен для проведения формального тестирования на нормальность распределения, то закон распределения определяется визуально на основе корреляционного поля. Если в расположении точек на этом поле наблюдается линейная тенденция, то можно предположить, что совокупность исходных данных подчиняется нормальному закону распределения.[14].
- Исходная совокупность значений должна быть качественно однородной.[13]
- Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных предшествует или является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.[5]
Область применения
Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. В различных прикладных отраслях приняты разные границы интервалов для оценки тесноты и значимости связи.
Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.
Корреляция — взаимосвязь признаков (может быть положительной или отрицательной). Обусловлена сцеплением генов или плейотропией[15]
См. также
Примечания
- ↑ 1 2 3 Шмойлова, 2002, с. 272
- ↑ 1 2 Елисеева, Юзбашев, 2002, с. 232
- ↑ Елисеева, Юзбашев, 2002, с. 228
- ↑ Елисеева, Юзбашев, 2002, с. 228-229
- ↑ 1 2 Елисеева, Юзбашев, 2002, с. 229
- ↑ Суслов, Ибрагимов, Талышева, Цыплаков, 2005, с. 141
- ↑ Гмурман, 2004, с. 176-177
- ↑ 1 2 3 Гмурман, 2004, с. 177
- ↑ Гмурман, 2004, с. 178-179
- ↑ Шмойлова, 2002, с. 300
- ↑ Гмурман, 2004, с. 179
- ↑ Шмойлова, 2002, с. 301
- ↑ 1 2 Елисеева, Юзбашев, 2002, с. 230
- ↑ Шмойлова, 2002, с. 275
- ↑ Самигуллина Н. С. Практикум по селекции и сортоведению плодовых и ягодных культур: Учебное издание. — Мичуринск: Мичуринский государственный аграрный университет, 2006. — 197 с.
Литература
- Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с. — ISBN 5-06-004214-6
- Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 4-е издание, переработанное и дополненное. — Москва: Финансы и Статистика, 2002. — 480 с. — ISBN 5-279-01956-9
- Общая теория статистики: Учебник / Под ред. Р.А. Шмойловой. — 3-е издание, переработанное. — Москва: Финансы и Статистика, 2002. — 560 с. — ISBN 5-279-01951-8
- Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия. — Новосибирск: СО РАН, 2005. — 744 с. — ISBN 5-7692-0755-8
Ссылки
4461. Как правильно: коррелирует или коррелируется?: albercul — LiveJournal
В литературе, особенно естественнонаучной, широко употребляется глагольное производное от очень важного и очень значимого слова «корреляция».Весьма показательной в этом отношении можно считать, к примеру, сравнительно недавнюю статью известного московского биолога Александра Маркова «Гены, способствующие получению хорошего образования, отсеиваются отбором» (http://elementy.ru/novosti_nauki/432918), в тексте которой это производное использовано, по моим подсчетам, 9 раз.
Но как же, все-таки, будет правильно: некая условная величина А коррелирует с некой условной величиной В или же коррелируется с ней?
Многие (если не все), по устоявшейся традиции, пишут коррелирует. В их числе и упомянутый автор: «образование, как правило, отрицательно коррелирует с дарвиновской приспособленностью: образованные люди хуже размножаются»; «интеллект положительно коррелирует с физическим здоровьем». И т.д., по тексту упомянутой статьи.
Со своим вопросом я обратился к одному профессиональному лингвисту (доктору наук, заведующему кафедрой). И вот что мне он ответил:
— Можно и так, и сяк. Лично мне привычнее форма коррелировать (соотноситься, быть взаимосвязанным). Вот пример из «Толкового словаря иноязычных слов» Л.П. Крысина: «Увеличение числа сердечных заболеваний коррелирует с усилением солнечной активности» – М., 2007. С. 400).
Однако современные лексикографические издания допускают и коррелироваться с чем-либо. Об этом см. вопросы № 272754 и № 223538: http://new.gramota.ru/spravka/buro/search-answer?s=коррелировать
Надо сказать, ответ специалиста меня несколько озадачил.
Ведь коррелировать и коррелироваться – не одно и то же. Мы имеем здесь два разных значения (понятия). Коррелировать – это, по сути дела, производить (делать, осуществлять) корреляцию. Но где же мы видим такого рода произведение (делание, осуществление), хотя бы даже по какому-то одному конкретному примеру данного словоупотребления? Совсем иной получается смысл, когда к слову прибавляется частица «ся» – коррелироваться (возвратная форма глагола). Это (и только это) означает само соотношение, соответствие чего-либо между собой (то есть собственно корреляцию).
Если уж «соотноситьСЯ» с чем-то – тогда уж точно и коррелироватьСЯ с ним. Не правда ли?
Отсюда мне непонятна не только правомерность отождествления семантически разных терминов – коррелировать и коррелироваться. Но и непонятен тот факт, что, несомненно, правильное словоупотребление (коррелироваться) оказалось в литературной практике как бы на задворках, или как бы в тени сомнительного, но в то же время доминирующего слова (коррелировать). Сказано же было лингвистом: «современные лексикографические издания допускают и коррелироваться с чем-либо». Ишь ты, допускают! Но, как говорится, и на том спасибо.)
Такая непоследовательность и путаница (более чем странная) приводит к мысли о том, что русская лингвистика изначально (после Ж. Кювье, который впервые ввел в научный оборот термин «корреляция» в XVIII веке применительно к палеонтологии, и Ф. Гальтона, который первым стал использовать этот термин в статистике в конце XIX века) некритически и без должного анализа отнеслась к новому иностранному слову и пошла по ложному пути использования некорректного (но, видимо, более удобного для произношения и написания) его производного коррелирует вместо корректного коррелируется. В данном случае практика (как это иногда бывает) опередила теорию, Но, увы, в неверном направлении.
Когда же русская литература (особенно естественнонаучная) переполнилась этой лексической псевдоконструкцией, законодателям от лингвистики ничего не осталось (так сказать, для спасения чести мундира) как притягивать за уши не выдерживающие элементарной критики обоснования ее правомерности. А робкое допущение (разрешение!) употреблять наряду и наравне с коррелировать слово коррелироваться (единственно корректное!) лишь подчеркивает неловкость (если не сказать большего) ситуации, создавшейся в русской лингвистике и ставшей уже, к сожалению, историческим фактом.
корреляция — Викисловарь
Морфологические и синтаксические свойства
падеж | ед. ч. | мн. ч. |
---|---|---|
Им. | корреля́ция | корреля́ции |
Р. | корреля́ции | корреля́ций |
Д. | корреля́ции | корреля́циям |
В. | корреля́цию | корреля́ции |
Тв. | корреля́цией корреля́циею | корреля́циями |
Пр. | корреля́ции | корреля́циях |
кор-ре-ля́-ци·я
Существительное, неодушевлённое, женский род, 1-е склонение (тип склонения 7a по классификации А. А. Зализняка).
Корень: -коррел-; суффикс: -яциj; окончание: -я [Тихонов, 1996].
Произношение
- МФА: [kərʲɪˈlʲat͡sɨɪ̯ə]
Семантические свойства
Значение
- матем. статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми) ◆ Высок коэффициент парной корреляции между переменными x₁ и x₃ (коэффициент корреляции 0,9), что показывает их тесную корреляционную взаимосвязь. К. М. Семенович, Б. П. Чупрынов, «Математика для экономистов: Учебное пособие», 2015 г. (цитата из библиотеки Google Книги)◆ Если, когда увеличивается одно значение, то в большинстве случаев увеличивается и второе, корреляция положительная, а если одно значение уменьшается при увеличении второго, то тут корреляция уже отрицательная, или обратная. Пример отрицательной корреляции — график, показывающий, как соотносится температура воздуха с высотой над уровнем моря. Чем выше на гору вы забираетесь, тем холоднее воздух. М. Эскью, Р. Истуэй, «Математика с удовольствием!», 2017 г. (цитата из библиотеки Google Книги)
- психол. взаимное соотношение, соответствие понятий и явлений ◆ Всё большее количество фактов поддерживают теорию, согласно которой существует корреляция между Я-концепцией и успеваемостью в школе. У успешных учеников более развитое чувство достоинства, и они в какой-то мере лучше относятся к себе (Garzarelli, Ever art, and Lester, 1993). Тем не менее эта связь обратима. Те, у кого высокая самооценка, лучше учатся в школе, а те, кто хорошо учится в школе, имеют более высокую самооценку… Ф. Райс, «Психология подросткового и юношеского возраста», 2010 г. (цитата из библиотеки Google Книги)◆ Положительные, но умеренные по величине корреляции между учебными оценками и результатами тестирования не позволяли исследователям однозначно утверждать, что интеллект детерминирует успешность обучения. В. Н. Дружинин, «Психология общих способностей. 3-е изд.», 2013 г. (цитата из библиотеки Google Книги)◆ «Корреляция» в прямом переводе означает соотношение. Если изменение одной переменной сопровождается изменением другой, то говорят о корреляции этих переменных. Наличие корреляции двух переменных не является свидетельством наличия причинно-следственных зависимостей между ними, но даёт возможность выдвинуть такую гипотезу. Отсутствие корреляции позволяет опровергнуть гипотезу о причинно-следственной связи переменных. М. Коновалова, «Экспериментальная психология: конспект лекций», 2017 г. (цитата из библиотеки Google Книги)
- книжн. взаимная связь явлений, соотношение ◆ Корреляция между атмосферным давлением и влажностью воздуха. ◆ Количество уголовных преступлений и рост безработицы находятся друг к другу в прямой корреляции.
- биол. взаимная согласованность функций частей и строения и животного или растения, которая поддерживает постоянство его внутренней среды и является следствием приспособления организма к условиям его существования ◆ Закон корреляции (Ж. Кювье, 1793): в организме, как целостной системе, все его части соответствуют друг другу как по строению, так и по выполняемым функциям. Р. Е. Михайловна, Ш. Т. Матвеевна, Ш. Л. Алексеевна, «Биология (Учебник)», 2016 г. (цитата из библиотеки Google Книги)
- лог. отношение между двумя одинаковыми по форме связями; в случае, если одна связь становится изоморфной другой, тогда это — корреляция, а само закономерное структурное изменение – коррелятор ◆ Отсутствует пример употребления (см. рекомендации).
Синонимы
- ?
- взаимосвязь
- ?
- ?
- ?
Антонимы
- —
- ?
- ?
- ?
Гиперонимы
- взаимосвязь
- ?
- ?
- ?
Гипонимы
- ?
- ?
- ?
Родственные слова
Этимология
От лат. correlatio «соотношение», далее из cum (варианты co-, com-, con-) «с, вместе» + relatio «отнесение», далее из relatus «отнесённый», прич. прош. от referre «нести назад, уносить обратно; приурочивать», далее из re- «обратно; опять, снова; против» + ferre «носить», из праиндоевр. *bher- «брать, носить».
Перевод
Библиография
- С. С. Степанов (2005) Популярная психологическая энциклопедия. — М.: Эксмо.
- Философский энциклопедический словарь (2010)
![]() | Для улучшения этой статьи желательно:
|
Морфологические и синтаксические свойства
корреляция
Существительное.
Корень: —.
Произношение
Семантические свойства
Значение
- матем. корреляция ◆ Отсутствует пример употребления (см. рекомендации).
Синонимы
Антонимы
Гиперонимы
Гипонимы
Родственные слова
Ближайшее родство | |
Этимология
От ??
Фразеологизмы и устойчивые сочетания
Библиография
Морфологические и синтаксические свойства
корреляция
Существительное.
Корень: —.
Произношение
Семантические свойства
Значение
- матем. корреляция ◆ Отсутствует пример употребления (см. рекомендации).
Синонимы
Антонимы
Гиперонимы
Гипонимы
Родственные слова
Ближайшее родство | |
Этимология
От ??
Фразеологизмы и устойчивые сочетания
Библиография
Морфологические и синтаксические свойства
корреляция
Существительное.
Корень: —.
Произношение
Семантические свойства
Значение
- матем. корреляция ◆ Отсутствует пример употребления (см. рекомендации).
Синонимы
Антонимы
Гиперонимы
Гипонимы
Родственные слова
Ближайшее родство | |
Этимология
От ??
Фразеологизмы и устойчивые сочетания
Библиография
КОРРЕЛЯЦИЯ — это… Что такое КОРРЕЛЯЦИЯ?
корреляция — КОРРЕЛЯЦИЯ (с. 325) (от позднелат. correlatio соотношение) термин, применяемый в различных областях знания, в том числе и в психологии, для обозначения взаимного соотношения, соответствия понятий и явлений. Большинство психологических… … Большая психологическая энциклопедия
КОРРЕЛЯЦИЯ — (correlation) Степень зависимости между двумя переменными. Линейная корреляция между двумя переменными х и у определяется знаком и величиной Σi (xi μx )(yi μy), где μx и μy среднее значение х и у. Между двумя переменными существует положительная… … Экономический словарь
корреляция — соотношение, соотнесение, взаимосвязь, взаимозависимость, взаимообусловленность, взаимосоответствие Словарь русских синонимов. корреляция сущ., кол во синонимов: 8 • автокорреляция (1) … Словарь синонимов
КОРРЕЛЯЦИЯ — (от франц. correlation соотношение) в статистике понимается как взаимоотношение между изучаемыми статистическими величинами, рядами и группами; для определения наличия или отсутствия К. статистика пользуется особым методом. Метод К. применяется… … Большая медицинская энциклопедия
корреляция — — [http://www.rfcmd.ru/glossword/1.8/index.php?a=index d=23] корреляция Величина, характеризующая взаимную зависимость двух случайных величин X и Y — безразлично, определяется ли она некоторой причинной связью или просто случайным… … Справочник технического переводчика
Корреляция — взаимосвязь двух или нескольких величин, при которой изменения одной или нескольких из них приводят к изменению другой или других . К. считается простой, когда речь идет об отношениях между двумя величинами или переменными (например, между… … Словарь бизнес-терминов
КОРРЕЛЯЦИЯ — в математической статистике вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов … Большой Энциклопедический словарь
КОРРЕЛЯЦИЯ — (от лат. correlatio соотношение) 1) в логике – отношение между двумя одинаковыми по форме связями. Если благодаря закономерному изменению структуры одна связь становится изоморфной (равной по форме) другой, тогда это отношение обеих связей… … Философская энциклопедия
корреляция — и, ж. corrélation f., нем. Korrelation <лат. correlatio соотношение. Впервые отмечается в словаре Гавкина 1894 г. ЭС. Взаимная связь, соотношение предметов или понятий. Закон корреляции. Функциональная корреляция. БАС 1. Рост безработицы и… … Исторический словарь галлицизмов русского языка
Корреляция — [correlation] величина, характеризующая взаимную зависимость двух случайных величин X и Y безразлично, определяется ли она некоторой причинной связью или просто случайным совпадением (ложной корреляцией). Для того, чтобы определить эту… … Экономико-математический словарь
КОРРЕЛЯЦИЯ — это… Что такое КОРРЕЛЯЦИЯ?
корреляция — КОРРЕЛЯЦИЯ (с. 325) (от позднелат. correlatio соотношение) термин, применяемый в различных областях знания, в том числе и в психологии, для обозначения взаимного соотношения, соответствия понятий и явлений. Большинство психологических… … Большая психологическая энциклопедия
КОРРЕЛЯЦИЯ — [лат. correlatio] взаимная связь, соотношение предметов или понятий. Словарь иностранных слов. Комлев Н.Г., 2006. КОРРЕЛЯЦИЯ новолатинск. от relata. Взаимное отношение, например, существующее между опекуном и опекаемым. Объяснение 25000… … Словарь иностранных слов русского языка
КОРРЕЛЯЦИЯ — (correlation) Степень зависимости между двумя переменными. Линейная корреляция между двумя переменными х и у определяется знаком и величиной Σi (xi μx )(yi μy), где μx и μy среднее значение х и у. Между двумя переменными существует положительная… … Экономический словарь
корреляция — соотношение, соотнесение, взаимосвязь, взаимозависимость, взаимообусловленность, взаимосоответствие Словарь русских синонимов. корреляция сущ., кол во синонимов: 8 • автокорреляция (1) … Словарь синонимов
КОРРЕЛЯЦИЯ — (от франц. correlation соотношение) в статистике понимается как взаимоотношение между изучаемыми статистическими величинами, рядами и группами; для определения наличия или отсутствия К. статистика пользуется особым методом. Метод К. применяется… … Большая медицинская энциклопедия
корреляция — — [http://www.rfcmd.ru/glossword/1.8/index.php?a=index d=23] корреляция Величина, характеризующая взаимную зависимость двух случайных величин X и Y — безразлично, определяется ли она некоторой причинной связью или просто случайным… … Справочник технического переводчика
Корреляция — взаимосвязь двух или нескольких величин, при которой изменения одной или нескольких из них приводят к изменению другой или других . К. считается простой, когда речь идет об отношениях между двумя величинами или переменными (например, между… … Словарь бизнес-терминов
КОРРЕЛЯЦИЯ — в математической статистике вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов … Большой Энциклопедический словарь
КОРРЕЛЯЦИЯ — (от лат. correlatio соотношение) 1) в логике – отношение между двумя одинаковыми по форме связями. Если благодаря закономерному изменению структуры одна связь становится изоморфной (равной по форме) другой, тогда это отношение обеих связей… … Философская энциклопедия
корреляция — и, ж. corrélation f., нем. Korrelation <лат. correlatio соотношение. Впервые отмечается в словаре Гавкина 1894 г. ЭС. Взаимная связь, соотношение предметов или понятий. Закон корреляции. Функциональная корреляция. БАС 1. Рост безработицы и… … Исторический словарь галлицизмов русского языка
Корреляция — [correlation] величина, характеризующая взаимную зависимость двух случайных величин X и Y безразлично, определяется ли она некоторой причинной связью или просто случайным совпадением (ложной корреляцией). Для того, чтобы определить эту… … Экономико-математический словарь