Регрессия

Зависимость среднего значения какой-либо случайной величины от нек-рой другой величины или от нескольких величин. Если, например, при каждом значении х=xi наблюдается ni значений случайной величины Y, то зависимость средних арифметических этих значений от xi и является Р. в статистич. понимании этого термина. При обнаруженной закономерности изменения с изменением хпредполагается, что в основе наблюдаемого явления лежит вероятностная зависимость: при каждом фиксированном значении хслучайная величина Y имеет определенное распределение вероятностей с математич. ожиданием, к-рое является функцией х: Зависимость , где хиграет роль "независимой" переменной, наз. р е г р е с с и е й (или ф у н к ц ие й р е г р е с с и и) в вероятностном понимании этого термина. График функции т(х)наз. л и н и е й р ег р е с с и и, или к р и в о й р е г р е с с и и, величины Y по х. Переменная хназ. р е г р е с с и о н н о й п е р е м е н н о й, или р е г р е с с о р о м. Точность, с к-рой линия регрессии Yпо хпередает изменение Yв среднем при изменении х, измеряется дисперсией величины Y, вычисляемой для каждого значения х: Графически зависимость дисперсии s2 (х)от хвыражается т. н. с к е д а с т и ч е с к о й л и н и е й. Если s2 (х)=0при всех значениях x, то с вероятностью 1 величины связаны строгой функциональной зависимостью. Если s2 (х)№0ни при каком значении хи т (х)не зависит от х, то регрессия Yпо хотсутствует.. В теории вероятностей задача Р. решается применительно к такой ситуации, когда значения регрессионной переменной х соответствуют значениям нек-рой случайной величины Xи предполагается известным совместное распределение вероятностей величин Xи Y(при этом математич. ожидание и дисперсия будут соответственно условным математич. ожиданием и условной дисперсией случайной величины Yпри фиксированном значении X=x). В этом случае определены две Р.: Y по х и X по у, и понятие Р. может быть использовано также для того, чтобы ввести нек-рые меры взаимосвязанности случайных величин X и Y, определяемые как характеристики степени концентрации распределения около линий Р. (см. Корреляция). Функции Р. обладают тем свойством, что среди всех действительных функций f(x)минимум математич. ожидания достигается для функции f(x)= т (х), то есть регрессия Y по хдает наилучшее (в указанном смысле) представление величины Y. Наиболее важным является тот случай, когда регрессия Y по хл и н е й н а, т. е. Коэффициенты b0 и b1, наз. коэффициентами Р., легко вычисляются: (здесь r — корреляции коэффициент X и Y, , , и п р я м а я регрессии Y по х имеет вид (аналогичным образом находится прямая регрессии Xпо у). Точная линейная Р. имеет место в случае, когда двумерное распределение величин Xи Y является нормальным. В условиях статистич. приложений, когда для точного определения Р. нет достаточных сведений о форме совместного распределения вероятностей, возникает задача приближенного нахождения Р. Решению этой задачи может служить выбор из всех функций g(x), принадлежащих заданному классу, такой функции, к-рая дает наилучшее представление величины Y в том смысле, что минимизирует математич. ожидание . Найденная функция наз. с р е д н е й к в а д р а т и ч е с к о й Р. Простейшим будет случай л и н е й н о й с р е д н е й к в а д р а т и ч е с к о й Р., когда отыскивают наилучшую линейную аппроксимацию величины Y посредством величины X, т. е. такую линейную функцию , для к-рой выражение принимает наименьшее возможное значение. Данная экстремальная задача имеет единственное решение т. е. вычисление приближенной линии Р. приводит к тому же результату, к-рый получен в случае точной линейной Р.: Минимальное значение при вычисленных значениях параметров равно . Если регрессия т(х)существует, то при любых b0 и b1 имеет место соотношение откуда следует, что прямая средней квадратич. регрессии дает наилучшее приближение к линии регрессии т(х), если измерять расстояние вдоль оси у. Поэтому если линия т(х)есть прямая, то она совпадает с прямой средней квадратической Р. В общем случае, когда Р. сильно отличается от линейной, можно поставить задачу нахождения многочлена нек-рой степени т, для к-рого среднее значение имеет возможно меньшее значение. Такое решение задачи соответствует п а р а б о л ич е с к о й (или п о л и н о м и а л ь н о й) средней квадратической Р. (см. Параболическая регрессия).порядка т. Кривая есть парабола m-го порядка, дающая наилучшую аппроксимацию истинной линии Р. Обобщением параболической Р. служит функция Р., выраженная линейной комбинацией тех или иных заданных функций: Наиболее важное значение имеет случай, когда j0 (х), . . .,jm (х) — ортогональные многочлены соответствующих порядков, построенные по распределению X. Другими примерами н е л и н е й н о й (к р и в о л ин е й н о й) Р. являются случаи тригонометрической Р., показательной Р., и т. п. Понятие Р. естественным образом обобщается на тот случай, когда вместо одной регрессионной переменной рассматривается нек-рое множество переменных. Если случайные величины X1 Х2, . . ., Х п имеют совместное распределение вероятностей, то множественная Р. определяется, напр., как регрессия X1 по x2, . . . , х п: Соответствующее уравнение определяет поверхность регрессии Х 1 по х2, . . ., х n. Линейная регрессия Х 1 по х 2, . . ., х п имеет вид где b2, . . ., bn- коэффициенты Р. (при ). Линейная средняя квадратическая Р. величины Х 1 по x2, . . ., х п определяется как наилучшая линейная оценка величины Х 1 величинами Х 2, . .., Х п в смысле обращения в минимум выражения Соответствующая п л о с к о с т ь Р. дает наилучшую аппроксимацию поверхности регрессии x1=m(x2, . . ., х п), если последняя существует. Если поверхность Р. есть плоскость, то она необходимо совпадает с плоскостью средней квадратической Р. (так будет в случае, когда совместное распределение всех пвеличин нормально). Простым примером регрессии Yпо Xявляется зависимость между Yи X, к-рая выражается соотношением , где , а случайные величины Xи dнезависимы. Это представление полезно, когда планируется эксперимент для изучения функциональной связи у=и (х)между неслучайными величинами уи х. Эта же модель Р. используется во многих приложениях при изучении характера зависимости случайной величины Yот неслучайной величины х. На практике выбор функции у=и (х)и оценку неизвестных коэффициентов Р. по экспериментальным данным производят методами регрессионного анализа. Лит.:[1] К р а м е р Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; [2] К е н д а л л М. Д ж., С т ь ю а р т А., Статистические выводы и связи, пер. с англ., М., 1973. А.

Источник: Математическая энциклопедия на Gufo.me


Значения в других словарях

  1. Регрессия — I Регре́ссия моря (от лат. regressio — обратное движение, отход), отступание моря от берегов. Происходит в результате поднятия суши, опускания дна океана или уменьшения объёма воды в океанических бассейнах (например, во время ледниковых эпох). Большая советская энциклопедия
  2. регрессия — -и, ж. мат. Зависимость среднего значения какой-л. величины от некоторой другой величины или от нескольких величин. Малый академический словарь
  3. РЕГРЕССИЯ — РЕГРЕССИЯ — англ. regression; нем. Regression. 1. В теории вероятностей и математической статистике — зависимость среднего значения к.-л. величины от нек-рой величины или нескольких величин. Социологический словарь
  4. регрессия — Постепенное отступание моря от берегов, происходящее вследствие поднятия суши, опускания океанического дна или уменьшения объёма воды в Мировом океане (напр., в эпоху материкового обледенения ). Процесс, противоположный трансгрессии. География. Современная энциклопедия
  5. регрессия — Ре/гре́сс/и/я [й/а] [ср.: транс/гре́сс/и/я]. Морфемно-орфографический словарь
  6. регрессия — орф. регрессия, -и Орфографический словарь Лопатина
  7. Регрессия — (лат. regredere – движение вспять) (Freud S., 1900). Один из механизмов психологической защиты, при котором субъект возвращается к формам поведения, типичным для предшествующих стадий его развития. Толковый словарь психиатрических терминов
  8. регрессия — РЕГРЕССИЯ и, ж. regression, нем. Regression <�лат. regressio движение назад. 1. геол. Отступание моря при поднятие суши или опускании морского дна. Крысин 1998. Словарь галлицизмов русского языка
  9. регрессия — РЕГРЕССИЯ — изменение одного признака (результативный признак, функция) в зависимости от изменения на определенную величину другого признака (факториальный признак, аргумент), связанного с первым определенной корреляцией. Ботаника. Словарь терминов
  10. Регрессия — (от лат. regressio — обратное движение, отход * a. regression; н. Regression; ф. regression; и. regresion) — медленное отступление моря от берегов, происходящее вследствие поднятия суши, опускания океанич. дна или уменьшения объёма воды в океанич. Горная энциклопедия
  11. Регрессия — (лат. regressio отступление, отход) в статистике — мера изменения признака при изменении на определенную величину другого, коррелирующего с ним признака. Медицинская энциклопедия
  12. регрессия — РЕГРЕССИЯ -и; ж. Спец. Медленное отступание моря и расширение суши за счёт выступившего морского дна. Толковый словарь Кузнецова
  13. регрессия — [< лат regressio движение назад] – в стилистике – употребление слов в обратном порядке, например, “надо есть, чтобы жить, а не жить чтобы есть”. Большой словарь иностранных слов
  14. регрессия — регрессия ж. Отступание моря и расширение суши за счёт выступившего морского дна. Толковый словарь Ефремовой
  15. РЕГРЕССИЯ — РЕГРЕССИЯ (лат. regressio — движение назад) — 1) в наиболее распространенном значении — процесс, механизм и результат возвращения объекта в своей эволюции к ранее пройденным этапам, состояниям, формам и способам функционирования... Новейший философский словарь