статистические параметры стилей

Объект изучения, исследуемый при помощи статистических методов, направленных на анализ:

1) употребительности языковых фактов с точки зрения их нормативности;

2) принадлежности стилю языка;

3) принадлежности стилю отдельного автора. Выборки должны быть однородными и одинакового объема или длины. При использовании лингвостатистических методов исследователь оперирует средними частотами и частотностью (долями), понимаемой как отношение наблюдаемой частоты к длине. Статистическая методика заменяет полное обследование текста серией выборок — наблюдений (выборочная частота обозначается знаком х с показателем выборки: х1, х2, наблюдение – знаком ni). Средняя частота х есть отношение суммы (знак суммирования) всех выборочных частот к числу выборок: . Средняя частота отличается от выборочных частот, поэтому статистическая интерпретация предполагает обобщение отклонения средней частоты от выборочных частот. Усредненная мера отклонения от средней частоты в математической статистике и теории вероятностей называется дисперсией и обозначается буквой σ. Дисперсия – среднее арифметическое из квадрата отклонений величин x от их среднего арифметического, т.е. от средней частоты. или . Среднее квадратичное отклонение есть квадратный корень из дисперсии. Статистически изучаются и выборочные частоты, и частотные доли. Доля как отношение наблюдаемой частоты к длине выборки определяется при помощи формулы вероятности: р = m/n, где р – доля. Статистическое сравнение долей изучается при помощи вычисления квадратичного отклонения доли, критерия xu -квадрат и критерия Стьюдента. Распределение частот и частотных долей в тексте того или иного автора дает возможность выявить постоянные (константные) особенности текста, а также индивидуальные (случайные) особенности, касающиеся употребительности отдельных единиц и их длины.

Источник: Словарь лингвистических терминов Жеребило на Gufo.me