Непараметрические методы в статистике

Posted On 02.02.2018

Непараметрические Методы Статистики

Методы математич. статистики, не предполагающие знания функционального вида генеральных распределений. Название «непараметрические методы» подчеркивает их отличие от классических — параметрических — методов, в к-рых предполагается, что генеральное распределение известно с точностью до конечного числа параметров, и к-рые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять гипотезы относительно их значений. Пример. Пусть — две независимые выборки, извлеченные из совокупностей с непрерывными генеральными функциями распределения Fи G; и пусть проверяется гипотеза Н о о равенстве распределений Fи Gпротив альтернативы сдвига, т. е. гипотезы для всех tи нек-рого . В классич. варианте этой задачи предполагается, что функции распределения Fи Gнормальны, и для проверки рассматриваемой гипотезы используется Стъюдента критерий. При не-параметрич. постановке задачи о виде Fи Gне делается никаких предположений, кроме непрерывности. Типичным непараметрич. критерием для проверки гипотезы против является Вилкоксона критерий, основанный на сумме рангов элементов первой выборки в общем вариационном ряду. Гипотезу о равенстве распределений отвергают, если вычисленная по наблюдениям статистика критерия оказывается слишком большой или слишком малой. Статистика критерия Вилкоксона проста для вычислений, а ее распределение при Н о не зависит от F. Критич. значения, отвечающие заданному значимости уровню при небольших значениях ти п, находят по таблицам (см., напр., ); при больших ти п пользуются нормальной аппроксимацией. В ряде случаев важно не столько проверить гипотезу об отсутствии сдвига, сколько оценить этот сдвиг , к-рыи может интерпретироваться, напр., как изменение урожайности при смене способа обработки почвы или дополнительное время сна при применении снотворного. Оценка параметра посредством величины , к-рая вполне удовлетворительна в нормальном случае, является очень неустойчивой к отклонениям от нормальности и может даже не быть состоятельной. Гораздо лучшими свойствами в этом отношении обладает непараметрич. оценка (см. ): медиана набора чисел Эта оценка тесно связана с критерием Вилкоксона. Можно сказать, что она находится в том же отношении к оценке в каком критерий Вилкоксона находится к критерию Стьюдента. Несмотря на многообразие задач, решаемых с помощью непараметрич. методов, эти задачи можно условно разделить на две большие части: задачи проверки гипотез и задачи оценки неизвестных распределений и параметров, к-рые понимаются как нек-рые функционалы от этих распределений. Непараметрич. проверка статистич. гипотез — наиболее развитая часть Н. м. с. Требуется построить процедуру (критерий), позволяющую принять или отвергнуть проверяемую гипотезу при заданной альтернативе. Типичным примером является проверка согласия, другими важными для приложений примерами являются проверка симметрии, независимости и случайности. Задача проверки согласия состоит в том, что по выборке из совокупности с генеральной функцией распределения требуется проверить гипотезу о том, что , где — заданная непрерывная функция распределения. Непараметрич. характер задачи проявляется здесь в непараметричности альтернативы, к-рая может быть сформулирована, напр., в одностороннем варианте: или , либо в двустороннем:. Задача проверки симметрии заключается в проверке симметрии генеральной функции распределения Gотносительно заданной точки , т. е. равенства В качестве альтернатив могут выступать односторонние условия со строгим неравенством хотя бы для одного tлибо двустороннее условие того же типа. Задача проверки независимости возникает в тех случаях, когда необходимо проверить, являются ли независимыми два признака, наблюдаемые у одного и того же объекта, по независимым наблюдениям над такими объектами. Сходным образом формулируется и гипотеза случайности, когда предполагается, что элементы выборки — независимые и одинаково распределенные величины. Наряду с альтернативами общего вида встречаются случаи, когда оказывается возможным указать, чем именно будут отличаться распределения элементов выборки при альтернативе; так возникают, напр., альтернативы тренда и регрессии. Способы алгоритмич. построения непараметрич. процедур с заданными свойствами разработаны пока недостаточно, и большую роль в выборе подходящей процедуры играют обычно интуиция и эвристич. соображения. На этом пути накоплено большое количество способов и приемов решения часто встречающихся непараметрич. задач (см. ). Большая группа непараметрич. критериев основана на использовании эмпирич. функции распределения. Пусть — эмпирич. функция распределения, построенная по выборке объема пиз совокупности с генеральной функцией распределения F. В силу теоремы Гливенко — Кантелли с вероятностью 1. Таким образом, эмпирическая и истинная функции распределения с вероятностью 1 неограниченно сближаются, и на мере их близости можно основывать критерии согласия с гипотезой об истинной функции распределения. Первыми критериями этого типа были Колмогорова критерий и Крамера- Мизеса критерий, предложенные в начале 30-х гг. 20 в. и основанные соответственно на статистиках и Следует отметить, что обе эти статистики имеют распределения, не зависящие от генеральной функции распределения F, если только последняя непрерывна. Их предельные распределения, найденные в середине 30-х гг. А. Н. Колмогоровым и Н. В. Смирновым, табулированы, что позволяет приближенно найти границу критич. области, отвечающей заданному уровню значимости (см. ). Предложено и изучено много вариантов критериев согласия, основанных на разности и , напр. Реньи критерий, критерии Андерсона — Дарлинга, Ватсона и др. (см. ). Для успешного их применения в случае больших выборок необходимо в первую очередь знать соответствующие предельные распределения. Последние могут быть найдены с помощью подхода, в соответствии с к-рым статистика критерия представляется в виде непрерывного функционала от эмпирич. процесса где — эмпирическая функция распределения, построенная по выборке объема nиз равномерного распределения на . Процесс слабо сходится в пространстве D к нек-рому гауссовскому процессу, т. н. броуновскому мосту (см. ). Поэтому предельное распределение изучаемой статистики совпадает с распределением соответствующего функционала от броуновского моста, к-рое вычисляется с помощью стандартных методов. Существуют модификации статистик и , предназначенные для проверки гипотез о распределении в многомерном случае, а также для проверки гипотез независимости и симметрии. В этих случаях возникает ряд дополнительных трудностей. Напр., в многомерном случае все рассмотренные статистики теряют свойство универсальности (независимости от исходного распределения). Наиболее важен случай равномерного распределения на единичном кубе, поскольку выборку из многомерного распределения .можно тем или иным способом превратить в выборку из равномерного распределения. Однако ни точное, ни предельное распределения статистики Колмогорова неизвестны (1982) даже в этом простом случае. Сходные затруднения появляются и в том случае, когда проверяется не простая, а сложная гипотеза о распределении, т. е. если предполагается, что генеральная функция распределения имеет вид , где — неизвестный параметр, одномерный или многомерный. В этом случае естественно оценить по выборке, напр, посредством оценки максимального правдоподобия , и сравнивать с . Статистики и их разновидности можно построить, как и в случае простой гипотезы. Однако распределения этих статистик — как точные, так и предельные — оказываются снова зависящими от вида F, а во многих случаях — и от неизвестного истинного значения . Задача вычисления этих распределений трудна и точный вид их неизвестен, хотя для статистик типа в ряде случаев удается составить таблицы предельного распределения (см. ). Для нек-рых других статистик известны процентные точки, вычисленные экспериментальным путем. Наряду с рассмотренными выше критериями согласия строятся их двухвыборочные и многовыборочные аналоги, к-рые могут использоваться как для проверки согласия, так и для проверки однородности нескольких выборок (см. Смирнова критерии). Общим свойством критериев согласия и однородности, основанных на эмпирич. функции распределения, является состоятельность против любых альтернатив. Однако выбор той или иной статистики в практич. задаче затруднен недостаточной изученностью их мощностных свойств. При больших объемах выборок можно опираться на значения асимптотич. относительной эффективности (АОЭ) по Питмену, вычисленные для ряда наиболее простых статистик (см. ). Другую группу непараметрич. критериев образуют ранговые критерии. Наиболее раннее использование рангового критерия знаков встречается у Дж. Арбетнотта (J. Arbuthnolt, 1710), к-рый использовал его при анализе статистич. данных о рождаемости мальчиков и девочек для получения «аргументов в пользу божественного провидения». Однако современный период развития ранговых критериев начинается в кон. 30-х гг. 20 в. После опубликования в 1945 работы Ф. Вилкоксона (F. Wilcoxon), в к-рой был предложен ранговый критерий, носящий его имя, ранговые методы вступают в период интенсивного развития. Использование ранговых процедур основано на следующем соображении. Поскольку вектор рангов вместе с вектором порядковых статистик содержит всю информацию, содержащуюся в выборке, то нек-рая доля этой информации содержится только в ранговом векторе. Поэтому можно строить статистич. процедуры, основываясь только на рангах и не используя знание самих выборочных значений. Преимуществом таких процедур является вычислительная простота, вытекающая из целочисленности рангов. Другой важной особенностью ранговых процедур является их применимость и в тех случаях, когда наблюдения носят не количественный, а качественный характер, лишь бы они допускали упорядочение, что особенно важно в исследованиях по социологии, психологии п медицине. Наконец, распределения ранговых статистик при основной гипотезе не зависят от генерального распределения, что позволяет раз и навсегда вычислить эти распределения. По мере развитпя ранговых методов выяснилось, что доля информации, содержащаяся в векторе рангов, может оказаться значительной, что обеспечивает этим процедурам высокую эффективность. В рассмотренном выше примере, связанном с проверкой однородности двух выборок, расширение области применимости критерия приводит к потере в мощности, и в нормальном случае критерий Стьюдента имеет большую мощность, нежели любой ранговый критерий. Однако при большом числе наблюдений критерий Вилкоксона мало проигрывает критерию Стьюдента. Оказывается, что в нормальном случае АОЭ критерия Вилкоксона по отношению к критерию Стьюдента равна Если же генеральное распределение отлично от нормального, то указанная АОЭ может быть сколь угодно большой, но никогда не опускается ниже значения 0,864 (см. ). Более того, существует ранговый критерий (т. н. критерий нормальных меток), АОЭ к-рого по отношению к критерию Стьюдента равна 1 в нормальном случае и превосходит 1 при любом отклонении от нормальности. Таким образом, этот критерий асимптотически оказывается предпочтительнее критерия Стьюдента. Другой пример связан с проверкой гипотезы симметрии. Пусть выборка извлечена из совокупности с генеральной плотностью и проверяется гипотеза о симметричности f относительно нуля снова при альтернативе сдвига. Наиболее простым критерием в этой задаче является знаков критерии, основанный на числе положительных значений среди . Знаково-ранговый критерий Вилкоксона основан на статистике — ранг элемента в вариационном ряду для . Статистика этого критерия использует не только информацию о знаках наблюдений, но и информацию о их величине. Поэтому можно рассчитывать, что критерий Вилкоксона окажется более эффективным, чем критерий знаков. Действительно, АОЭ этих критериев по отношению к критерию Стьюдента равна соответственно и (в нормальном случае). Таким образом, критерий Вилкоксона в 1,5 раза превосходит критерий знаков и мало уступает критерию Стьюдента. Еще один пример связан с проверкой гипотезы независимости. Пусть имеется ряд объектов, каждый из к-рых обладает двумя признаками, количественными или качественными (математические и музыкальные способности учащегося, цвет и спелость ягоды, и т. д.). Предполагается, что наблюдения над качественными признаками могут быть упорядочены. Требуется по пнезависимым наблюдениям над объектами проверить гипотезу о независимости признаков против, напр., альтернативы их положительной зависимости. Пусть и ранги признаков, соответствующие г-му наблюдению. Естественный критерий для проверки независимости основан на коэффициенте ранговой корреляции Спирмена , к-рый может быть вычислен по формуле Гипотеза независимости отвергается при больших, т. е. близких к 1, значениях . Критич. значения при малых пнаходят по таблицам, при больших ппользуются нормальной аппроксимацией. АОЭ критерия, основанного на , по отношению к критерию, основанному на выборочном коэффициенте корреляции, снова довольно высока и равна (см. ). Поскольку для проверки каждой непараметрич. гипотезы существует много ранговых критериев, предложенных часто из эврисгич. соображений, выбор критерия следует основывать на каких-либо соображениях оптимальности. Как известно, равномерно наиболее мощные критерии в классе всех возможных альтернатив редко существуют даже в параметрич. случае. Поэтому роль оптимальных ранговых критериев для конечных объемов выборок выполняют локально наиболее мощные критерии. Так, напр., критерий Вилкоксона является локально наиболее мощным в двухвыбо-рочной задаче проверки однородности против альтернативы сдвига для логистич. распределения с плотностью , а критерий нормальных меток — в той же задаче для нормального распределения. В асимптотич. теории для отражения свойства оптимальности используются те или иные понятия асимптотич. эффективности, причем локально наиболее мощные критерии обычно оказываются и асимптотически оптимальными (см. ). В теории ранговых критериев предполагают, что распределения наблюдений непрерывны, так что наблюдения могут быть упорядочены без совпадений, и ранговые статистики определяются однозначно. Однако на практике наблюдения всегда округляются, и поэтому совпадения будут иногда появляться. Наиболее употребительны следующие два способа преодоления этой трудности. Первый состоит в том, чтобы упорядочить совпавшие наблюдения случайным образом. При втором методе каждому из группы совпавших наблюдений приписывается средний ранг этой группы. Достоинства обоих методов исследованы пока недостаточно. Непараметрич. оценивание представляет собой раздел непараметрич. статистики, имеющий дело с задачами оценки неизвестных распределений или функционалов от них таких, как квантили, моменты, мода, энтропия, информация по Фишеру и т. д. Общепринятой оценкой неизвестной функции распределения является эмпирич. функция распределения. Сильная равномерная состоятельность ее как оценки неизвестной функции распределения следует из теоремы Гливенко — Кантелли, а минимаксный характер установлен в . Состоятельное же оценивание неизвестной плотности распределения представляет собой более сложную задачу. Для корректной постановки задачи оценивания необходима дополнительная априорная информация о классе плотностей F, к к-рому принадлежит оцениваемая плотность f. В классич. постановке априорное семейство плотностей задастся в параметрич. форме и определяется конечномерным вектором неизвестных параметров. При непараметрич. постановке задача приобретает бесконечномерный характер, и точность оценивания неизвестной плотности существенно зависит (см. ) от геометрич. характеристик «массивности» класса F. В качестве последних используются, напр., n-мерный поперечник и n-мерный внутренний радиус класса F. Наиболее распространенными оценками неизвестной плотности f являются оценки где — наблюдения, функция Кабсолютно интегрируема и удовлетворяет условию а последовательность такова, что В нек-рых случаях используются другие непараметрич. оценки плотности: более простые (гистограмма, полигон частот) или более сложные, напр, проекционные оценки Ченцова. Вопрос о точности приближения этими оценками неизвестной плотности в зависимости от свойств класса f хорошо изучен (см. , ). Эмпирич. функцию распределения и непараметрич. оценку плотности можно использовать для оценки функционалов от неизвестных генеральных распределений; для этого достаточно подставить в выражение для оцениваемого функционала вместо неизвестного распределения его оценку. Сама идея и начало ее реализации восходит к работам Р. Мизеса (R. Mises) 30-40-х гг. 20 в. Доказано, что при нек-рых ограничениях на класс оцениваемых функционалов и на непараметрич. класс распределений существует минимаксная граница снизу качества непараметрич. оценок (см. ). Непараметрич. оценивание тесно связано с проблемой построения роба-стных оценок. Лит.: Большей Л. Н., Смирнов Н. В., Таблицы математической статистики, 2 изд., М., 1968; Ноdges J., Lehmann E., «Ann. Math. Stat.», 1963, v. 34, №2, p. 598 — 611; Walsh J. E., Handbook of nonparametric statistics, v. 1-3, Princeton, 1962, 1965, 1968; Кендалл М., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973; Мартынов Г. В., Критерии омега квадрат, М., 1978; Биллингсли П., Сходимость вероятностных мер, пер. с англ., М., 1977; Wiean d H., «Ann. Stat.», 1976, v. 4, .№ 5, р. 1003-11; Гаек Я., Шидак 3., Теория ранговых критериев, пер. с англ., М., 1971; Кендэл М., Ранговые корреляции, пер. с англ., М., 1975; Dvoretzky A., Kiefer J., Wolf owitz J., «Ann. Math. Stat.», 1956, v. 27, № 3, p. 642-69; Ченцов Н. Н., Статистические решающие правила и оптимальные выводы, М., 1972; Ибрагимов И. А., Xасьминский Р. 3., Асимптотическая теория оценивания, М., 1979; Ван дер Варден Б. Л., Математическая статистика, пер. с нем., М., 1960; Леман Э., Проверка статистических гипотез, пер. с англ., 2 изд., М., 1979; Шметтерер Л., Введение в математическую статистику, пер. с нем., М., 1976; Lehmann В., Nonparametrics: statistical methods based on ranks, S. Г.- N. Y., 1975. Я. Ю. Никитин.

Все параметрические методы статистики работают с интервальной шкалой, в отличие от непараметрических методов, ориентированных прежде всего на первые две шкалы. Поясним отличия этих методов.

При рассмотрении большинства статистических методов предполагается, что наблюдения, о которых идет речь, выражены в интервальной шкале и являются реализациями случайной величины, распределение которой принадлежит некоторому параметрическому семейству распределений.

Непараметрические Методы Статистики

Например, случайная величина имеет нормальное, или пуассоновское, или другое распределение. То есть, мы предполагаем, что известна форма распределения, например, мы можем предполагать нормальную N (μ, δ) модель, но с неизвестными параметрами μ и δ. Методы оценивания и проверки гипотез позволяют делать выводы о неизвестных параметрах, при этом ценность любых заключений до некоторой степени должна зависеть от адекватности исходного предположения о параметрическом семействе, то есть о форме распределения. Однако существуют случайные величины, которые не подчиняются одной из распространенных форм распределения. Следовательно, к ним нельзя применить те математические методы, которые разработаны для параметрических распределений. Поэтому для таких признаков разработаны специальные математические модели, которые получили название непараметрических или свободных от распределения.

Таким образом, можно выделить две группы методов статистики: параметрические и непараметрические.

Преимущество параметрических методов состоит в том, что для них существует хорошо разработанный математический аппарат. Однако применение этих методов, кроме прочего, предполагает большой объем выборки. Параметрические методы используют для количественных признаков.

Для анализа номинальных и ранговых переменных используются только непараметрические методы, которые не требуют предварительных предположений относительно вида исходного распределения. В этом их достоинство. Но есть и недостаток – снижение т.н. мощности (чувствительности к различиям объектов). Поясним это.

Напомним, что прежде чем приступить к анализу результатов эксперимента, исследователь выдвигает две взаимоисключающие гипотезы. Одна из них — статистическая гипотеза, которую исследователь обычно предполагает отклонить (т.н. нулевая гипотеза Н0: например, изучаемые сорта не отличаются по урожайности). Альтернативная гипотеза (Н1) фактически отрицает нулевую гипотезу. В альтернативной гипотезе обычно содержатся выдвигаемые исследователем предположения (есть отличия).

Выделяют два типа статистических ошибок анализа. Ошибка первого рода (ошибка α – типа): отклоняется нулевая гипотеза, которая в действительности верна. Ошибка второго рода (ошибка β – типа): принимаем нулевую гипотезу, которая в действительности ложная.

Мощностью или чувствительностью статистического критерия (метода) называется вероятность того, что в результате его применения будет принято правильное решение (Н1) при действительно ложной нулевой гипотезе. Мощность критерия зависит от объема выборки, уровня значимости, направленности нулевой и альтернативной гипотез, надежности экспериментальных данных, приборов и от самого статистического метода. При равных условиях параметрические методы более мощные, чем непараметрические. Но мощность непараметрических методов возрастает с увеличением объема выборки.

Каждому типу шкалы соответствует своя статистическая техника. Для номинальных шкал часто используется критерий χ2 (хи-квадрат). Для порядковых шкал – ранговые статистики. Для интервальных шкал – весь арсенал статистических критериев.

Алгоритмы и примеры вычисления непараметрических критериев.

Если коэффициент гамма слишком мал, коэффициент дельта изменяется медленно и операции по поддержанию дельта-нейтральной позиции требуется выполнять относительно редко. Однако при больших значениях коэффициента гамма коэффициент дельта является высокочувствительным к изменениям цены базового актива. Следовательно, оставлять дельта-нейтральный портфель без изменений в течение долгого времени довольно рискованно. Эта ситуация изображена на рис. 15.7. Если цена акции изменяется от S до S’, дельта-хеджирование предполагает, что цена опциона изменяется от С до С’, хотя на самом деле она изменяется от С до С”. Разность между значениями С и С” порождает ошибку хеджирования. Эта ошибка зависит от кривизны графика, описывающего зависимость цены опциона от цены акции. Именно в этом заключается геометрический смысл коэффициента гамма.

Допустим, что величина ΔS представляет собой изменение базового актива на протяжении короткого интервала времени Δt, а ΔП – соответствующее изменение стоимости портфеля. Если отбросить высшие степени величины Δt, то изменение стоимости дельта-нейтрального портфеля можно записать следующим образом (см. приложение 14.1):

(15.6)

где Θ – коэффициент тета портфеля.

Зависимость величины ΔП от изменения цены акции ΔS изображена на рис. 15.8. Если коэффициент гамма является положительным, коэффициент тета стремится к отрицательным значениям. Если цена акции не изменяется, стоимость портфеля уменьшается, но при больших положительных или отрицательных изменениях цены акции стоимость портфеля возрастает. Если коэффициент гамма является отрицательным, коэффициент тета стремится к положительным значениям, и справедливыми становятся обратные утверждения.

НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ

Если цена акции не изменяется, стоимость портфеля растет, а при больших положительных или отрицательных изменениях цены акции стоимость портфеля уменьшается. Если абсолютное значение коэффициента гамма возрастает, чувствительность стоимости портфеля к колебаниям цены акции увеличивается.

4. Непараметрические методы математической статистики

Материал из MachineLearning.

Перейти к: навигация, поиск

Критерий знаков (sign test) — статистический критерий, позволяющий проверить нулевую гипотезу, что выборка подчиняется биномиальному распределению с параметром . Критерий знаков можно использовать как непараметрический статистический критерий для проверки гипотезы равенства медианы заданному значению (вчастности, нулю), а также отсутствия сдвига (отсутствия эффекта обработки) в двух связных выборках.

Он также позволяет проверять гипотезу симметричности распределения, однако для этого существуют и более мощные критерии — одновыборочный критерий Уилкоксона и его модификации.

Гипотеза биномиальности

Пример задачи. В серии из подбрасываний монеты раз выпал орёл. Можно ли считать монету симметричной?

Задана бинарная простая выборка.

Нулевая гипотеза.

Статистика критерия:

Критерий (при уровне значимости):

  • против альтернативы

если , то нулевая гипотеза отвергается;

  • против альтернативы

если , то нулевая гипотеза отвергается;

  • против альтернативы

если , то нулевая гипотеза отвергается;

где — левый хвост биномиального распределения с параметром .

Значение является пи-величиной (p-value) данного критерия относительно альтернативы .

Гипотеза равенства медианы заданному значению

Задана простая выборка.

Нулевая гипотеза, где — заданное значение.

Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются значения , то их следует исключить из выборки, уменьшив число наблюдений.

Гипотеза отсутствия сдвига (эффекта обработки)

Пример задачи. Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения.

Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения. Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки называются связными. Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Заданы две выборки одинаковой длины .

Дополнительные предположения:

  • обе выборки простые;
  • выборки связные, то есть элементы соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза.

Задача сводится к предыдущей, если перейти к бинарной выборке Если в выборке имеются случаи , то их следует исключить из выборки, уменьшив число наблюдений.

Литература

  1. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  2. Кобзарь А. И. Прикладная математическая статистика. — М.:Физматлит, 2006. — 816 с.

Ссылки

Категории: Статистические тесты | Непараметрические статистические тесты

Непараметрические критерии.

Впервые непараметрические критерии применили в 30-х годах ХХ века. В последние 40-50 лет непараметрическая статистика быстро развивалась и находила все большее широкое применение в медицинских и биологических исследованиях. Они отличаются простотой проведения, для них не требуется вычислять какие-либо параметры распределения (средние значения, стандартные отклонения и др.).

Определение: Критерии различия называют непараметрическими, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности.

Непараметрические критерии оценки — это совокупность статистических методов, которые позволяют оценить результаты исследований без вычисления общепринятых параметров ( и т. д.).

Достоинства непараметрических методов (критериев) заключаются в том, что они не требуют знания характера распределения, могут применяться при любых распределениях, могут быть использованы при любом, даже небольшом числе наблюдений, применимы для признаков, имеющих количественное выражение, и признаков полуколичественного характера (например, степень тяжести и заболевания, результаты лечения и др.), относительно просты и не требуют проведения сложных расчетов, соответственно, экономят время при вычислении. Кроме того, непараметрические критерии обладают достаточной мощностью (чувствительностью).

В основе расчета непараметрических критериев лежит упорядочивание (ранжирование) имеющихся значений по отношению друг к другу, типа «больше-меньше» или «лучше-хуже». Это разграничение значений не предполагает точных количественных соотношений, а, следовательно, и ограничений на параметры и вид распределения. Поэтому для использования непараметрических критериев нужно меньше информации, нежели для критериев параметрических. В качестве оценок при непараметрических методах используются относительные характеристики — ранги, серии, знаки и др. Если в ситуации возможно применение параметрических критериев (нормальное распределение признака и незначительно различающееся разнообразие признака в совокупности), то им, как учитывающим большее количество информации, следует отдать предпочтение, так как они оказываются более мощными, чем непараметрические критерии, хотя и более трудоемкими.

Но это не означает, что повсеместно необходимо применять непраметрические методы анализа. Так как при нормальном распределении признака параметрические критерии обладают большей мощностью. При больших отличиях изучаемого распределения от нормального следует использовать непараметрические критерии.

Использование непараметрических критериев связано с такими понятиями, как «нулевая гипотеза» (Н0), уровень значимости, достоверность статистических различий. «Нулевая гипотеза» — это предположение о том, что в сравниваемых группах отсутствует различие в распределении частот. Уровень значимости — это такая вероятность, которую принимают за основу при статистической оценке гипотезы. В качестве максимального уровня значимости, при котором нулевая гипотеза еще отклоняется, принимается 5%.

При уровне значимости более 5% «нулевая гипотеза» принимается, различия между сравниваемыми совокупностями принимаются статистически недостоверными, незначимыми.

Особого внимания заслуживает вопрос о мощности (чувствительности) критериев. Каждый из изучаемых критериев имеет характерную для себя мощность. Оценку значимости различий необходимо начинать с наименее мощного критерия. Если этот критерий опровергает нулевую гипотезу, то на этом анализ заканчивается. Если же нулевая гипотеза этим критерием не опровергается, то следует проверить изучаемую гипотезу более мощным критерием. Однако если значение характеристики, вычисленной для менее мощного критерия, оказалось очень далеким от критического значения, то мало надежды, что более мощный критерий опровергнет нулевую гипотезу.

Применение непараметрических методов статистического анализа целесообразно в следующих случаях:

— на этапе разведочного анализа;

— при малом числе наблюдений (до 30);

— когда нет уверенности в соответствии данных закону нормального распределения.

Как правило, любой из параметрических критериев имеет аналог в непараметрической статистике.

Непараметрические критерии представлены следующими основными группами:

  • критерии различия между группами независимых выборок;
  • критерии различия между группами зависимых выборок.

Дата добавления: 2016-11-12; просмотров: 416 | Нарушение авторских прав

Похожая информация:

Поиск на сайте:

Add a Comment

Ваш e-mail не будет опубликован. Обязательные поля помечены *