Archive for Март, 2008

Четверг, Март 27th, 2008

Сравнив средние значения результативного признака (последний столбец а или б) по группам значений признака-фактора (первый столбец) можно сделать вывод, что между данными признаками имеется тесная прямая корреляционная зависимость.
Корреляционная зависимость, если она существует, будет тем отчетливее обнаруживаться, чем большее число данных будет по каждой группе. Другими словами, предполагаются по каждой группе. Другими словами, предполагаются что все случайные факторы взаимно погащаются и различия в величине средних будут связаны только с различиями в величине факторного признака. Если бы связи между факторным и результативным признаками не было, то все групповые средние результативного признака были бы приблизительно одинаковыми по величине.
Попутно заметим, что оценка существенности расхождения групповых средних лежит в основе использования методов дисперсионного анализа для выявления наличия и оценки тесноты корреляционной связи.
При применении метода аналитической группировки и исчисления групповых средних необходимо помнить, что оценка наличия или отсутствия корреляционной связи между изучаемыми признаками зависит как от количества выделяемых групп, так и от установления границ интервалов. Недостатком этого метода является неоднозначность результатов при различных группировках.
Для предварительного выявления наличия связи и раскрытия ее характера применяют также графический метод.
Сущность данного метода состоит в следующем. В прямоугольной системе координат на оси абсцисс откладываются значения факторного признака х, на оси ординат – результативного признака у. Используя индивидуальные данные по х и у строится точечный график. Каждая точка имеет соответствующие друг другу координаты (х, у).
Совокупность полученных точек образует корреляционное поле. По характеру расположения точек на корреляционном поле можно судить о наличии или отсутствии связи (о силе связи), а также о направлении связи. Так, если точки беспорядочно разбросаны по полю (в виде шара), то зависимость между переменными отсутствует; если точки образуют эллипс, т.е. концентрируются вокруг оси, идущей из нижнего левого угла в верхний правый (или наоборот), то имеется прямая (или обратная) зависимость между исследуемыми признаками.

Статистическое измерение тесноты корреляционной связи. Показатели меры тесноты корреляционной связи

Четверг, Март 27th, 2008

При изучении корреляционной связи важным направлением анализа является оценка степени тесноты связи.
Понятие степени тесноты связи между двумя признаками возникает вследствие того, что в реальной действительности на изменение результативного признака влияют несколько факторов. При этом влияние одного из факторов может выражаться более заметно и четко, чем влияние других факторов. С изменением условий в качестве главного, решающего фактора может выступать другой.
При статистическом изучении взаимосвязей, как правило, учитываются только основные факторы. А вопрос необходимо ли вообще изучать более подробно данную связь и практически ее использовать, решается с учетом степени тесноты связи.
Зная количественную оценку тесноты корреляционной связи, таким образом, можно решить следующую группу вопросов:

  • 1) необходимо ли глубокое изучение данной связи между признаками и целесообразно ли ее практическое применение;
  • 2) сопоставляя оценки тесноты связи для различных условий, можно судить о степени различий в ее проявлении в конкретных условиях;
  • 3) последовательное рассмотрение и сравнение признака у с различными факторами (х1, х21, …) позволяет выявить, какие из этих факторов в данных конкретных условиях являются главными, решающими факторами, а какие второстепенными, незначительными факторами;

Показатели тесноты связи должны удовлетворять ряду основных требований:

  • 1) величина показателя степени тесноты связи должна быть равна или близка к нулю, если связь между изучаемыми признаками (процессами, явлениями) отсутствует;
  • 2) при наличии между изучаемыми признаками (х и у) функциональной связи величина степень тесноты связи равна единице;
  • 3) при наличии между признаками (х и у) корреляционной связи показатель тесноты связи выражается правильной дробью, которая по величине тем больше, чем теснее связь между изучаемыми признаками (стремится к единице);

4) при прямолинейной корреляционной связи показатели тесноты связи отражают и направление связи: знак (+) означает наличие прямой (положительной) связи; а знак (-) – обратной (отрицательной).
Для характеристики степени тесноты корреляционной связи могут применяться различные статистические показатели: коэффициент Фехнера (КФ), коэффициент линейной (парной) корреляции (r’), коэффициент детерминации, корреляционное отношение ( ), индекс корреляции, коэффициент множественной корреляции (R), коэффициент частной корреляции (r’) и др.
В данном вопросе рассмотрим коэффициент линейной корреляции (r) и корреляционное отношение ( ).
Более совершенным статистических показателем степени тесноты корреляционной связи является линейный коэффициент корреляции (r), предложенный в конце XIX в.
При расчете коэффициента корреляции сопоставляются абсолютные значения отклонений индивидуальных величин факториального признака х и результативного признака у от их средних, т.е. и .
Однако непосредственно сопоставлять между собой эти полученные результаты нельзя, т.к. признаки, как правило, выражены в различных единицах и даже при наличии одинаковых единиц измерения будут иметь различные по величине средние и различные вариации. В этой связи сравнению подлежат отклонения, выраженные в относительных величинах, т.е. в долях среднего квадратического отклонения (их называют нормированными отклонениями).

Корреляция рангов

Четверг, Март 27th, 2008

Рассмотренные выше показатели оценки степени тесноты корреляционной связи между признаками являются обоснованными лишь в условиях нормаль-ного или близкого к нормальному распределению признаков в изучаемой совокупности. Кроме того, как видно из рассмотренных выше формул, для рас-чета величины r или необходимо знать численные значения факторного и ре-зультативного признаков. В некоторых же случаях мы можем изучать также признаки, которые не поддаются четкому численному выражению.
Эти обстоятельства заставляют пробегать к использованию так называемых непараметрических методов оценки тесноты связи.
Основой непараметрических методов является принцип нумерации вариант (индивидуальных значений) статистического ряда.
Значения признака располагаются по возрастанию (или убыванию). Каждой единице такого ряда присваивается порядковый номер в ряду. Причем номер первый получает наименьшая (или, наоборот, наибольшая) варианта, номер второй получает следующая по величине варианта и т.д.
Эти порядковые номера индивидуальных значений (вариант) изучаемого признака, расположенные в ряду в порядке возрастания или убывания своей величины, называются рангами.
Затем ранги (порядковые номера) индивидуальных значений факторного признака располагают в порядке возрастания (убывания) и с ними сопоставляются соответствующие ранги (порядковые номера) индивидуальных значений результативного признака.
Для повторяющихся индивидуальных значений признака ранг определяется как средняя арифметическая соответствующих номеров. Например, если одинаковые по величине значения признака занимают в ранжированном ряде третье и четвертое места, то ранг (порядковый номер) для каждого из них будет равен .
Наличие связи между признаками в данном случае можно получить, если сопоставить последовательность взаимного расположения рангов факторного и результативного признаков. Если с возрастанием величины рангов факторного признака х соответствующие им величины рангов результативного признака у обнаруживают тенденцию к увеличению, можно сделать вывод о наличии прямой (положительной) связи. Если же с увеличением рангов факторного признака ранги результативного признака уменьшаются, то это свидетельствует о возможном наличии между изучаемыми признаками обратной связи.
Из многочисленных непараметрических методов оценки степени тесноты связи наибольшее применение в статистическом анализе корреляционной зависимости нашли коэффициенты корреляции рангов, разработанные К. Спирмэном и М. Кендэлом.

Статистические исследования формы корреляционной связи. Линия регрессии и уравнение регрессии

Четверг, Март 27th, 2008

Как указывалось в параграфе 3, график корреляционной связи, построенный по групповым средним называется эмпирической линией связи (или эмпи-рической линией регрессии). Изломы эмпирической линии регрессии (т.е. ло-маной, последовательно соединяющей точки с групповыми средними), как пра-вило, обусловлены тем, что на результативный признак оказывают влияние кроме рассматриваемого факторного признака х и другие факторы.
Во многих случаях внешний вид эмпирической линии регрессии позволяет зрительно установить теоретическую форму зависимости у от х.
Даже и в этом случае главной в обосновании формы теоретической линии регрессии должна быть теория изучаемого явления и рассматриваемых признаков. Именно сущность (теория) явления с учетом природы изучаемых признаков должна служить основой для выбора формы взаимосвязи между данными признаками.
Здесь теоретической линией регрессии называется та линия, которая указывает основное направление (тенденцию) связи между рассматриваемыми признаками в «чистом виде», т.е. изменение средних величин результативного признака у в зависимости от изменения величины факторного признака х при условии полного взаимопогащения всех прочих причин.
Логически теоретическая линия регрессии должна быть расположена на поле графика так, чтобы сумма отклонений эмпирических точек (точек поля корреляции) от точек теоретической линии регрессии равнялась нулю, а сумма квадратов этих отклонений была бы минимальной по величине.
Формы уравнения связи может определяться также с использованием опыта предыдущих исследований, когда были получены приемлемые результаты количественного выражения направления изучаемой связи.
Даже при использовании теоретического анализа и опыта предыдущих статистических исследований данной корреляционной связи не следует отказываться от такого подхода к изучению корреляционной связи как использование конкурирующих вариантов модели регрессии и сопоставление различных уравнений связи.

Изучение корреляционной зависимости между рядами динамики

Четверг, Март 27th, 2008

При изучении развития явления во времени часто возникает необходимость оценить степень взаимосвязи в изменениях уровней нескольких рядов динамики.
Применение методов классической теории корреляции (рассмотренных в предыдущих вопросах темы) связано с определенными особенностями:
1) в рядах динамики зачастую наблюдается зависимость между последующими и предшествующими уровнями. Наличие такой связи в статистической литературе называют автокорреляцией. При изучении взаимосвязи между рядами динамики с применением методов корреляционно-регрессионного анализа автокорреляция должна быть исключена из каждого из сравниваемых рядов динамики;
2) в изменении уровней нескольких рядов динамики, как правило, существует лаг, т.е. смещение во времени по сравнению с изменением уровней другого ряда динамики. Для получения более правильной оценки степени тесноты корреляционной связи также необходимо исключить этот лаг, т.е. нужно сдвинуть уровни одного ряда относительно другого на некоторый промежуток времени;
3) условия формирования уровней рассматриваемых рядов, как правило, изменяются. Эти изменения могут быть и существенными. Соответственно может изменяться во времени и степень тесноты связи. В этих условиях речь идет о переменной корреляции.
Таким образом, при анализе корреляционной связи между рядами динамики необходимо: 1) измерить связь между предыдущими и последующими уровнями; 2) с учетом указанных выше особенностей изучить связь между рядами динамики.
Первая задача решается по каждому ряду динамики: в качестве факторного признака рассматриваются фактические уровни ряда, а уровни этого же ряда со сдвигом на один период принимаются в качестве результативного признака. Исчисляются коэффициенты автокорреляции и авторегрессии. При этом коэффициент автокорреляции рассчитывается на основе формулы коэффициента линейной (парной) корреляции.
Если результаты расчета коэффициентов автокорреляции будут указывать на наличие автокорреляции уровней исходных рядов динамики, то для дальнейшего анализа корреляционной связи между рядами динамики нужно исключить эту автокорреляцию.
Имеется несколько способов исключения автокорреляции. Первый способ состоит в исключении от фактических уровней тренда (т.е. «выравненного» ряда). По каждому показателю времени находится отклонение фактического уровня от расчетного (сглаженного, выравненного). Т.е. коррелируют отклонения. Как показатель тесноты связи между изучаемыми рядами динамики используется коэффициент корреляции отклонений.

Способы распространения характеристик выборки на генеральную совокупность

Четверг, Март 27th, 2008

При развитии рыночных отношений, как отмечалось выше, основной формой полученных статистических данных становится выборочное наблюдение. В зависимости от цели статистического исследования в этом случае по соответствующим показателям выборки оцениваются характеристик генеральной совокупности или прямым пересчетом показателей для генеральной совокупности, или посредствам расчета поправочных коэффициентов.
При способе прямого пересчета показатель выборки распространяется на генеральную совокупность с учетом предельной ошибки выборки.
Например, необходимо определить количество нестандартных изделий в поступившей партии товаров. Пусть при выборочном обследовании партии в 2000 единиц доля стандартных изделий в выборке составляет w=0.1 при установленной с вероятностью Фt=0.954 предельной ошибке выборки.
Отсюда пределы абсолютной численности нестандартного изделия во всей партии составляют:
2000х0,04 = 80 шт. – минимальная численность;
2000х0,16= 820 шт. – максимальная численность.

Способ поправочных коэффициентов применяется, например, при использовании выборочного метода с целью уточнению результатов сплошного учета (например, переписи населения, оборудования, скота).
При уточнении данных ежегодных переписей скота у населения применяется 10%-ное выборочное обследование для определения так называемого процента недоучёта.
Пример. По данным выборочного обследования в дворах деревни было зарегистрировано 52 голов скота, а по данным сплошного учёта в этом массиве значится 50 голов. Отсюда коэффициент недоучёта составляет 4% . С учётом полученного поправочного многочисленного коэффициента вносится поправка в общую численность скота, находящегося у населения данной деревни.
Как правило распространение выборочных данных на генеральную совокупность производится с учётом доверительных интервалов. Для этого соответствующие обобщающие выборочные показатели корректируются на величину предельной ошибки выборки.

Выборочное статистическое наблюдение и его виды

Четверг, Март 27th, 2008

Выборочное статистическое наблюдение является наиболее широко применяемым видом не сплошного наблюдения. При выборочном методе обследованию подвергается сравнительно набольшая часть всей изучаемой совокупности (обычно до 5-10 %, реже до 15-20 %). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой. Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, организованной по принципу случайного отбора.
При случайном отборе каждой единице изучаемого объекта (массового явления, генеральной совокупности) обеспечивается определенная (обычно равная) вероятность попасть в количество обследуемых единиц (в выборку) и тем самым исключается субъективность, тенденциозность и односторонность в подборе этих единиц.
При строгом соблюдении принятых правил отбора выборочное наблюдение репрезентативно в широком смысле слова: при нем обеспечивается близкое соответствие состава охваченной наблюдением выборки и состава генеральной совокупности. Благодаря этому по данных выборочного наблюдения можно определить с желательной степенью приближения интересующие исследователей характеристики изучаемого явления.
Выборочный метод при проведении ряда исследований является единственно возможным, например, при контроле качества продукции (товара).
Выборочный метод иногда применяется для проверки данных даже сплошного учета. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Так, при переписи населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.
Большую актуальность приобретает выборочный метод в условиях перехода к рыночной экономике. Развитие различных форм собственности, изменения в характере экономических отношений, как указывалось в предыдущих лекциях, обусловливают изменения функций учета и статистики, сокращение и упрощение статистической отчетности.
По сравнению с другими методами, применяющими не сплошное наблюдение, выборочный метод имеет существенное преимущество. При соблюдении правил научной организации выборочного наблюдения появляется возможность количественной оценки ошибки репрезентативности (представительности).
Более того, способы определения ошибок выборки при различных приемах формирования выборочной совокупности и распространение характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.

Этапы статистического наблюдения

Четверг, Март 27th, 2008

Проведение выборочного наблюдения складывается из ряда последовательных этапов:

  • 1) обоснование целесообразности проведения выборочного метода в соответствии с задачами исследования;
  • 2) составление программы проведения статистического исследования выборочным методом;
  • 3) решение организационных вопросов сбора исходной информации;
  • 4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;
  • 5) обоснование способов формирования выборочной совокупности;
  • 6) осуществление отбора единиц из генеральной совокупности для их обследования;
  • 7) фиксация в отобранных единицах выборки значений изучаемых признаков;
  • 8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;
  • 9) определение количественной оценки ошибки выборки;
  • 10) распространение обобщающих выборочных характеристик на генеральную совокупность.
  • 11) В зависимости от способа организации выборочного наблюдения и применяемых способов отбора различают также виды выборочного наблюдения:
  • 1) простая случайная выборка (собственно-случайная);
  • 2) механическая случайная выборка;
  • 3) типическая случайная выборка;
  • 4) серийная (гнездовая) выборка;
  • 5) многоступенчатая (многостепенная или комбинационная) выборка.

Выборку можно производить из конечной (ограниченной) и неограниченной генеральной совокупности. Поэтому целесообразно различать выборочный метод и по этому признаку. Иногда различают также большие, охватывающие значительное число обследуемых единиц, выборки и малые выборки.
Каждый из указанных основных способов отбора может реализоваться по схеме повторного (когда зафиксированная в выборке единица возвращается в генеральную совокупность) или бесповоротного отбора (когда зафиксированная единица исключается из дальнейшего просмотра и может попасть в выборку только один раз). Целесообразно различать выборки и по этому признаку.

Понятие о статических графиках. Основные элементы графика

Четверг, Март 27th, 2008

Полученный в результате статистического исследования материал нередко изображается с помощью точек, геометрических линий и фигур или географических картосхем, т.е. графиков.

  • В статистике графиком называют наглядное изображение статистических величин и их соотношений при помощи геометрических точек, линий, фигур или географических картосхем.

Графики придают изложению статистических данных большую наглядность, чем таблицы, выразительность, облегчают их восприятие и анализ. Статистический график позволяет зрительно оценить характер изучаемого явления, присущие ему закономерности, тенденции развития, взаимосвязи с другими показателями, географическое разрешение изучаемых явлений. Еще в древности китайцы говорили, что одно изображение заменяет тысячу слов. Графики делают статистический материал более понятным, доступным и неспециалистам, привлекают внимание широкой аудитории к статистическим данным, популяризируют статистику и статистическую информацию.
При любой возможности анализ статистических данных рекомендуется всегда начинать с их графического изображения. График позволяет сразу получить общее представление обо всей совокупности статистических показателей. Графический метод анализа выступает как логическое продолжение табличного метода и служит целям получения обобщающих статистических характеристик процессов, свойственных массовым явлениям.
При помощи графического изображения статистических данных решаются многие задачи статистического исследования:

  • 1) наглядное представление величины показателей (явлений) в сравнении друг с другом;
  • 2) характеристика структуры какого-либо явления;
  • 3) изменение явления во времени;
  • 4) ход выполнения плана;
  • 5) зависимость изменения одного явления от изменения другого;
  • 6) распространенность или размещение каких-либо величин по территории.

Другими словами, в статистических исследованиях применяются самые разнообразные графики.
В каждом графике выделяют (различают) следующие основные элементы:

  • 1) пространственные ориентиры (систему координат);
  • 2) графический образ;
  • 3) поле графика;
  • 4) масштабные ориентиры;
  • 5) экспликация графика;
  • 6) наименование графика

Иногда п.5 и п.6 объединяют в один элемент.
А) Пространственные ориентиры задаются в виде системы координатных сеток. В статистических графиках чаще всего применяется система прямоугольных координат. Иногда используется принцип полярных (угловых) координат (круговые графики). В картограммах средствами пространственной ориентации являются границы государств, границы административных его частей, географические ориентиры (контуры рек, береговых линий морей и океанов).
На осях системы координат или на карте в определенном порядке располагаются характеристики статистических признаков изображаемых явлений или процессов. Признаки, располагаемые на осях координат, могут быть качественными или количественными.
Б) Графический образ статистических данных представляет собой совокупность линий, фигур, точек, образующих геометрические фигуры разной формы (окружность, квадраты, прямоугольники и т.п.) с различной штриховкой, окраской, густотой нанесения точек.

Четверг, Март 27th, 2008

Любое явление, изучаемое статистикой, можно представить в графической форме. Для этого требуется найти правильное графическое решение, определить тот графический образ, который лучше всего соответствует данному явлению, нагляднее изображает статистические данные. Графический образ должен соответствовать цели графика. Поэтому перед построением графика необходимо уяснить сущность явления и цель, которая ставится перед графическим изображением. Выбранная форма графика должна соответствовать внутреннему содержанию и характеру статистического показателя. Например, сравнение на графике производится по таким измерениям, как площадь, длина одной из сторон фигур, местонахождением точек, их густотой и т.д.
Так, для изображения изменений явления во времени наиболее естественным типом графика является линия. Для рядов распределения – полигон или гистограмма.
В) Поле графика – это пространство, в котором располагаются графические образы (геометрические тела, образующие графики).
Поле графика характеризуется по размерам и пропорциям. Размер поля зависит от назначения графика. Пропорции и размер графика (формат графика) должны соответствовать также сущности изображаемых явлений. Для статистических исследований часто используются графики с неравными сторонами, например, с соотношением сторон поля 1: или 1:1,33 до 1:1,6+5,8. Но иногда удобна квадратная форма графиков.
Г) Масштабные ориентиры, обеспечивающие геометрическому образу количественную определенность, - это использованная в графике система масштабных шкал. Масштабом графика называется условная мера перевода статистической числовой величины в графическую. Масштабная шкала – это линия, отдельные точки которой могут быть в соответствии с принятым масштабом прочитаны как определенное значение статистического показателя. Масштаб выбирается с таким расчетом, чтобы на графике могла поместиться самая большая и самая маленькая из изображаемых величин.
Масштабные шкалы бывают равномерными и неравномерными, прямолинейными (обычно располагаются по осям координат) и криволинейными (круговые в секторных диаграммах).
Д) Экспликация графика – это словесное пояснение его содержания (название графика и соответствующие пояснения отдельных его частей).
Название графика должно точно и кратко раскрывать его содержание. Пояснительные тексты могут располагаться в пределах графического образа, рядом с ним или выноситься за его пределы, вдоль масштабных шкал. Они помогают мысленно перейти от геометрических образов к явлениям и процессам, изображенным на графике.
Особенность графических изображений в их выразительности, доходчивости и обозримости . Однако графические изображения не только иллюстративны, они носят и аналитический характер. Итак, в настоящее время графики широко применяются в учетной и статистической практике предприятий и учреждений, в научно-исследовательской работе, в производственно-хозяйственной деятельности, в учебном процессе, пропаганде и других областях.