Volodina-vasilisa.ru

Антикризисное мышление
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Особенности анализа статистических материалов

Особенности анализа статистического материала

Различают параметрическую и непараметрическую математическую статистики. Параметрическая статистика строится на основании параметров данной совокупности, на­пример, средней арифметической X и среднем квадратическом отклонении а. Непараметрическая — на вариантах и частотах их встречаемости у данной выборки.

Большинство методов математической статистики раз­работаны для нормального закона распределения изучаемых показателей. В случае отклонения от нормального закона, при­менение обычных методов приводит к грубым ошибкам и вы­водам. Поэтому при наличии, в частности, асимметрии в рас­пределении признака выполняют математическое преобразо­вание исходных данных (например, возведение в какую-либо степень), с последующей проверкой полученных данных на нормальность распределения.

Применение методов для проверки статистических ги­потез о достоверности различий между выборочными парамет­рами (X и а) требует предварительной проверки изучаемых признаков на нормальность распределения. Такими методами являются дисперсионный анализ, Т- критерий Стьюдента.

Основные статистические характеристики вычисляются по следующим формулам:

— средняя арифметическая
X=I Vi/n ,

где Vi — значение i-ой варианты, п — количество вариант;

— средняя квадратическая
o- 2 =(I(X-Vi) 2 )/ (n-1)

Для быстрых предварительных расчетов можно вос­пользоваться другой формулой (Н.А.Толоконцев, 1961):

где Vmax — наибольшее значение из вариант, Vmin — наимень­шее значение из вариант, К — коэффициент из таблицы 1.

Коэффициенты К для вычисления среднего квадратического отклонения по амплитуде вариационного ряда

— ошибка средней арифметический: m = б/V п;

при числе степеней свободы С=П!+п+2.

Величина tst при заданной (0.05) вероятности распределения Стьюдента

Высшим достижением эмпирического исследования является установление эмпирического закона, выраженного в аналитическом виде. Первым шагом на пути выявления эмпи­рического закона, суть которого связана с реально су­ществующей причинно-следственной связью, является вычис­ление коэффициента корреляции, а затем факторного и ре­грессионного анализа. Здесь надо заметить, что выборка долж­на формироваться методом расслоенного отбора. В этом слу­чае удается соблюсти следующие условия:

— независимые переменные представляют собой неслу­чайный набор чисел;

— случайные ошибки имеют нулевую среднюю и конеч­ную дисперсию, подчинены нормальному закону распределе­ния ;

— между независимыми переменными отсутствуют кор­реляция и автокорреляции.

Для определения независимости признаков полезно использовать факторный анализ, который позволяет снижать размерность описания взаимосвязей между признаками. Столбцы матрицы факторных весов содержат коэффициенты корреляции между фактором и признаком. Эта информация позволяет найти признаки, наиболее тесно связанные с данным фактором, т.е. между собой, а затем для любого из признаков найти независимые переменные для построения линейных уравнений множественной регрессии.

В работе В.М. Зациорского «Кибернетика, математика, спорт» (1970) приведена таблица результатов корреляционного анализа между достижениями в отдельных видах легкоатле­тического десятиборья, представленных в виде набранных оч­ков по отдельным видам многоборья. Эта корреляционная мат­рица была статистически обработана с помощью метода глав­ных факторов по Г.Харману (1972). Решение представлено в табл.3.

Таблица 3 Факторные веса (умножены на 100) по видам десятиборья

Как интерпретировать результат факторного анализа?

Выборка из 54 спортсменов была сформирована из участников Олимпийских игр 1952, 1956, 1960 гг. От олимпиа­ды к олимпиаде подготовленность многоборцев растет, поэтому выборку можно рассматривать как совокупность атлетов с примерно равной технической, но разным уровнем физической подготовленности. Все квалифицированные десятиборцы имеют схожее телосложение, которое характеризуется длиной тела выше среднего 180-190, длинными ногами, узким тазом, широ­кими плечами, равномерной гипертрофией мьшщ на верхних и нижних конечностях. Мышцы должны быть с преимуществен­ным содержанием быстрых мышечных волокон. Мышечная композиция наследуется, следовательно, уровень физической подготовленности десятиборцев определяется, прежде всего, силой (количеством миофибрилл в мышечных волокнах) мышц ног, рук, туловища, мышечной выносливостью (отношением массы митохондрий к массе миофибрилл в мышцах), размером сердца.

Эти теоретические умозаключения можно подтвердить в ходе анализа результатов факторного анализа (табл. 1). На­пример, высокие коэффициенты корреляции первого фактора с результатами в отдельных видах многоборья свидетельству­ют о том, что с ростом квалификации атлета увеличивается сила всех основных мышц. Исключение составляет результат в беге на 1500 м, который обусловлен другим фактором (в таб­лице — это 3-й фактор).

После устранения влияния первого фактора из общей дисперсии выборки выявляется второй фактор. Он имеет наи­высшие положительные коэффициенты корреляции (факторные нагрузки) с бегом на 400 м (48), 100 м (32) и 1500 м (19), отрицательно коррелирует с толканием ядра (-35), ме­танием диска (-32), метанием копья (30) и прыжком с шестом (-33); следовательно, локальная силовая выносливость мышц ног (относительно тяжелые ноги) способствует достижению высоких результатов во всех беговых дисциплинах, а избыточ­ная масса мышц нижних конечностей отрицательно связана с результатами в метаниях. Следует напомнить, что положи­тельный вклад силы мышц верхних и нижних конечностей уже был учтен в первом факторе.

Устранение влияния второго фактора на общую дис­персию выборки позволило выявить третий — аэробная подго­товленность (видимо, уровень потребления кислорода на ана­эробном пороге). Это умозаключение следует из наличия наи­высшего коэффициента корреляции третьего фактора с набранными очками в беге на 1500 м (36). Третий фактор поло­жительно коррелирует еще с результатом на 400 м (24).

После устранения влияния на общую дисперсию трех факторов, в оставшейся дисперсии основную долю составила дисперсия, приходящаяся на результат на 1500 м (-37), 400 м (29). Очевидно, что этот фактор связан с массой мышц верхне­го плечевого пояса. Интенсивная работа массивных рук в беге на 400 м способствует увеличению амплитуды изменения вы­соты общего центра массы тела, а, значит, длины шага. Мас­сивные руки в беге на 1500 м являются лишним грузом, интен­сивная их работа приведет к увеличению потребления кисло­рода, которого , как правило, не хватает для мышц ног.

Таким образом, по результатам факторного анализа можно предложить построить уравнение множественной ре­грессии для предсказания суммы очков:

Y= аО + al*Xl + а2 *Х2 + аЗ*ХЗ,

где XI — толкание ядра, Х2 — бег на 400 м, ХЗ — время бега на 1500 м.

С помощью такого уравнения можно предсказывать результат в сумме многоборья для спортсменов, относящихся к данной генеральной совокупности, т.е. для действующих деся­тиборцев высшей квалификации 1952-1960 гг. Применять такое уравнение для нашего времени уже нельзя, поскольку поменя­лись правила начисления очков за результаты в отдельных видах. Требуется повторить исследование.

Следует сделать еще одно замечание: интерпретация результатов факторного анализа может корректно выполнять­ся только на основе моделирования объектов — десятиборцев (в нашем случае — мысленного имитационного моделирования). Результат моделирования является лишь рабочей гипотезой, которую еще необходимо доказать прямыми исследованиями. Например, методами биомеханики можно доказать предполо­жение о важности интенсивной работы рук в беге на 400 м, а методами биоэнергетики — отрицательное влияние работы мышц рук на скорость бега. В случае использования прими­тивных моделей, интерпретация факторных решений приводит к порождению новых терминов, не имеющих глубокого обосно­вания, засоряющих науку.

Дата добавления: 2015-06-05 ; просмотров: 611 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Анализ статистических материалов

Определение и значение. Статистика (от лат. status — состояние, итал. stato — государство) — наука, которая изучает количественную сторону массовых общественных явлений для выведения обобщающих показателей. Статистические материалы фиксируются в цифрах, специфическим языком статистики является язык цифр. Ее отрасли: демографическая статистика (статистика населения), промышленная статистика, сельскохозяйственная статистика, статистика транспорта, статистика здравоохранения и др.

Сбором статистических материалов занимаются международные организации, государственные учреждения, монополии, профсоюзные организации, как для решения текущих задач, так и в специальных целях (переписи населения, выяснение общественного мнения и др.). Впоследствии эти материалы используются историками как источники.

Материалы социально-экономической статистики являются фундаментом знаний о разных сторонах жизни Земли, страны, региона. О многих сторонах жизни, как это видно уже из перечисления ее отраслей, но не всех; невозможно, например, вычислить, на сколько процентов углубился кризис французского абсолютизма при Людовике XV или на сколько процентов выросло исполнительское мастерство И. С. Козловского за определенные годы.

Статистический метод. Статистические материалы могут использоваться в качестве орудия политической борьбы и фальсифицироваться. Известна ходячая пословица: «Существуют три вида лжи: ложь, ложь наглая и статистика». Сталин расстрелял организаторов переписи 1937 года и наградил организаторов переписи 1939 года, но материалы обеих переписей загнал в спецхраны, сделав их недоступными для исследователей.

Читать еще:  Характеристика количественного анализа

Очевидно, что статистические материалы нуждаются в жёстком критическом подходе. Однако в чем должна заключаться критичность подхода к голой и, казалось бы, беспристрастной цифре? К отдельной цифре (численности населения, потерях в войне, внутреннему валовому продукту, росту зарплаты) или к статистической таблице, диаграмме, схеме, в которых обычно суммированы результаты статистических исследований?

Важнейшей предпосылкой успешного анализа статистических материалов является знание способа их создания — «статистического метода». Он имеет две стадии: статистики наблюдения — сбора первичных сведений и статистики обобщения — их обработки. Фактически эти стадии являются вариантами анализа происхождения и анализа содержания исторического источника.

Статистика наблюдения. Одни сведения могут быть зафиксированы в ходе текущей деятельности отдельных лиц и учреждений (загсов, автодорожной службы и т. п.); другие сведения специально собирались для статистической обработки (переписи, анкетирования и т. п.).

Анализируя данные текущего учета, исследователь должен установить, был ли учет обязательным и своевременным; очевидно, что необязательность учета и проведение его в чрезвычайных условиях стихийных бедствий или гражданских войн неблагоприятно сказывались на точности полученных данных. Важно установить, являлось специальное обследование сплошным (охватывались все изучаемые единицы) или несплошным, выборочным, и в этом случае надлежит установить, какими принципами руководствовались статистики при отборе, например, какие семьи отбирались для обследования бюджета, каким адресатам направлялись для заполнения анкеты. Историк-исследователь должен познакомиться с планом и программой статистического наблюдения: первый раскроет цель, объект и единицу наблюдения, наблюдателей и обработчиков их данных и т. д.; вторая должна установить ясность и общую состоятельность вопросов, задаваемых обследуемым лицам.

Статистика обобщения. Собранный в результате статистического наблюдения материал представляет собой хаотический набор цифр, которые сами по себе ни о чем не говорят, поэтому в ходе второй стадии их обобщают, а для наглядности и удобства использования придают собранным данным вид таблиц, схем, диаграмм и т. п.

Основные правила и приемы этой обработки следующие. Надо использовать всю совокупность добытых в ходе статистического наблюдения цифр, помня, что «пример — не доказательство» и что статистика оперирует массовыми данными и опирается на так называемый закон больших чисел (совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая). Для систематизации добытых цифр их группируют, причем в одну группу можно объединять только однотипные предметы или явления; суммирование пудов зерна и пудов картофеля для выяснения урожая так же недопустимо, как сложение лошади и курицы для выяснения поголовья домашних животных (пример В. К. Яцунского). Характер группировки принципиально важен и может привести к диаметрально противоположным выводам, например, группировка умеющих лишь расписаться заключенных то с грамотными, то с неграмотными дает разные результаты для суждений о влиянии образования на преступность (пример Д. П. Журавского).

Наряду с группировкой важным приемом обобщения данных статистического наблюдения является выведение среднего показателя. Это очень убедительный показатель, который, однако, можно выводить только из однородных совокупностей, ибо если, например, сложить состояние миллионера, имеющего особняк на набережной Сены, с содержимым карманов нищего под мостом через Сену, то в среднем у них окажется по полмиллиона. Предпосылкой успешного использования статистических материалов как источника является знакомство не только с литературой о статистике, в частности о статистическом методе, но и с политэкономией.

Особенности анализа статистического материала

Различают параметрическую и непараметрическую мате­матические статистики. Параметрическая статистика строит­ся на основании параметров данной совокупности, например, средней арифметической X и среднего квадратического от­клонения о; непараметрическая — на вариантах и частотах их встречаемости у данной выборки. При выборе критерия необ­ходимо всегда исходить из прикладной постановки задачи и природы данных. Краткий путеводитель (Лапач С.Н., А.В. Чубенко, П.Н. Бабич, 2000) по статистическим методам про­верки гипотез о положении и рассеивании, позволяющий вы­брать подходящий для вашей задачи, представлен в табл. 14.

Крайний левый столбец представляет собой формулировку задачи в прикладной области, свою задачу вы должны свести к одной из этих формулировок. Столбец — формулировка этой за­дачи в терминологии, принятой в статистической литературе.

Большинство методов математической статистики разра­ботано для нормального закона распределения изучаемых показателей. В случае отклонения от нормального закона применение обычных методов приводит к грубым ошибкам и выводам. Поэтому при наличии, в частности, асимметрии в распределении признака выполняют математическое преоб­разование исходных данных (например, возведение в какую-либо степень) с последующей проверкой полученных данных на нормальность распределения.

Применение методов для проверки статистических гипо­тез о достоверности различий между выборочными парамет­рами (X и с) требует предварительной проверки изучаемых признаков на нормальность распределения. Такими метода­ми являются дисперсионный анализ, t-критерий Стьюдента. Высшим достижением эмпирического исследования яв­ляется установление эмпирического закона, выраженного в аналитическом виде. Первым шагом на пути выявления эм­пирического закона, суть которого связана с реально сущест­вующей причинно-следственной связью, является вычисле­ние коэффициента корреляции, а затем факторного и регрес­сионного анализа. Здесь надо заметить, что выборка должна формироваться методом расслоенного отбора. В этом случае удается соблюсти следующие условия:

— независимые переменные представляют собой неслу­чайный набор чисел;

— случайные ошибки имеют нулевую среднюю и конеч­ную дисперсию, подчинены нормальному закону распределе­ния;

— между независимыми переменными отсутствуют корре­ляция и автокорреляции.

Для определения независимости признаков полезно ис­пользовать факторный анализ, который позволяет снижать размерность описания взаимосвязей между признаками. Столбцы матрицы факторных весов содержат коэффициенты корреляции между фактором и признаком. Эта информация позволяет найти признаки, наиболее тесно связанные с дан­ным фактором, т.е. между собой, а затем для любого из при­знаков найти независимые переменные для построения ли­нейных уравнений множественной регрессии.

В работе В.М. Зациорского «Кибернетика, математика, спорт» (1970) приведена таблица результатов корреляцион­ного анализа между достижениями в отдельных видах легко­атлетического десятиборья, представленных в виде набран­ных очков по отдельным видам многоборья. Эта корреляци­онная матрица была статистически обработана с помощью метода главных факторов по Г. Харману (1972). Решение представлено в табл. 16.

Как интерпретировать результат факторного анализа?

Выборка была сформирована из 54 спортсменов-участни­ков Олимпийских игр 1952, 1956, 1960 гг. От олимпиады к олимпиаде подготовленность многоборцев растет, поэтому выборку можно рассматривать как совокупность атлетов с примерно равной технической, но разным уровнем физиче­ской подготовленности. Все квалифицированные десятибор­цы имеют схожее телосложение, которое характеризуется длиной тела выше среднего — 180-190 см, длинными ногами, узким тазом, широкими плечами, равномерной гипертрофи­ей мышц на верхних и нижних конечностях. Мышцы должны быть с преимущественным содержанием быстрых мышеч­ных волокон. Мышечная композиция наследуется, следова­тельно, уровень физической подготовленности десятиборцев определяется, прежде всего, силой (количеством миофибрилл в мышечных волокнах) мышц ног, рук, туловища, мы­шечной выносливостью (отношением массы митохондрий к массе миофибрилл в мышцах), размером сердца.

Эти теоретические умозаключения можно подтвердить в ходе рассмотрения результатов факторного анализа (табл. 16). Например, высокие коэффициенты корреляции первого фактора с результатами в отдельных видах многоборья сви­детельствуют о том, что с ростом квалификации атлета уве­личивается сила всех основных мышц. Исключение состав­ляет результат в беге на 1500 м, который обусловлен другим фактором (в таблице это третий фактор).

После устранения влияния первого фактора из общей дисперсии выборки выявляется второй фактор. Он имеет наивысшие положительные коэффициенты корреляции (фа­кторные нагрузки) с бегом на 400 м (48), 100 м (32) и 1500 м (19), отрицательно коррелирует с толканием ядра (-35), мета­нием диска (-32), метанием копья (30) и прыжком с шестом (-33), следовательно, локальная силовая выносливость мышц ног (относительно тяжелые ноги) способствует дости­жению высоких результатов во всех беговых дисциплинах, а избыточная масса мышц нижних конечностей отрицательно связана с результатами в метаниях. Следует напомнить, что положительный вклад силы мышц верхних и нижних конеч­ностей уже был учтен в первом факторе.

Читать еще:  Анализ структуры организации это

Устранение влияния второго фактора на общую диспер­сию выборки позволило выявить третий фактор — аэробную подготовленность (видимо, уровень потребления кислорода на анаэробном пороге). Это умозаключение следует из нали­чия наивысшего коэффициента корреляции третьего факто­ра с набранными очками в беге на 1500 м (36). Третий фактор положительно коррелирует еще с результатом на 400 м (24).

После устранения влияния на общую дисперсию трех фа­кторов в оставшейся дисперсии основную долю составила дисперсия, приходящаяся на результат на 1500 м (-37), 400 м (29). Очевидно, что этот фактор связан с массой мышц верхнего плечевого пояса. Интенсивная работа массивных рук в беге на 400 м способствует увеличению амплитуды измене­ния высоты общего центра массы тела, а значит, длины шага. Массивные руки в беге на 1500 м являются лишним грузом, их интенсивная работа приведет к увеличению потребления кислорода, которого, как правило, не хватает для мышц ног.

Таким образом, по результатам факторного анализа мож­но предложить построить уравнение множественной регрес­сии для предсказания суммы очков:

Y= ао + ai • Xi + а2 • Х2 + a3 • Х3,

где X1 — толкание ядра, Х2 — бег на 400 м, Х3 — время бега на 1500 м.

С помощью такого уравнения молено предсказывать ре­зультат в сумме многоборья для спортсменов относящихся к данной генеральной совокупности, т.е. для действующих де­сятиборцев высшей квалификации 1952-1960 гг. Применять такое уравнение для нашего времени уже нельзя, поскольку поменялись правила начисления очков за результаты в от­дельных видах. Требуется повторить исследование.

Следует сделать еще одно замечание. Интерпретация ре­зультатов факторного анализа может корректно выполнять­ся только на основе моделирования объектов — десятиборцев (в нашем случае — мысленного имитационного моделирова­ния). Результат моделирования является лишь рабочей гипо­тезой, которую еще необходимо доказать прямыми исследо­ваниями. Например, методами биомеханики можно доказать предположение о важности интенсивной работы рук в беге на 400 м, а методами биоэнергетики — отрицательное влияние работы мышц рук на скорость бега. В случае использования примитивных моделей интерпретация факторных решений приводит к порождению новых терминов, не имеющих глу­бокого обоснования, засоряющих науку.

Анализ данных: используем методы статистического исследования

Анализ данных и статистика — вещи одного порядка. Если статистика первооснова и источник информации, то анализ данных — это инструмент для ее исследования, и зачастую анализ данных без статистики невозможен.

Статистика — это изучение любых явлений в числовой форме. Статистика используется анализом данных в количественных исследованиях. Противоположность им — качественные, описывающие ситуацию без применения цифр, в текстовом выражении.

Количественный анализ статистических данных проводится по интервальной шкале и по рациональной:

  • интервальная шкала указывает, насколько тот или иной показатель больше или меньше другого и дает возможность подобрать похожие по свойствам соотношения показатели,
  • рациональная шкала показывает, во сколько раз тот или иной показатель больше или меньше другого, но в ней содержатся только положительные значения, что не всегда будет отражать реальное положение дел.

Как используют Data Mining в компании Mail.ru?

Методы анализа статистических данных

В анализе статистических данных можно выделить аналитический этап и описательный. Описательный этап — последний, он включает представление собранных данных в удобном графическом виде – в графиках, диаграммах, дашбордах. Аналитический этап — это анализ, заключающийся в использовании одного из следующих методов:

  • статистического наблюдения – систематического сбора данных по интересующим характеристикам;
  • сводки данных, в которой можно обработать информацию после наблюдения; она описывает отдельные факты как часть общей совокупности или создает группировки, делит информацию по группам на основании каких-либо признаков;
  • определении абсолютной и относительной статистической величины; абсолютная величина придает данным количественные характеристики в индивидуальном порядке, в независимости от других данных; относительные величины описывают одни объекты или признаки относительно других;
  • метода выборки – использовании при анализе не всех данных, а только их части, отобранной по определенным правилам (выборка может быть случайной, стратифицированной, кластерной и квотной);
  • корреляционного и регрессионного анализа — выявляет взаимосвязи данных и причины, по которым данные зависят друг от друга, определяет силу этой зависимости;
  • метода динамических рядов — отслеживает силу, интенсивность и частоту изменений объектов и явлений; позволяет оценить данные во времени и дает возможность прогнозирования явлений.

Программное обеспечение для статистического исследования

Статистические исследования могут проводить маркетологи-аналитики:

Для качественного анализа статистических данных необходимо либо обладать знаниями математической статистики, либо использовать отчетно-аналитическую программу, либо не заниматься этим. Европейские компании давно осознали пользу big data для анализа больших данных, поэтому либо нанимают хороших аналитиков с математическим образованием, либо устанавливают профессиональное программное обеспечение для аналитиков-маркетологов. Ежедневный анализ в этих компаниях помогает им правильно организовывать закупку товаров, их хранение и логистику, корректировать количество персонала и их рабочие графики.

Решения для автоматизации анализа данных позволяют работать с ними аналитикам-маркетологам. Сегодня есть решения, доступные даже небольшим компаниям, такие как Tableau. Их преимущества по сравнению с анализом, проведенным исключительно человеком:

  • невысокая стоимость внедрения (от 2000 рублей в месяц – на февраль 2018 года),
  • современное графическое представление анализа,
  • возможность мгновенно переходить от одного, более полного отчета, к другому, более детальному.

Хотите узнать, как провести анализ и сделать отчеты быстро?

Статистический анализ — это. Понятие, методы, цели и задачи статистического анализа

Достаточно часто возникают явления, которые можно проанализировать исключительно при помощи статистических методов. В этой связи для каждого субъекта, стремящегося глубоко изучить проблему, проникнуть в суть темы, важно иметь представление о них. В статье разберемся, что такое статистический анализ данных, каковы его особенности, а также какие методы применяют при его проведении.

Особенности терминологии

Статистику рассматривают в качестве специфичной науки, системы госорганов, а также как набор цифр. Между тем далеко не все цифры можно считать статистикой. Разберемся в этом вопросе.

Для начала следует вспомнить, что слово «статистика» имеет латинские корни и происходит от понятия status. В буквальном переводе термин означает «определенное положение предметов, вещей». Следовательно, статистическими признаются только такие данные, с помощью которых фиксируются относительно устойчивые явления. Анализ, собственно, и выявляет эту устойчивость. Его используют, к примеру, при изучении социально-экономических, политических явлений.

Назначение

Применение статистического анализа позволяет отображать количественные показатели в неразрывной связи с качественными. В результате исследователь может увидеть взаимодействие фактов, установить закономерности, выявить типичные признаки ситуаций, сценарии развития, обосновать прогноз.

Статистический анализ – это один из ключевых инструментов СМИ. Чаще всего его используют в деловых изданиях, таких как, например, «Ведомости», «Коммерсант», «Эксперт-профи» и пр. В них всегда публикуются «аналитические рассуждения» о валютном курсе, котировке акций, учетных ставках, инвестициях, рынке, экономике в целом.

Разумеется, чтобы результаты анализа были достоверными, постоянно проводится сбор данных.

Источники информации

Сбор данных может осуществляться по-разному. Главное, чтобы способы не нарушали закон и не ущемляли интересы других лиц. Если говорить о СМИ, то для них ключевыми источниками информации выступают государственные статистические органы. Эти структуры должны:

  1. Собирать отчетные сведения в соответствии с утвержденными программами.
  2. Группировать информацию по тем или иным критериям, наиболее значимым для исследуемого явления, формировать сводки.
  3. Проводить собственный статистический анализ.

В задачи уполномоченных госорганов входит также предоставление полученных ими данных в отчетах, тематических подборках или пресс-релизах. В последнее время статистика публикуется на официальных сайтах госструктур.

Кроме указанных органов, информацию можно получить в Едином госреестре предприятий, учреждений, объединений и организаций. Цель его создания состоит в формировании единой информационной базы.

Для проведения анализа можно использовать информацию, полученную от межправительственных организаций. Существуют специальные базы данных экономической статистики стран.

Читать еще:  Обзор и анализ аналогов

Часто информация поступает от частных лиц, общественных организаций. Эти субъекты обычно ведут свою статистику. Так, к примеру, Союз охраны птиц в России регулярно устраивает так называемые соловьиные вечера. В конце мая через СМИ организация приглашает всех желающих поучаствовать в подсчете соловьев на территории Москвы. Полученные сведения обрабатываются группой экспертов. После этого сведения переносятся в специальную карту.

Многие журналисты обращаются за информацией к представителям других авторитетных СМИ, пользующихся у аудитории популярностью. Распространенным способом получения данных является опрос. При этом опрашиваемыми могут стать как рядовые граждане, так и эксперты в какой-либо области.

Специфика выбора методики

Перечень показателей, необходимых для проведения анализа, зависит от специфики исследуемого явления. К примеру, если изучается уровень благосостояния населения, приоритетными считаются данные о качестве жизни граждан, прожиточном минимуме на данной территории, размере МРОТ, пенсии, стипендии, потребительской корзины. При исследовании демографической ситуации важны показатели смертности и рождаемости, число мигрантов. Если изучается сфера промышленного производства, важные сведения для статистического анализа – это количество предприятий, их виды, объем продукции, уровень производительности труда и т. д.

Средние показатели

Как правило, при описании тех или иных явлений используются средние арифметические величины. Для их получения числа складывают друг с другом, а полученный результат делят на их количество.

Средние величины используются в качестве обобщающих показателей. Однако они не позволяют описать конкретные моменты. К примеру, в ходе анализа установлено, что средняя зарплата по России составляет 30 тыс. р. Этот показатель не говорит о том, что все работающие граждане страны получают именно эту сумму. Более того, у кого-то зарплата может быть и выше, а у кого-то – ниже этой цифры.

Относительные показатели

Их находят в результате сравнительного анализа. В статистике, кроме средних, используются абсолютные величины. При их сопоставлении как раз и определяются относительные показатели.

Например, установлено, что в один госорган приходит 5 тысяч писем ежемесячно, а в другой – 1 000. Выходит, что первая структура получает в 5 раз больше обращений. При сравнении средних показателей относительная величина может быть выражена в процентах. К примеру, средний заработок фармацевта составляет 70 % от ср. з/п инженера.

Итоговые сводки

Они представляют собой систематизацию признаков исследуемого события для выявления динамики его развития. К примеру, установлено, что в 1997 г. речной транспорт всех ведомств и управлений перевез 52,4 млн тонн груза, а в 2007 г. – 101,2 млн т. Чтобы понять изменения характера транспортировок за период с 1997 по 2007 г., можно сгруппировать итоговые показатели по видам объектов, а затем сравнить группы друг с другом. В итоге можно получить более полные сведения о развитии грузооборота.

Индексы

Их достаточно широко применяют при исследовании динамики событий. Индекс в статистическом анализе – это средний показатель, отражающий изменение явления под воздействием другого события, абсолютные показатели которого признаны неизменными.

К примеру, в демографии в качестве специфического индекса может выступать величина естественной убыли (прироста) населения. Ее определяют при сравнении уровня рождаемости и смертности.

Графики

Они используются для отображения динамики развития события. Для этого применяют фигуры, точки, линии, имеющие условные значения. Графики, с помощью которых выражаются количественные соотношения, именуются диаграммами или динамическими кривыми. Благодаря им можно наглядно увидеть динамику развития какого-то явления.

График, показывающий увеличение количества лиц, страдающих остеохондрозом, представляет собой кривую, уходящую вверх. Соответственно, по ней можно наглядно увидеть тенденцию заболеваемости. Люди, даже не прочитав текстовый материал, могут сформулировать выводы о сложившейся динамике и спрогнозировать развитие ситуации в дальнейшем.

Статистические таблицы

Они очень часто используются для отражения данных. С помощью статистических таблиц можно сопоставлять информацию по изменяющимся со временем показателям, различающимся в зависимости от страны и пр. Они представляют собой наглядную статистику, которой зачастую не нужны комментарии.

Методы

В основе статистического анализа лежат приемы и способы сбора, обработки и обобщения сведений. В зависимости от природы методы могут быть количественными и категориальными.

При помощи первых получают метрические данные, которые по своей структуре являются непрерывными. Их можно измерить при помощи интервальной шкалы. Она представляет собой систему чисел, равные промежутки между которыми отражают периодичность значений изучаемых показателей. Также используется шкала отношений. В ней, кроме расстояния, определяется также порядок значений.

Неметрические (категориальные) данные представляют собой качественные сведения, количество уникальных категорий и значений которых ограничено. Они могут быть представлены в виде номинальных или порядковых показателей. Первые используют для нумерации объектов. Для вторых предусматривается естественный порядок.

Одномерные методы

Они применяются в том случае, если для оценки всех элементов выборки используется единый измеритель или если последних несколько для каждого компонента, но переменные исследуются обособленно друг от друга.

Одномерные методы различаются в зависимости от типа данных: метрические или неметрические. Первые измеряют по относительной или интервальной шкале, вторые – по номинальной или порядковой. Кроме этого, деление методов осуществляется на классы в зависимости от количества исследуемых выборок. При этом необходимо учитывать, что это число определяют по тому, как осуществляется работа с информацией для конкретного анализа, а не по способу сбора данных.

Однофакторное дисперсионное исследование

Цель статистического анализа может состоять в изучении воздействия одного либо нескольких факторов на конкретный признак объекта. Однофакторный дисперсионный метод применяется тогда, когда у исследователя есть 3 и больше независимые выборки. При этом они должны быть получены из генеральной совокупности посредством изменения независимого фактора, для которого отсутствуют количественные измерения по каким-то причинам. Предполагается, что имеются различные и одинаковые выборочные дисперсии. В этой связи следует определить, оказал ли данный фактор значительное влияние на разброс или он стал следствием случайностей, возникших вследствие небольших объемов выборок.

Вариационный ряд

Он представляет собой упорядоченное распределение единиц генеральной совокупности, как правило, по возрастающим (в редких случаях по убывающим) показателям признака и подсчет их числа с тем или другим значением признака.

Вариация является различием в показателе какого-либо признака у различных единиц конкретной совокупности, возникающим в один и тот же момент либо период. К примеру, сотрудники компании отличаются друг от друга по возрасту, росту, доходам, весу и пр. Возникает вариация вследствие того, что индивидуальные показатели признака формируются под комплексным влиянием разных факторов. В каждом конкретном случае они сочетаются по-разному.

Вариационный ряд бывает:

  1. Ранжированным. Он представлен в виде перечня отдельных единиц генеральной совокупности, расположенных в порядке убывания либо возрастания исследуемого признака.
  2. Дискретным. Он представлен в форме таблицы, включающей в себя конкретные показатели изменяющегося признака х и количества единиц совокупности с заданной величиной f признака частот.
  3. Интервальным. В этом случае показатель непрерывного признака задается с помощью интервалов. Они характеризуются частотой t.

Многомерный статистический анализ

Он проводится, если для оценки элементов выборки применяется 2 и более измерителя, и переменные изучаются одновременно. Такая форма статистического анализа отличается от одномерного способа в первую очередь тем, что при ее использовании внимание сосредотачивается на уровне взаимосвязи между явлениями, а не на средних показателях и распределениях (дисперсиях).

Среди основных методов многомерного статистического исследования выделяют:

  1. Кросс-табуляцию. С ее использованием одновременно характеризуют значение двух и более переменных.
  2. Дисперсионный статистический анализ. Этот метод ориентирован на поиск зависимостей среди экспериментальных данных посредством изучения существенности различий в средних показателях.
  3. Ковариационный анализ. Он тесно связан с дисперсионным методом. При ковариационном исследовании зависимая переменная корректируется в соответствии с информацией, связанной с ней. Это обеспечивает возможность устранения изменчивости, вносимой извне, и, соответственно, повысить эффективность исследования.

Также существует дискриминантный анализ. Он применяется, если зависимая переменная является категориальной, а независимые (предикторы) – интервальными.

Ссылка на основную публикацию
Adblock
detector