Что значит статистический материал

Г. Статистические материалы

Необходимо различать собственно статистические материалы и материалы статистического характера. К последним могут быть отнесены любые массовые данные, которые могут быть подвергнуты статистической обработке. Материалы статистического характера иллюстрируют процесс зарождения и становления документов статистики.

Статистика обычно рассматривается как система сбора сведений для обеспечения обратной связи в системах управления разного уровня и выработки управленческих решений.

В то же время статистика отличается от учетной документации. Последняя обеспечивает реализацию уже принятых решений (учет произведенного, сделанного), в то время как статистические данные собираются для выработки управленческих решений вплоть до долговременной политики в той или иной сфере.

Статистические источники характеризуются своим созданием на основе научно-обоснованной программы, количественной (описательно-цифровой) информацией, массовым характером изучаемых объектов, определением критериев и принципов сбора и группировки материала, комплексным характером сведений; чертами, присущими массовым источникам. Следует заметить, что именно наличие вышеназванной программы статистического обследования не всегда позволяет безоговорочно применять к нему методы математической статистики. На уровне программы под влиянием идеологических и других факторов могут быть заложены такие искажения, которые отнюдь не будут являться погрешностями вычислений.

В процессе развития статистически происходит как становление собственно статистических учреждений, так и определение основных направлений: демографической статистики (статистики народонаселения), статистики сельского хозяйства и промышленности.

Статистические источники содержать массовые, преимущественно количественные, данные. Правильное их использование позволяет определить в совокупности явлений те, что кажутся случайными, характерные для них закономерности развития. Выявление отмеченных закономерностей проходит путем сравнения количественных данных, однако для этого необходимо изучение сопоставимости (однородность) статистических данных. Ибо статистические сведения содержат не только количественные, но и качественные характеристики. Изменения территории или других параметров изучаемого объекта не дают возможности сопоставить статистические данные в полном объеме.

Основные принципы использования статистических данных касаются, таким образом, трех сторон: полноты, точности и однородности изучаемых данных. Во-первых, статистические данные должны быть достаточно полными в смысле охвата ими всех важнейших элементов изучаемого явления или процесса. Для определения же точности статистических данных необходимо определить источник их происхождения: заимствованы ли они из анкеты, заполнявшейся заинтересованным в результатах лицом, или же получены он статистика, обязанного точно описывать изучаемые явления; данные собирались подготовленными специалистами, или же случайными лицами, среди которых могли быть и те, кто не имел элементарных представлений о правилах статистического учета. И, наконец, сравниваемые сведения должны быть однородными (сравниваться должны однородные явления, процессы, объекты по определенным, точно определенным параметрам).

Формирование статистических источников включает следующие стадии: 1) подготовительная работа, сбор сведений, 2) сведение (обработка) первичных данных и подготовка их к печати. Историк, имея дело преимущественно с публикациями (материалами разработки), должен получить представление об обеих стадиях, даже в тех случаях, когда первичные материалы подлежали уничтожению (материалы всеобщих переписей). Необходимо также знание языка, терминологии статистики и обязательный учет документов, определивших условия сбора и обработки информации.

Источник

Статистические материалы

Источниковедение.

Классификация источников.

Законодательные акты и нормативные документы.

Документы бывают российского (федерального) и регионального уровня. Эти документы позволяют нам раскрывать какие проблемы были более выражены того или иного времени, и как эти проблемы регулировались на каком-либо уровне.

Нормативные документы помогаю вывить политику государства, а так же способы ее реализации на местах.

Нормативный акт — это официальный документ правотворческого органа, в котором содержатся правовые нормы.

Нормативные акты создаются в основном государственными органами, имеющими право принимать нормативные решения по тем вопросам, которые переданы им для разрешения. При этом они выражают волю государства. Отсюда проистекает их властность, официальность, авторитарность, обязательность.

Нормативные акты характеризуются следующими признаками.

Во-первых, они имеют правотворческий характер: в них нормы права либо устанавливаются, либо изменяются, либо отменяются. Нормативные акты — это носители, хранилища, жилища правовых норм, из них мы черпаем знания о правовых нормах.

Во-вторых, нормативные акты должны издаваться только в пределах компетенции правотворческого органа, иначе по одному и тому же вопросу в государстве будет существовать несколько нормативных решений, между которыми возможны противоречия.

В-третьих, нормативные акты всегда облекаются в документальную форму и должны иметь следующие реквизиты: вид нормативного акта, его наименование, орган, его принявший, дату, место принятия акта, номер. Письменная форма способствует достижению единообразного понимания требований юридических норм, что очень важно, поскольку за их неисполнение возможно применение санкций.

В-четвертых, каждый нормативный акт должен соответствовать Конституции РФ и не противоречить тем нормативным актам, которые имеют по сравнению с ним большую юридическую силу.

В-пятых, все нормативные акты обязательно подлежат доведению до сведения граждан и организаций, т. е. опубликованию, и лишь только после этого государство имеет право требовать их неукоснительного исполнения исходя из презумпции знания закона и налагать санкции.

Нормативный правовой акт — официальный документ установленной формы, принятый в пределах компетенции уполномоченного государственного органа (должностного лица), иных социальных структур (муниципальных органов, профсоюзов, акционерных обществ, товариществ и т.д.) или путём референдума с соблюдением установленной законодательством процедуры, содержащий общеобязательные правила поведения, рассчитанные на неопределённый круг лиц и неоднократное применение.

Делопроизводственная документация различных органов и учреждений.

Документы бывают разного характера распоряжения, взыскания, организационно — учредительные, информационные (отчеты, переписка и т.п.). Могут быть как государственных органов, так и частных.

Делопроизводственные документы — самый многочисленный вид исторических источников. В широком смысле к ним относится весь комплекс документации, образующейся в результате деятельности любого органа управления, независимо от масштаба и формы собственности объектов управления.

Статистические материалы.

Статистика — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.

Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных.

Существует три вида группировки статистики:

Аналитическая группировка — позволяет выявить связь между группировками.

Типологическая группировка — разделение исследуемой совокупности на однородные группы.

Структурная группировка — в которой происходит разделение однородной совокупности на группы, по определенному признаку.

Группировки бывают первичными и вторичными. Первичные группировки получаются в ходе статистических наблюдений. А вторичные осуществляются на основании первичной.

Статистические методы — методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надёжность и испытания, планирование экспериментов.

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

Выделяют три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учёта специфики области применения;

б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;

в) использование статистических методов и моделей для статистического анализа конкретных данных в решении прикладных задач, например, с целью проведения выборочных обследований.

Прикладная статистика — это наука о том, как обрабатывать данные произвольной природы. Математической основой прикладной статистики и статистических методов анализа является теория вероятностей и математическая статистика.

Государственная статистика – это деятельность, осуществляемая органом государственной статистики и его службами. Эта деятельность направлена на осуществление функций по формированию официальной статистической информации о социальном, экономическом, демографическом и экологическом положении страны.

Предоставление статистической информации – главная задача органов государственной статистики и продукция их деятельности. Как любая продукция, она имеет стоимость. Особенно дорогой является та информация, получение которой выходит за пределы программы работы государственной статистики.

Структура органов государственной статистики соответствует административно-территориальному делению страны. В двух городах – Москве и Санкт-Петербурге — имеются местные комитеты по статистике, то же – в автономных республиках. В краях и областях также работают комитеты статистики. Низовым звеном являются районные инспектуры государственной статистики, которые имеются в административных районах краев и областей, крупных городов.

Основные функции всех статистических органов состоят в сборе, обработке, анализе и представлении и данных в удобном пользователю виде. Статистические службы должны оперативно предоставлять информацию органам управления, осуществлять обмен информацией с Центробанком РФ и его конторами на местах, Минфином РФ и его местными органами, Госкомимуществом РФ и его службами. Комитетом по труду и занятости РФ ит.д.

Периодическая печать.

Заметки корреспонденции в местных и центральных газетах.

Периодическая печать — вид исторических источников, представленный долговременными изданиями периодического характера, функциями которых являются организация (структурирование) общественного мнения, осуществление идеологического воздействия государства, информационное обслуживание экономической деятельности в сфере частного предпринимательства, установление обратной связи в системе управления.

Периодическая печать делится на три разновидности: газеты, журналы, повременные издания научных обществ.

Источник

Основы статистики: просто о сложных формулах

Статистика вокруг нас

Статистика и анализ данных пронизывают практически любую современную область знаний. Все сложнее становится провести границу между современной биологией, математикой и информатикой. Экономические исследования и регрессионный анализ уже практически неотделимы друг от друга. Один из известных методов проверки распределения на нормальность — критерий Колмогорова-Смирнова. А вы знали, что именно Колмогоров внес огромный вклад в развитие математической лингвистики?

Еще будучи студентом психологического факультета СПбГУ, я заинтересовался когнитивной психологией. Кстати, Иммануил Кант не считал психологию наукой, так как не видел возможности применять в ней математические методы. Мои текущие исследования посвящены моделированию психических процессов, и я надеюсь, что такие направления в современной когнитивной психологии, как вычислительные и коннективисткие модели, смягчили бы его отношение!

Конечно, статистика применяется далеко за пределами научных лабораторий: в рекламе, маркетинге, бизнесе, медицине, образовании и т.д. Но, что самое интересное, базовые знания анализа данных крайне полезны и в повседневной жизни. Например, думаю, все вы знакомы с понятием среднего арифметического. Среднее значение очень часто используется в СМИ при обсуждении различных социально-экономических показателей — доходов, уровня безработицы и т.д. В 2005 году британские СМИ писали о том, что средний уровень дохода населения не только не возрос, но снизился на 0,2 % по сравнению с предыдущим годом. Мелькали заголовки «Доходы населения снизились впервые с 1990 года». Некоторые политики даже использовали этот факт, критикуя действующее правительство. Однако, важно понимать, что среднее арифметическое — хороший показатель, когда наш признак имеет симметричное распределение (богатых столько же, сколько бедных). Реальное же распределение доходов имеет скорее следующий вид:

Распределение имеет явно выраженную асимметрию: очень состоятельных людей заметно меньше, чем представителей среднего класса. Это приводит к тому, что в данном случае банкротство одного из миллионеров может значительно повлиять на этот показатель. Гораздо информативнее использовать значение медианы для описания таких данных. Медиана — это значение зарплаты, которое находится в самой середине распределения доходов (50% всех наблюдений меньше медианы, 50% — больше). И, как ни удивительно, медиана дохода в 2005 году в Великобритании, в отличие от среднего значения, продолжила свой рост. Таким образом, если вы знаете о различных типах распределения и различных мерах центральной тенденции (среднее и медиана), то вас не так просто ввести в заблуждение в таких случаях, как описаны в примере.

Черный ящик статистического анализа

Как мы уже выяснили, чем бы вы ни планировали заниматься, вероятность столкнуться с курсом «математическая статистика в вашей области» постепенно приближается к единице. Однако, часто занятия по введению в статистику не вызывают восторга у студентов нетехнических факультетов. Через несколько занятий выясняется, что такие базовые понятия, как, например, корреляция представляют собой нечто следующее:

И, отчаявшись досконально разобраться с происхождением этих сумм и квадратных корней, студент может начать воспринимать статистику следующим образом: «если r > 0, то положительная связь, а если меньше 0, то отрицательная»; «если p уровень значимости меньше 0.05 — то хорошо, если от 0.05 до 0.1 — то не очень хорошо, а если больше 0.1 — то плохо». Помогая студентам готовиться к экзамену, не раз сталкивался с такими заклинаниями! Также, разумеется, никто не рассчитывает все эти показатели вручную, и используя, например, SPSS, можно за секунду загуглить пошаговую инструкцию «как сравнить два средних».

  1. Жмем сюда
  2. Снимаем/ставим галочки тут
  3. p profit

Статистический анализ начинает напоминать черный ящик: на вход подаются данные, на выход — таблица основных результатов и значение p-уровня значимости (p-value), который и расставит все точки над i.

О чем нам, собственно, говорит p-value?

Предположим, мы решили выяснить, существует ли взаимосвязь между пристрастием к кровавым компьютерным играм и агрессивностью в реальной жизни. Для этого были случайным образом сформированы две группы школьников по 100 человек в каждой (1 группа — фанаты стрелялок, вторая группа — не играющие в компьютерные игры). В качестве показателя агрессивности выступает, например, число драк со сверстниками. В нашем воображаемом исследовании оказалось, что группа школьников-игроманов действительно заметно чаще конфликтует с товарищами. Но как нам выяснить, насколько статистически достоверны полученные различия? Может быть, мы получили наблюдаемую разницу совершенно случайно? Для ответа на эти вопросы и используется значение p-уровня значимости (p-value) — это вероятность получить такие или более выраженные различия при условии, что в генеральной совокупности никаких различий на самом деле нет. Иными словами, это вероятность получить такие или еще более сильные различия между нашими группами, при условии, что, на самом деле, компьютерные игры никак не влияют на агрессивность. Звучит не так уж и сложно. Однако, именно этот статистический показатель очень часто интерпретируется неправильно.

А теперь несколько примеров про p-value

Итак, мы сравнили две группы школьников между собой по уровню агрессивности при помощи стандартного t-теста (или непараметрического критерия Хи — квадрат более уместного в данной ситуации) и получили, что заветный p-уровень значимости меньше 0.05 (например 0.04). Но о чем в действительности говорит нам полученное значение p-уровня значимости? Итак, если p-value — это вероятность получить такие или более выраженные различия при условии, что в генеральной совокупности никаких различий на самом деле нет, то какое, на ваш взгляд, верноеутверждение:

  1. Компьютерные игры — причина агрессивного поведения с вероятностью 96%.
  2. Вероятность того, что агрессивность и компьютерные игры не связаны, равна 0.04.
  3. Если бы мы получили p-уровень значимости больше, чем 0.05, это означало бы, что агрессивность и компьютерные игры никак не связаны между собой.
  4. Вероятность случайно получить такие различия равняется 0.04.
  5. Все утверждения неверны.

Если вы выбрали пятый вариант, то абсолютно правы! Но, как показывают многочисленные исследования, даже люди со значительным опытом в анализе данных часто некорректно интерпретируют значение p-value (например, можно посмотреть эту интересную статью).

Давайте разберем все ответы по порядку:

  1. Первое утверждение — пример ошибки корреляции: факт значимой взаимосвязи двух переменных ничего не говорит нам о причинах и следствиях. Может быть, это более агрессивные люди предпочитают проводить время за компьютерными играми, а вовсе не компьютерные игры делают людей агрессивнее.
  2. Это уже более интересное утверждение. Все дело в том, что мы изначально принимаем за данное, что никаких различий на самом деле нет. И, держа это в уме как факт, рассчитываем значение p-value. Поэтому правильная интерпретация: «Если предположить, что агрессивность и компьютерные игры никак не связаны, то вероятность получить такие или еще более выраженные различия составила 0.04».
  3. А что делать, если мы получили незначимые различия? Значит ли это, что никакой связи между исследуемыми переменными нет? Нет, это означает лишь то, что различия, может быть, и есть, но наши результаты не позволили их обнаружить.
  4. Это напрямую связано с самим определением p-value. 0.04 — это вероятность получить такие или еще более экстремальные различия. Оценить вероятность получить именно такие различия, как в нашем эксперименте, в принципе невозможно!

Вот такие подводные камни могут скрываться в интерпретации такого показателя, как p-value. Поэтому очень важно понимать механизмы, заложенные в основании методов анализа и расчета основных статистических показателей.

Онлайн-курс по основам статистики: сложные формулы несложным языком

Сейчас я пишу диссертацию на факультете психологии СПбГУ и преподаю статистику биологам в Институте биоинформатики. Основываясь на курсе читаемых лекций и собственного исследовательского опыта, возникла идея создать онлайн-курс по введению в статистику на русском языке для всех желающих, необязательно биоинформатиков или биологов.

Существует много хороших онлайн-курсов по анализу данных и статистике (например, такой, такой, или такой), но практически все они на английском языке. Надеюсь, что курс будет полезен для тех, кто только знакомится с основами статистики. В нем я стараюсь в максимально доступной форме разобрать основные идеи и методы анализа данных, уделяя особое внимание самой идее статистической проверки гипотез и интерпретации получаемых результатов. В качестве примеров будут задачи из различных областей: от биоинформатики до социологии. Курс бесплатный и все его материалы останутся открытыми после окончания, начинается 15 февраля.

Источник

Читайте также:  Что значит приписанные крестьяне
Оцените статью