Забавная это штука — числа. Что такое два? Ну, смотря чего, — скажете Вы, и будете чертовски правы!
Выполнение любых расчетов невозможно до тех пор, пока не будут получены сами числа, являющиеся предметом анализа. Часто работа с числами не вызывает трудностей. Часто — это ещё не всегда. Иногда мы имеем дело с качественными характеристиками. Студент выполнил задание хорошо или плохо; наш студент учится лучше или хуже, чем его одногруппники; и вообще — мы говорим о студенте или о студентке и как его (её) зовут (о котором студенте из группы идет речь).
Вот как пишет об этом Александр Резник в своей Книге для тех, кто не любит статистику, но вынужден ею пользоваться:
Преодоление разрыва между качествами («какой») и количествами («сколько») связано с именем американского психолога С. Стивенса, который в 1940-х гг. предложил новый подход к проблеме измерений. По Стивенсу, измерение понимается как процесс приписывания чисел объектам или событиям в соответствии с определенными правилами. Каждое из этих правил определяет тип шкалы, в которой производится измерение. Стивенс предложил четыре типа измерительных шкал, позволяющих перебросить мостик между миром качеств и миром количеств:
- шкала наименований;
- шкала порядка;
- шкала интервалов;
- шкала отношений.
Четыре типа шкал образуют иерархию, в которой каждая последующая шкала включает в себя свойства нижележащих шкал.
С каждой из шкал связан определенный диапазон допустимых математико-статистических преобразований. Выход за пределы этого диапазона приводит к тому, что получаемые результаты оказываются лишенными смысла. Об этом необходимо помнить на этапе планирования работы по сбору данных. Например, к данным, представленным в шкале наименований, нельзя применять методы анализа, допустимые для шкал порядка или интервалов.
Использование шкалы наименований позволяет наделять объекты или их свойства (признаки) именами. Телефонные и автомобильные номера, различные цветные фигурки на шкафчиках в детском саду и т.п. — это примеры имен, которыми мы наделяем различные объекты. При этом неважно, что будет использоваться в качестве имени — цифры, буквенные сочетания, условные обозначения и т.п. Основное требование здесь — не присваивать одно и то же имя двум разным объектам (или объектам с различными свойствами). Если мы имеем дело с одинаковыми объектами или объектами, обладающими одинаковыми свойствами, то они должны в шкале наименований получать одинаковые имена.
С каждой из шкал связан определенный набор допустимых операций. Поскольку в шкале наименований числа — не более чем ярлыки, наклеиваемые на объекты (например: артикул 423521а), с этими числами нельзя производить никаких действий. Возможен только подсчет числа объектов с одинаковыми именами (например — товаров с названным артикулом) или с одинаковыми свойствами (мужчины и женщины; майки красного, белого, синего и черного цветов, и т.д.).
Наделение объектов именами позволяет приступить к выявлению сходств и различий между ними. Например, можно обнаружить, что одни студенты более успешны, чем другие, автомобили одних марок быстрее других и т.д.
В том случае, когда между объектами возможно установление отношений типа «быстрее», «успешнее», «вкуснее», «ярче», «громче», «популярнее» и др., появляется возможность расположить объекты в порядке возрастания или убывания определенного признака. После этого остается наделить упорядоченную последовательность числами таким образом, чтобы большее число соответствовало большей степени выраженности признака (или наоборот). В результате получим шкалу порядка, в которой отношения между числами будут соответствовать отношениям между объектами. Такие шкалы широко используются в повседневной жизни.
Одна из наиболее распространенных шкал порядка — шкала школьной или университетской успеваемости. Чем более успешен студент, тем большее число в этой шкале ему соответствует. Существуют и другие, столь же широко применяемые шкалы порядка, например шкала твердости минералов Мооса, шкала Бофорта для силы ветра, сейсмические шкалы для оценки силы землетрясений и т.п.
В то же время расположение объектов в порядке возрастание определенного свойства (например, минералов по твердости) ещё не дает ответа на вопрос: на сколько больше? Шкала порядка не позволяет определить «расстояние» между объектами. Об этом особенно необходимо помнить в тех случаях, когда из соображений удобства шкальные значения отделяют друг от друга равные интервалы. Например, три студента получили на экзамене тройку, четверку и пятерку. Оценка студента, сдавшего экзамен на четверку, отличается от оценки троечника или отличника на один балл. Однако из этого не следует, что его знания на столько же больше знаний троечника, на сколько меньше знаний отличника.
Особенности шкалы порядка позволяют определить для неё группу допустимых математико-статистических преобразований. Результаты, представленные в шкале порядка, нельзя использовать для пропорций (получивший четверку знает не в два раза больше двоечника). Для таких результатов можно применять только моду и медиану. Вычисление среднего (например, средней успеваемости) является недопустимой операцией для шкалы порядка (к сожалению, это требование повсеместно нарушается).
В ряде случаев (но далеко не всегда!) удается упорядочить объекты или их свойства таким образом, что возможно определить «расстояние» между ними. Чаще всего эта задача решается путем договоренности о том, по каким признакам можно судить об одинаковости «расстояния», отделяющего друг от друга различные объекты. Если такая договоренность достигнута, то одинаковым отличиям между объектами будут соответствовать равные числовые значения. Пример — разные шкалы для измерения температуры (по Реомюру, по Цельсию и по Фаренгейту).
Отличительными особенностями шкал интервалов являются:
- произвольно задаваемые точка отсчета (ноль шкалы), выбор единицы измерения (величина интервала) и выбор направления отсчета;
- отсутствие возможности сравнивать отношения измеряемых признаков с целью получения ответа на вопрос «во сколько раз больше»;
- многие шкалы интервалов содержат отрицательные значения (например, отрицательная температура).
Шкала интервалов позволяет применять большинство математико-статистических методов для обработки и анализа данных, полученных с её помощью. Можно использовать все меры центральной тенденции и рассеяния, коэффициент корреляции Пирсона и др. Имеющиеся ограничения в первую очередь связаны с исключением пропорций. Следует помнить, что ответ на вопрос «на сколько больше» также не универсален. Он зависит от выбора точки отсчета и единицы измерения.
Если свойства объектов таковы, что становится возможной операция их объединения, то математическим аналогом объединения является операция суммирования — получаем ещё одну шкалу — шкалу отношений.
Если мы объединяем одинаковые объекты, операция суммирования заменяется операцией умножения. В шкале отношений появляется возможность сказать, сколько раз нужно взять одинаковые объекты А, чтобы получить их совокупность (рассматриваемую как объект Б), или во сколько раз объект Б больше объекта А.
В случае объединения объектов или их свойств результат объединения, выраженный в шкале отношений, не должен зависеть ни от точки начала отсчета, ни от единиц измерения. Такое возможно только в случае, если у шкалы отношений существует «абсолютное» начало отсчета, характеризующееся отсутствием измеряемого признака или свойства. В шкале интервалов это условие не соблюдается. Математико-статистические методы, используемые для обработки и анализа данных в шкале отношений, можно применять без каких-либо ограничений.