08 ТРУДНОСТИ С ДАННЫМИ

Ссылки на написанные работы часто не содержат чисел. Однако обычно и ссылки, лишенные чисел, и числа все равно встречаются в тех или иных комбинациях в слабоструктуризованных проблемах. Числа и нечисловые сообщения являются данными, а данные являются результатами. Данные, таким образом, не само явление, но возникают в связи с ним. Чтобы объяснить явление, одни данные должны быть связаны с другими данными с помощью чисел. Это должно быть сделано логическим, осмысленным способом обычно с помощью карт, таблиц или уравнений.

При использовании данных как фактических свидетельств явления или результата явления могут возникать серьезные ошибки. Источник этих ошибок кроется в неправильном истолковании данных. Например, метеоролог может сказать, что в определенном районе выпадает дождь с интенсивностью 2 дюйма в час. Означает ли это утверждение одно и то же для его автора, для которого оно звучит как очевидность, и для читателя? Вот некоторые нелогичные выводы из данных, сообщенных метеорологом:

1. Дождь идет каждый час и каждый час выпадает 2 дюйма дождя.
2. Выпадение дождя в течение часа неизменно, причем дождь в этом районе идет все время.
3. Выпадение дождя во всем районе равномерно.. Автор не привел в своем сообщении следующие относящиеся к делу сведения:

1. Данные часового выпадения дождя могут означать или среднее, или максимальное значение, причем разница между этими двумя величинами может быть существенной.
2. Данные о часовом выпадении дождя не содержат указания на число лет, в течение которых сделано это наблюдение, 'и которое позволило бы установить статистическую вероятность оценки.
3. Чтобы можно было понять смысл данных как меры, должно быть указана, относятся ли данные о выпадении дождя к месяцу; сезону или полному году; иногда данные о часовом выпадении дождя отражают результаты наблюдения осадков за 24-часовой период.
4. Данные о выпадении дождя могут объединять наблюдения большого числа станций по сбору данных внутри и вокруг определенной области. Таким образом, числа ,по этой области могут быть взвешенными средними, полученными Из максимальных или средних значений 'наблюдений, или это может быть простое среднее этих 'наблюдений. Таким образом, «2 дюйма дождя в час» ничего не говорят о том, каким был дождь в течение каждого часа, какова продолжительность непогоды пли равномерность дождя в данном районе. Часовое выпадение дождя является существенно вероятностной оценкой, к которой может быть применен статистический подход. В этом примере метеоролог сообщением данных, которых он не понимает, вовлек себя и потребителя его данных в плохо структуризованную проблему. Может случиться, что потребитель данных окажется заключенным в проблеме, как в ловушке, из-за заблуждений автора при квалификации данных. Типичной ловушкой является оставшееся скрытым предположение, лежащее в основе решения.

Определенные проблемы могут возникнуть также из-за неправильного понимания отношений данных. Могут получаться ошибки в масштабе из-за преувеличения влияния качеств одного параметра на другой. Проблемы возникают также при отборе данных для описания явления. Например, тяга авиационного двигателя может быть показана как функция веса самолета. Из этой диаграммы специалист может заключить, что способ описания энергии, необходимой для полета самолета, заключается в том, чтобы связать тягу двигателя с весом самолета. Если специалист хотел описать предсказуемую корреляцию веса и тяги, возможно лучше было бы выбрать не вес самолета, а вес двигателя. Противоположной задачей могло стать понимание отношения тяги и скорости. Для этой задачи, может быть, было бы более желательным показывать отношение тяги к весу самолета для различных значений скорости в морских милях в час. Заметьте, что вес самолета выражается в фунтах, тяга—в фунтах и что скорость может быть выражена в фунтах в секунду, морских милях в час или милях в час. Использование «фунта» или «скорости» должно быть полностью определено, в противном случае неосведомленный читатель должен будет сделать предположение об единицах измерения величин.

Прежде всего специалист по анализу систем при анализе проблемы должен проверить понятность данных и их отношений. Вторая проверка должна проводиться, когда специалист использует данные для анализа проблемы. Третья проверка проводится тогда, когда он выводит заключение из данных и их отношений. Четвертая проверка выполняется, когда данные представлены формально как объяснение проблемы или как ее решение. Конечная, пятая, проверка является проверкой последовательности и убедительности объяснения. Она, в свою очередь, покоится на способности: 1) демонстрировать исход последовательности событий, 2) предсказать исход, который нельзя демонстрировать, но который фактически получается.

Другое возможное заблуждение при выборе и представлении данных связано со структурой проблемы. Должно быть показано, каким образом используются данные при решении проблемы: данные объясняют явление или, напротив, явление объясняет данные? Точно так же: объясняют ли написанные слова отчета данные или же относительно данных предполагается, что они объясняют слова? Обратимся снова к эксперименту Кеплера. Его проблема состояла в том, чтобы найти такую форму орбиты Марса, которая давала бы наилучшее объяснение данным, наблюдавшимся Браге. Предположение, сделанное Кеплером, было основано на проверке точности данных Браге и состояло в том, что данные правильно отражают реальное явление. Если бы Кеплер догматически подошел к проблеме, он мог бы объяснить предполагаемую им орбиту через данные. Вообще, сущность данных состоит в том, что они объясняют явление. Упоминания о «сырых» данных обычно относятся к незарегистрированным наборам величин, полученным из процесса. Следовательно, специалист может 'нуждаться в анализе «сырых» данных и их синтезе в осмысленную структуру, объясняющую процесс.

Инженер-хронометрист с его изучением трудового процесса является хорошим примером специалиста, который структуризует «сырые» данные. Разбив с помощью наблюдения изучаемую 'им трудовую операцию на ее элементы, он запускает свой хронометр в момент начала цикла операции. Он отмечает на диаграмме момент завершения каждого элемента цикла. Он может наблюдать небольшое число циклов, два или три, или же сотни циклов операций. Его цель состоит в получении полного осмысленного набора «сырых» данных, в который входят следующие данные.

1. Описания элементов, которые с помощью слов указывают, что делает рабочий на станке на протяжении цикла. В цикле может быть два или три или несколько сотен таких «элементов». Число элементов зависит от детальности изучения, продолжительности элемента и сложности, присущей задаче рабочего.

2. Время окончания каждого элемента цикла, которое показывает численно, сколько секунд или сотен минут прошло от момента 'начала элемента. Вообще, чем больше число элементов и чем короче элемент, тем больше моментов окончания будет получено. Определение оценок для элементов, имеющих наименьшую продолжительность, имеет тенденцию делать изучение «яснее» и точнее; мероприятия, необходимые для исключения излишних элементов, выясняются по мере того, как описание процесса становится более подробным.

После сбора «сырых» данных необходимо прежде всего так расположить наблюдаемые элементы, чтобы они равномерно покрывали весь цикл работы. Инженер-хронометрист должен учесть все моменты времени между началом и концом изучаемого им процесса. Он должен отметить такие периоды времени, которые ничего не вносят в работу при прохождении процесса. Затем он должен подобрать времена по циклам для получения единственной оценки для каждого элемента в каждом наблюдаемом цикле. Эти времена элементов затем подготовляются для статистического анализа. Например, инженер-хронометрист мог заметить, что продолжительности некоторых элементов варьируют в пределах ±2%. Распределение частот других элементов может быть нормальным, а у третьих может оказаться расплывчатое распределение без заметной моды. Проведя статистический анализ, инженер-хронометрист сможет удовлетворить условию, чтобы все величины были распределены в пределах ±10%. Это приводит его к выводу, что:

1. Он должен заново изучить элементы цикла, чтобы точнее различать конец одной операции и начало следующей. Для этого он должен более точно определить моменты завершения элементов.

2. Он должен произвести разбиение элементов точнее или грубее, чтобы исключить случайные переменные, искажающие части цикла.

3. Он должен сделать больше наблюдений, чтобы удовлетворить требованиям статистического метода.

4. Он должен произвести проверку большего числа рабочих, чтобы определить обобщенный временной стандарт. Он может также выбрать для наблюдения процесс обработки идентичной детали на другом станке; станок, на котором велись первоначальные исследования, может быть признан 'им неподходящим.

5. Он не должен стремиться, как к цели, установить временной стандарт для данной детали. Он может избрать как основное направление дальнейшей работы вывод уравнений и кривых, которые представляют основные операции. Это может потребовать многих сотен или тысяч наблюдений циклов, чтобы определить необходимые отсчеты и оценки для операций. Инженер может пытаться, например, получить величины, которые будут показывать возможности рабочего или станка выполнять операцию сверления (штамповки, фрезерования и т. д.) отверстия данного размера в данном материале.

6. Он должен изучить влияние изменения материала, так как не может быть установлен один и тот же норматив времени, например, для стали. и алюминия.

7. Он должен изменять величину подачи, скорости или глубины резания, поскольку операция, которую он анализирует, была слишком быстрой (слишком медленной) для материала или оборудования. В классической дилемме об установлении осмысленного норматива времени на работу задача инженера состоит в том, чтобы установить такой норматив (данные), который отражает работу (явление). Такой норматив времени становится предсказанием данной работы и представляет собой измеритель потребного для нее времени и затрат труда. Пункты 1—7 выделяют важные области проблемы, в каждой из которых могут быть собраны сырые данные с различной степенью полноты, точности и достоверности. Точно такие же проблемы существуют в большинстве хорошо структуризованных областей делового мира. Решение большинства проблем найти легче, если сырые данные, подлежащие анализу, полностью понимаются и квалифицируются.

Подобно этому устная речь, представляющая собой важнейший канал связи, может служить как определенный вид «сырого» входа. В этой роли она является полезным инструментом руководителей. Даже формальный обмен письмами, сопровождаемый ясными, тщательно подготовленными, имеющими письменные разъяснения графическими материалами, вызывает много затруднений в связи. Оказывается, что успех в решении проблемы обратно пропорционален формалистичности, с которой проблема анализируется и представляется. Однако устная связь, образующая жизненно важную часть человеческих коммуникаций, не может быть заменена, несмотря на ее недостатки. При решении проблемы специалист по анализу системы должен быть «прикован» к ее числам и их отношениям. Иным способом невозможно охватить значение данных или явления.