Libmonster ID: RU-8694
Автор(ы) публикации: В. В. ПИРОЖКОВ

Начнем с цитаты, которая принадлежит знакомому российскому читателю американскому ученому Г. Кайбергу благодаря переводу его книги "Вероятность и индуктивная логика" на русский язык. "Теория субъективной вероятности - определенно одна из наиболее распространенных теорий, появившихся в течение последних десятилетий... Рост интереса к ней среди статистиков сначала был медленным, но сегодня явно приобрел экспоненциальный характер. От статистиков теория распространилась на экономическую, политическую и социальную науки. Философия способствовала ее применению в психологии и теории решений... Хотя нельзя сказать, что она доминирует в названных областях науки, все же нужно отметить респектабельность того места, которое принадлежит ей либо как предмету рассмотрения, либо как методологической доктрине в каждой из них... Теория несет с собой современный дух толерантности и демократии... Субъективная теория предоставляет хорошее работоспособное основание для философского исследования, поскольку навязывает минимум ограничений и максимум толерантности.

Далее я буду доказывать, что хотя данная теория, как кажется, приемлема для любого, в действительности она является ловушкой, западней и заблуждением, и либо бессмысленна и систематически бесполезна, либо просто ложна" 1 .

Представленная точка зрения характерна как для зарубежных, так и отечественных философов, пишущих о методологических проблемах, связанных с применением математической теории вероятности. Налицо явное противоречие или, если хотите, фрустрация: с одной стороны, признание широкого хождения субъективной вероятности в практике науки, а с другой - объяснение этого явления модой, ленью, отсутствием конкурентов, приверженностью к субъективному идеализму. Особенно парадоксально выглядит то, что в распространении этой "заразы" (иначе и не скажешь) повинны статистики - те специалисты, чей научный интерес связан с изучением массовых явлений,


Материал подготовлен при поддержке гранта РГНФ N 03 - 03 - 0533а

стр. 52


определением частоты или распределения в них конкретных объектов или признаков, к услугам которых имеющая длительную историю развития и установившиеся традиции частотная теория вероятности. Вероятность как частота - вот достойный конкурент субъективной вероятности. К числу конкурентов относятся и логическая, и предложенная процитированным автором эпистемологическая вероятности. Конкуренты есть, и тем не менее мы наблюдаем "экспоненциальный" рост интереса к субъективной вероятности именно у статистиков. В чем же дело? В этом нам и предстоит разобраться на материале математической статистики.

* * *

Центральным понятием статистической теории является абстрактное понятие генеральной совокупности, под которой понимается гипотетический класс объектов или мыслимых (не существующих реально) наблюдений или измерений при заданных условиях эксперимента. Полученные результаты изучения некоторых объектов рассматриваемого класса, которые могут быть представлены и как запись результатов измерения в эксперименте, интерпретируются в статистике как выборка, осуществленная из данной генеральной совокупности.

Методы математической статистики удобно разделить на две части: дескриптивную, к которой можно отнести все приемы, связанные с описанием статистического материала, полученного в результате выборок, его классификацией, количественной обработки; и предикативную, содержащую приемы статистического вывода. Обычно выделяются несколько типов статистического вывода, среди которых наиболее важную роль играют выводы от генеральной совокупности к выборке (в этом случае делается предсказание на основе известного описания параметров генеральной совокупности о параметрах предполагаемой выборки из нее) и выводы обратного характера - от выборки к генеральной совокупности.

Использование приемов математической статистики в науке для обработки некоторой массы наблюдений и получения определенных выводов нельзя оторвать от деятельности ученого по изучению законов развития и функционирования тех материальных систем, которые он выделяет в окружающем его мире, по раскрытию сущности явлений природы, а одним из необходи-

стр. 53


мых этапов такой деятельности является выдвижение гипотез. Строго говоря, в процессе получения заключений, скажем, обратного характера - от известных параметров выборки к неизвестным параметрам генеральной совокупности, из которой эта выборка взята - участвуют гипотезы. Формулировка статистической гипотезы является исходной точкой в процессе получения такого вывода. Сравнивание гипотезы, а в том случае, когда гипотеза является сложной, то сравнивание следствий, полученных из нее, с данными сделанной выборки позволяет судить о параметрах исходной совокупности. "Сначала со всей тщательностью формулируется некоторая гипотеза; из нее дедуктивным путем выводятся логические следствия; эти следствия сравниваются с надлежащими наблюдениями. Если эти последние находятся в полном соответствии с дедуктивными выводами, то гипотеза считается подтвержденной, по крайней мере до тех пор, пока не будут получены новые и более точные данные" - так характеризует процесс получения знания о параметрах исходной совокупности известный методолог статистики Р. Фишер2 .

Гипотезы общего характера, в которых формулируются предположения о сущности исследуемых явлений и процессов, и статистические гипотезы тесно связаны друг с другом: любая теория или гипотеза общего характера для экспериментальной оценки должна быть выражена в такой форме, которая давала бы возможность оценить ее статистически. Статистическая гипотеза и являет собой общую гипотезу, конкретизируемую настолько, что она приобретает вид количественного предположения. Один из традиционных статистических методов проверки рассматриваемых гипотез сводится к построению так называемых доверительных интервалов. Эта задача решается благодаря определению доверительной вероятности того, что принятая гипотеза об истинном значении параметра генеральной совокупности окажется правильной с небольшими погрешностями. Пусть, например, для параметра p генеральной совокупности рассматривается гипотеза, что его значение есть p 1 . Необходимо оценить ошибку, которую мы совершаем при замене p на p 1 . Для этого назначается достаточно большая вероятность (например,  = 0,9; 0,95 или 0,99) такая, что событие с вероятностью  можно считать практически достоверным. Необходимо найти такое значение  , для которого будет справедливо равенство

стр. 54


Тогда диапазон практически возможных значений ошибки, возникающей при замене p на p 1 на данном доверительном уровне  будет равен +  . Большие по абсолютной величине ошибки будут появляться только с очень маленькой вероятностью  , т. е. практически недостоверны. Перепишем предыдущее уравнение в следующем виде

Равенство означает, что с вероятностью  неизвестное значение параметра p генеральной совокупности лежит в интервале с границами р, -  и p 1 +  . Вероятность  и принято называть доверительной вероятностью, а построенный интервал, в котором с данной доверительной вероятностью должно находиться значение рассматриваемого параметра - доверительным интервалом.

Процедура проверки гипотезы при построенном доверительном интервале сводится к тому, чтобы наблюдать, попадет значение параметра, полученное из выборки, в интервал или нет. В случае, если выборочное значение оказывается в границах интервала, гипотеза принимается. Если это значение оказывается за пределами интервала, то исследователь должен решить дилемму: произошло ли событие с очень маленькой вероятностью и гипотеза верна (вероятность ошибки  ) или рассматривать этот случай как показатель того, что проверяемая гипотеза неверна.

Смысл процедуры проверки статистической гипотезы заключается таким образом в том, чтобы ответить на вопрос - должна ли быть принята или отвергнута проверяемая гипотеза на основании полученной в выборке информации. Согласно принятой в статистике терминологии проверяемая гипотеза обозначается термином "нулевая гипотеза", а предположение, которое принимается в случае, когда нулевая гипотеза неверна, называется альтернативой этой гипотезы. Используя доверительный интервал и тот фактический материал, который дает эксперимент, статистик не пытается судить о том, истинна нулевая гипотеза или ложна - "об этом статистик ничего знать наверное не может". Эксперимент для него существует для того, чтобы дать факты для возможного опровержения или принятия нулевой гипотезы.

По сути дела с обобщением концепции доверительных интервалов мы встречаемся в процедуре, известной в математической статистике под названием "тест значимости". Если доверительный интервал строится непосредственно для параметра исходной совокупности, то тест значимости может быть задан для любой ин-

стр. 55


тересующей экспериментатора статистической характеристики: геометрическое представление всех возможных результатов наблюдения, называемое пространством наблюдений, делится на области или зоны. Критическая зона, определяемая принятым уровнем значимости, представляет собой ту часть пространства наблюдений, попадание в которую полученной в выборке статистической характеристики влечет за собой опровержение испытуемой нулевой гипотезы. В статистике Р. Фишера критические зоны названы зонами существенности, а часть пространства вне критической зоны - зоной несущественности.

По вопросу о том, какими должны быть выбраны доверительные вероятности  и уровни значимости  для каждого конкретного случая и на каком основании, среди статистиков единства нет. Возникающие здесь разногласия "идеологического" характера между подходом Неймана-Пирсона и статистической школой Р. Фишера оказываются тесно связанными с вопросами о роли теории вероятностей в статистике, о том, как следует понимать вероятность, и, наконец, о возможности "чисто" научного подхода к изучению явлений внешнего мира.

Согласно концепции Неймана-Пирсона в основе доверительных вероятностей и уровней значимости лежит представление о вероятности как о частоте интересующего нас признака в рассматриваемой совокупности явлений (событий). В соответствии с этим количественное выражение этой частоты - параметр в генеральной совокупности - рассматривается как величина постоянная. Распространение частотного подхода на интерпретацию доверительной вероятности и уровня значимости требует вообразить длинную серию испытаний нулевой гипотезы: если  процентов полученных результатов подтвердили гипотезу, а  процентов ее отвергли, то испытуемую гипотезу следует принять. Гипотеза отбрасывается, если процент опровержений превышает  . Таким образом, в том случае, когда процент опровержений не превышает  , мы будем рассматривать их как "ошибки экспериментирования" - в противном случае мы вынуждены признать факт опровержения гипотезы экспериментальными данными.

Основным недостатком подобного объяснения является то, что статистическая практика не дает возможности испытать гипотезу в "длинной серии". Поэтому единственный выход - поточнее установить уровень значимости и попадание статистической характеристики в критическую зону расценивать как

стр. 56


опровержение гипотезы. Но на этом пути теория испытания гипотез Неймана-Пирсона встречается с большими трудностями. В самом деле, исходя из каких соображений можно разумно установить уровень значимости? Здесь к выбору уровня значимости привлекаются представления об ошибках первого и второго рода. Как уже указывалось, в процедуре проверки статистик не делает каких-либо заключений об истинности или ложности гипотезы; все, что от него требуется, заключается в наблюдении того, подтверждается гипотеза экспериментальными данными или нет. При этом он может допустить ошибку первого рода - будет отброшена проверяемая гипотеза, в то время как она на самом деле является истинной. Вероятность совершить ошибку первого рода зависит от величины выбранного уровня значимости. Если, например, уровень значимости равен 5%, то вероятность совершить ошибку первого рода будет 0,05. Ошибка второго рода связана с принятием нулевой гипотезы, в то время как на самом деле истинной оказывается ее альтернатива: вероятность совершить ошибку второго рода в статистике Неймана-Пирсона называется мощностью выбранного критерия и зависит от выбранного уровня значимости.

Оценка последствий этих двух ошибок невозможна без того, чтобы не указать на ту чисто практическую цель, в интересах которой и проводится испытание гипотезы. В противном случае экспериментатор, согласно концепции Неймана-Пирсона, не сможет решить, вероятность какой из этих ошибок ему выгоднее уменьшить в эксперименте. Если, например, экспериментатор получает свою зарплату на металлургическом заводе за выполнение анализа стали на содержание в ней вредных примесей, то ему "выгоднее" уменьшить ошибку первого рода. Он будет реже браковать сталь, расплачиваясь за это повышением вероятности совершить ошибку второго рода. Возможно, что этот статистик вообще бы не браковал сталь (ему и его заводу это выгоднее), но поступать таким образом ему, вероятно, мешает гуманное сознание, которому неприятна мысль о том, что некондиционная сталь может оказаться причиной аварии с крупными человеческими жертвами; или осознание того, что потребитель стали организует собственную лабораторию, не доверяя результатам анализа, проводимого заводом-поставщиком, которой будет "выгоднее" все сомнительные случаи списывать за счет брака.

Таким образом, хотя и провозглашается, что "задача испытания статистической гипотезы есть задача выбора критической

стр. 57


области строго научными методами", выбор уровня значимости и доверительной вероятности может быть проведен лишь при учете практической цели, с которой проводится исследование: никакие другие соображения в подходе Неймана-Пирсона не могут быть приведены в обоснование выбора того или иного уровня значимости. "Вопрос о том, каким должен быть уровень значимости, не является статистической задачей. Обычно уровень значимости принимают равным 0,10; 0,05; 0,01; 0,001 и т. д. Чем серьезнее последствия ошибки первого рода, тем меньшим должен быть уровень значимости" - пишет Ю. Нейман 3 . И наоборот, чем серьезнее последствия ошибки второго рода, тем большим должен быть уровень значимости - все зависит от практической цели.

Подобная ситуация может быть легко "обоснована" ссылкой на "недостаточную определенность познавательных оценок". Согласно рассуждениям подобного рода, исследователь, ставящий перед собой чисто познавательную цель, не может руководствоваться исключительно тем, чтобы получить истинный вывод. В противном случае ему незачем задаваться доверительным интервалом, поскольку максимальную вероятность достижения истинного вывода ему обеспечивает принятие суждения, гласящего, что при любом исходе эксперимента интересующий его параметр окажется в интервале с границами 0 и 1. Ясно, что это утверждение является тавтологически истинным и поэтому для его проверки не нужны никакие опытные данные. Следовательно, для исследователя получение истинного вывода не является единственной целью: он заинтересован также и в том, чтобы его заключение содержало максимум информации. В результате при оценке гипотезы ему приходится действовать так, чтобы учесть оба требования, которые в данном случае противоречат друг другу: чем выше вероятность получения истинного вывода, тем шире оценивающий интервал, тем меньше информации содержится в выводе и наоборот - чем больше информации и уже интервал, тем меньше вероятность того, что вывод истинен. Такая же ситуация, по мнению сторонников подобного обоснования, складывается при определении относительной существенности ошибок первого и второго рода: то, что истину мы любим больше, чем ложь, не помогает нам в выборе уровня значимости. "Полагаю, - пишет по этому поводу К. Шанявский, - что такая ситуация является довольно типичной. Следует учитывать, что то, что мы называем познавательной целью исследования, имеет слож-

стр. 58


ный характер (т. е. здесь руководствуются более чем одной оценкой) и вместе с тем недостаточно определенный. Ибо в том случае, когда мы признаем по меньшей мере две противоречивые оценки, из которых ни одной не отдаем безусловного предпочтения, требуется установить, какова их относительная роль в осуществляемом нами выборе. В рассмотренном примере каждый выбор метода является компромиссом между ценностью истины и ценностью информации. Характер этого компромисса каждый раз определяется исследователем, и пока он руководствуется исключительно познавательными соображениями, не видно никаких объективных причин, которые диктовали бы ему такой, а не иной выбор" 4 . Такой же позиции придерживается Н. К. Дружинин, объявляя неопределенности, возникающие при выборе доверительного интервала и уровня значимости в теории испытания гипотез Неймана-Пирсона, неопределенностями, присущими всему человеческому познанию: "Однако не следует забывать об относительном характере выводов, делаемых подобным образом. Всегда существует возможность того, что неправдоподобное событие все же произойдет. Всегда имеется опасность расхождения вероятностного умозаключения исследователя с действительностью, особенно возрастающая в тех случаях, когда значения наблюденных статистических характеристик близки к границе критической зоны. Изменение уровня теста также может изменить характер его выводов. И вообще результаты проведенного эксперимента никогда нельзя считать окончательным ответом на вопрос, поставленный исследователем" 5 .

Как устраняются неопределенности человеческого познания в подходе Неймана-Пирсона, мы уже видели. Ученому предлагают стать одновременно прагматиком - для этого необходимо задаваться еще и практической целью, которая может "непроизвольно предопределить" выбор доверительной вероятности и относительную существенность ошибок разного рода. Наука, строго говоря, теперь уже не нуждается в фундаментальных исследованиях - все они должны проводиться с практическими целями. "Этот факт является несколько парадоксальным с точки зрения стереотипно предполагаемого превосходства фундаментальных теоретических исследований над прикладными. В связи с этим необходимо, однако, подчеркнуть, что исследования, которые проводятся с практической целью, могут миновать один этап - выбор определенного суждения из совокупности возможных выводов; практическое решение тогда непосред-

стр. 59


ственно зависит от опытных данных. Такой способ является вообще более эффективным с точки зрения оценок, определяемых практической целью. Познавательный этап, состоящий в присоединении какого-либо суждения к совокупности суждений, признанных истинными, в данном случае исключается" 6 .

Однако пожертвовав "чистой наукой", подход Неймана-Пирсона не избавляется от неопределенностей в выборе критических зон: неопределенности возрождаются вновь, только на другом уровне. В нашем примере с заводом-изготовителем стали устранение неопределенности введением практической цели - в данном случае цель диктует необходимость минимизации ошибки первого рода (уровень значимости должен быть настолько мал, насколько это возможно с тем, чтобы реже браковать сталь) - приводит к тому, чтобы учитывать неопределенность в поведении потребителя стали. Последний заинтересован в приобретении кондиционной стали, и результаты анализа, проведенного заводской лабораторией, могут его не удовлетворить. Другими словами, на этом уровне мы снова нуждаемся в компромиссе, но не между информацией и истиной, а между практическими намерениями изготовителя и потребителя, и этот компромисс должен быть учтен при выборе уровня значимости. Как поступать в этом случае?

Совершенно очевидно, что для примирения практических целей двух участников нужны новые методы - гармония практических намерений должна отразиться в том, что экспериментатор при проверке качества стали учтет этот компромисс в выборе ошибок первого и второго рода. Теперь на этом этапе ему придется минимизировать не одну ошибку, а сразу две и первого, и второго рода. Здесь по логике развития подхода Неймана-Пирсона, открывается новая страница в истории развития математической статистики. Появление математических моделей принятия оптимальных решений в условиях несовпадения интересов игроков послужило толчком для попыток разрешить трудности в выборе уровней значимости с помощью теории игр. С тех пор, как такая надежда была высказана в 1937 г. Нейманом, книги и учебники по математической статистике наполнились терминами теории принятия решений: "конкурирующие риски", "выбор действия", "полезность", "правило минимакса" и т. д. Да и сам предмет статистики трактуется теперь с учетом этих нововведений. Вопреки широко распространенному мнению, что статистика и теория вероятностей образуют основу не-

стр. 60


которого мыслительного процесса, называемого индукцией или индуктивным умозаключением, теперь оказывается полезным ввести термин "индуктивное поведение". "...Выбор действий в соответствии с содержанием памяти и наблюдаемыми фактами и называется индуктивным поведением, - пишет Ю. Нейман. - Математическая статистика является его моделью в тех частных случаях, когда наблюдаемые факты носят характер "случайности". Типичная задача математической статистики состоит в том, чтобы из результатов наблюдений, сформулированных в терминах частот, вывести метод выбора действий, при которых частота ошибок была по возможности наименьшей" 7 .

Таким образом, задача испытания статистической гипотезы сводится к выбору одного из действий, связанных с рассматриваемой гипотезой и ее альтернативой. "Принять гипотезу H это значит решить в пользу действия А, а не В. Это не означает, что мы уверены в истинности гипотезы Н. Также, если применение правила индуктивного поведения "отвергает" H, это значит лишь, что правило предписывает совершить действие B" 8 .

Надежды, возглавляемые на теорию игр сторонниками школы Неймана-Пирсона, не оправдались; основной причиной, на наш взгляд, является то, что теория игр в принципе не может дать средства для устранения неопределенностей, возникающих в научном познании. Эффективность предлагаемых моделей решения или эффективность действия, выбранного из всех возможных с помощью средств теории игр, в первую очередь сама зависит от того, насколько вероятностное описание состояний природы соответствует реальному положению дел. Полезность любого действия тем больше, чем выше вероятность того события, с которым это действие связано, и эта вероятность должна быть оценена независимо от того, какую полезность желал бы приписать своему действию индивид. Эффективность принятого решения "сталь отвечает принятым требованиям" зависит не от полезности этого решения, а от того, действительно ли данная сталь по своим свойствам близка к свойствам образца. Однако несмотря на столь очевидные соображения в литературе по вопросам математической статистики и теории игр еще до сих пор не изжита иллюзия о возможности разрешить проблемы статистики с помощью теории игр. В качестве примера можно указать на попытки Н. Н. Воробьева поставить знак равенства между понятиями "неопределенность" и "конфликт". "...Если мы имеем дело с принятием решения в условиях нео-

стр. 61


пределейности, т. е. мы не знаем, в каких условиях должны действовать, то это положение можно интерпретировать как конфликт, а именно, как конфликт с нашим собственным незнанием. Практически его часто формулируют как конфликт с природой, скрывающей от нас свои закономерности. Таким образом, говорим ли мы о принятии решения в условиях конфликта или в условиях неопределенности - это с принципиальной точки зрения не так существенно... Фактически теория игр есть теория математических моделей принятия оптимальных решений в условиях неопределенности или конфликта" 9 . Действительно, если согласиться с высказанными соображениями, по которым конфликт и неопределенность есть одно и то же, то придется согласиться и с выводом - игра с природой может решаться такими же методами, как и игра с противником. И если в данное время теория игр еще не может справиться с такими задачами, то это дело будущего. Подобная гиперболизация теории игр неправомерна - принципиальное возражение такой позиции было уже высказано. С более подробной критикой подхода Н. Н. Воробьева можно познакомиться в выступлениях И. Я. Динера и Е. С. Вентцель 10 .

Как мы видим, принципиальное отличие позиции Неймана от приведенной выше заключается в том, что "метод выбора действий" должен быть выведен "из результатов наблюдений, сформулированных в терминах частот" - попадание выборочной характеристики в ту или иную область пространства наблюдений определяет выбор действия. Но как же все-таки решить, какой доверительный интервал или какой уровень значимости должен быть выбран для данного эксперимента, какими правилами при этом пользоваться? Ссылка на практическую цель, которая может "непроизвольно предопределить" выбор или компромисс между истиной и информацией, попытки определить компромисс между практическими намерениями с помощью методов теории игр ни к чему не привели. Очевидны только две возможности.

Первая - признать иллюзией убеждение в том, что исследовательская деятельность осуществляется без применения оценок, в известной мере произвольных. Это значит, что ответственность за выбор уровней значимости возлагается на исследователя: при этом подход Неймана-Пирсона не может указать какого-либо реального основания для такого выбора, обеспечивая, правда, исследователя советом - "пытайся минимизировать сразу обе ошибки".

стр. 62


Вторая - возложить ответственность на всех сразу, приняв систему договоренности в правилах игры, которая определяла бы и уровень значимости. Этот путь и советует выбрать Нейман: признать частотную интерпретацию доверительного интервала и уровня значимости; принять предлагаемое понимание предмета статистики; использовать при проверке гипотез понятия ошибок первого и второго рода; всегда принимать уровни значимости равными 0,10 или 0,05. "В связи со сказанным выше можно спросить: почему следует брать в качестве уровня значимости  = 0,10 или  = 0,05? - пишет Ю. Нейман. - Какова бы ни была практическая задача, если возможно сделать так, чтобы вероятность ошибки первого рода была меньше 0,001, почему следует выбирать процедуру, в которой ошибка первого рода появляется пять или даже десять раз из ста? Ответ заключается в том, что за понижение уровня значимости мы расплачиваемся увеличением вероятности ошибки второго рода" 11 .

Ограничение, вводимое Нейманом в выбор уровня значимости, должно создавать впечатление объективности и беспристрастности процедуры проверки гипотез и, по всей видимости, создает. Во всяком случае, столь, на наш взгляд, искусственная процедура не вызывает сомнений у многих статистиков, и введение ограничения при выборе уровня значимости считается вполне оправданным шагом по облегчению "трудностей", с которыми сталкивается экспериментатор. "Принятый на практике 5%-й или 1%-й уровень теста, внося известный порядок в оценку экспериментальных данных, умеряет остроту противоречивых желаний исследователя", - пишет, например, Н. Н. Дружинин 12 .

"Принятые" уровни значимости, которые рекомендует Н. Н. Дружинин (0,05 или 0,01), как мы видим, отличаются от тех, которые рекомендует Ю. Нейман (0,1 или 0,05). Объяснение этого факта, очевидно, возможно только с позиций "системы игры", предлагаемой описываемым подходом. Практически любая подобная конвенция, рекомендующая для проверки гипотез ту или иную пару уровней значимости, может быть обоснована ссылкой на гармонию ошибок первого и второго рода.

Концепция доверительных интервалов и уровней значимости, предлагаемая Нейманом и Пирсоном, вызывает целый ряд возражений философского и логического характера. Однако с точки зрения выяснения причин появления такой интерпретации в математической статистике, на наш взгляд, удобнее сна-

стр. 63


чала рассмотреть критику ее с позиций статистической школы Р. Фишера.

* * *

Основные возражения, и вполне естественные, вызывает положение теории Неймана- Пирсона о том, что для устранения неопределенностей в выборе уровней значимости исследования должны проводится с практической целью.

По мнению Р. Фишера, концепция, которая сводит труд научного работника только к принятию решения, какое из возможных действий предпринять, не замечает специфики научного поиска. Цель его - пополнить знание природы. Этот процесс протекает, по крайней мере в фундаментальных исследованиях, таким образом, что в его основу редко могут быть положены какие-либо заранее поставленные практические цели - в этот период они еще неизвестны. Лишь тогда, когда результаты научного исследования становятся известными, можно говорить о том, что с помощью нового знания могут быть достигнуты какие-либо практические цели. Можно утверждать, что чем больше становится известно о законах природы, тем большее количество целей может быть достигнуто. Процесс получения нового знания и практическое его освоение, по Фишеру, не совпадают по времени, поэтому принятие решения всегда следует за этапом получения результатов исследований. Именно эти соображения, как считает Р. Фишер, позволяют считать ошибочной интерпретацию теста значимости по аналогии с процедурой принятия решения.

Важные различия между ролью теста значимости в статистике и процедурой принятия решений в теории игр заключаются также в том, что формальное описание процедур принятия решения пригодно для многих случаев, и решение, получаемое с ее помощью, окончательно, тогда как мнение, получаемое с помощью теста значимости, может быть не только подтверждено или опровергнуто, но и пересмотрено. Фишер утверждает, что тест значимости призван помочь соотнести наблюдаемое в эксперименте с некоторыми теоретическими суждениями о сущности изучаемого явления и совсем не устраняет необходимость использования других средств и методов.

Фишер и его сторонники настаивают на сохранении терминов "индуктивный вывод", "индуктивное рассуждение" для обо-

стр. 64


значения сущности того процесса получения звания, который охватывается методами и приемами математической статистики. Кроме того, указывается на ту огромную роль, которую играет в процессе вывода личность самого ученого, работа его воображения, интуиции. В трактовке теста значимости Нейманом и Пирсоном Фишер совершенно справедливо увидел попытку нивелировать эти важные компоненты исследовательской деятельности ученого. В самом деле, процедура проверки гипотез в подобной интерпретации весьма проста - критическая зона определена и необходимо только наблюдать попадание или непопадание выборочной характеристики в эту зону. "Концепция, по которой научный работник может рассматривать себя как инертного регистратора, работающего согласно принятым правилам, - пишет Р. Фишер, - отвлекает внимание от его прямого долга - формировать правильные научные выводы, суммировать их, сообщать их своим коллегам и предлагает ему другую обязанность - механически совершать последовательность автоматических "решений", выводимых из весьма неполной математики теории решений. Даже если эта теория в своем дальнейшем развитии сумеет преодолеть различия между тестом значимости в естественных науках и политикой или стратегией в теории игр и опровержением в качественном контроле, останется все же истинным то, что естественные науки смогут успешно развиваться лишь благодаря ответственным и независимым мыслителям, применяющих свой ум и воображение к тщательной интерпретации полученных наблюдений" 13 . Всегда ли ученый в своей работе по проверке гипотез использует один и тот же уровень значимости, раз и навсегда заданный, как это следует из позиции Неймана и Пирсона? Сторонники подхода, связанного с именем Фишера, утверждают, что это неверно. Рассматривать уровень значимости как частоту в сериях бесконечно повторяемых тестов значимости, которые никогда не имеют места - позиция "нереалистичная", способная только отвлечь ученого от выполнения его главной задачи - "взвешивать актуально полученную посредством наблюдений очевидность" и делать вывод о правильности рассматриваемого теоретического положения. "...Фактически, - пишет Р. Фишер, - ни один научный работник не имеет фиксированный уровень значимости, на котором из года в год и в любых условиях он отвергает гипотезы: скорее всего он обращается к своему уму, в каждом конкретном случае ориентируясь на имеющуюся очевидность и свои идеи" 14 .

стр. 65


Отвечая на вопрос о причинах появления столь нереалистичной позиции Неймана- Пирсона, сторонники школы Фишера указывают на несостоятельность попыток измерять частотой, наблюдаемой в повторяемых выборках из одной и той же популяции, силу очевидности, приводимой в пользу выбора той или иной гипотезы, и как следствие такой позиции, на несостоятельность попыток распространить на все формы неопределенностного вывода действие законов математической теории вероятностей. Одним из типов такого неопределенностного вывода, на который не распространяются законы вероятностного формализма, является, по их мнению, тест значимости.

Важно отметить то, что с позиций подхода Р. Фишера существенно ограничивается та роль, которую играет математическая теория вероятностей в структуре математической статистики. Место теории вероятностей в статистике определяется здесь наличием в схеме статистического исследования дедуктивных выводов, относящихся к выборкам и основывающихся на допущении о существовании генеральных совокупностей, из которых эти выборки взяты. Другими словами, если известна форма и параметры генеральной совокупности, то дедуктивным путем с использованием законов вероятности могут быть получены следствия, формулирующие предсказание о параметрах выборки, которая будет произведена из данной совокупности.

Что касается выводов обратного характера - от выборки к генеральной совокупности, то с рассматриваемой точки зрения они не могут быть выражены на основе математической теории в терминах вероятностей. Подобные выводы могут быть построены на основе неизвестного ранее понятия вероятности, названного "доверительная вероятность", фактически не имеющего свойств математической вероятности. "Как теперь установлено, - утверждает Р. Фишер, - математическая концепция вероятности не дает чувства уверенности или неуверенности в таких индуктивных выводах, и математическая величина, пригодная в данном случае для обоснованного выбора из всех возможных и различных генеральных совокупностей той, которая соответствует имеющейся выборке, фактически не имеет свойств вероятности" 15 .

По мнению Фишера, математическая вероятность имеет для статистика такой же практический интерес, как и для игрока, который заключает пари на появление 1 при одном бросании игральной кости. Для этого человека, информация, дающаяся

стр. 66


утверждением - "если а единиц выпало в n испытаниях, то вероятность того, что разность в абсолютном значении между a/n и 1/6 превысит значение  , как бы мало оно не было, стремится к О с бесконечным возрастанием и" - не только чрезвычайно мала, но и весьма неопределенна относительно ее применения к единичному бросанию, которым он интересуется. Указанное утверждение, действительно, ничего не говорит о таком бросании. Более того, Фишер утверждает, что никакое отношение a/n не может быть взято в качестве вероятности для предсказания выпадения единицы в одном бросании кости, поскольку признается, что любое подмножество бросаний, содержащее интересующее игрока событие, даст значение a/n либо больше, либо меньше предельного значения для всей совокупности бросаний кости, которое в данном случае равно 1/6. До тех пор, пока неизвестно предельное значение, никакое предсказание в терминах вероятности относительно единичного события не может быть сделано. "Это, - указывает Р. Фишер, - необходимое и достаточное условие для применения наблюдаемого отношения для всего множества различных будущих бросаний в качестве вероятности к предсказанию результата особого единичного бросания. Только при этом условии мы можем думать об единичном бросании или последовательности бросаний как о случайной выборке из множества, которое является в этом смысле субъективно гомогенным, поскольку в нем мы не можем выделить какие-либо стратификации" 16 .

Применимость к предсказанию индивидуальных событий математической вероятности лишь в том случае, когда известно предельное отношение, Фишер называет фундаментальным условием. Поскольку признается, что вероятностное утверждение, будучи строгим по форме, имеет меньше "фактуального" содержания, чем утверждение об имеющем место факте, и имеет больше "фактуального" содержания, чем утверждение о полном незнании, то знание предельного отношения играет роль "объективного знания" в подобном вероятностном утверждении. "Необходимое знание для такого утверждения, - пишет Фишер, - относится к хорошо определенному агрегату или популяции возможностей, внутри которой предельная частота должна быть известна точно. Необходимое незнание определяется нашей неспособностью выделить различные подмножества, имеющие, как это есть и на самом деле, разные предельные частоты" 17 .

стр. 67


В выводах обратного характера уже сама постановка задачи исключает использование законов математической теории вероятностей, и математические величины, используемые в таких ситуациях, такие, как "доверительная вероятность" и "правдоподобие", не могут иметь свойств вероятности. Таким образом, отношение концепции Фишера к использованию теории вероятностей в математической статистике характеризуется так: "...Я не в состоянии принять какую-либо философию, в которой вероятность, субъективна она или нет, может быть объединена с любым высказыванием неопределенности. После продолжительного рассмотрения различных схем, я был вынужден принять заключение, что они неправильно отражают истинную сложность индуктивного вывода, представляя субстанцию со многими измерениями при помощи тени с одним измерением... Единственное понятие вероятности, которое я нахожу приемлемым, есть частотное понятие, включающее случайный выбор из определенной популяции... Я только тогда готов применять вероятность к описанию ситуации, если имеется аналогия между ситуацией и понятием случайного выбора из определенной популяции. Вероятность сама по себе является только моделью, приемлемой лишь тогда, когда применяется к событиям и не является таковой, когда применяется к статистическим гипотезам" 18 .

Высказывания Эдвардса довольно ясно характеризуют взгляд статистической школы Фишера, к сторонникам которой Эдварде с полным правом себя относит, на роль математической теории вероятностей в математической статистике. Но не только этим определяется ценность приводимой здесь цитаты. Эдварде, указывая вслед за Фишером на ограниченность частотного понимания вероятности, с помощью которого невозможно выразить все виды неопределенностей, возникающих в задачах математической статистики, определенно высказывает то, что у Фишера, например, мы не найдем, но что имплицитно содержится в его концепции. Речь идет о том, что право на свойства вероятности, определяемые законами математической теории, признается только за понятием частоты: "Единственное понятие вероятности ... есть частотное понятие"; нет никакого другого понятия, кроме частоты, применение которого влекло бы использование законов математической вероятности. Это обстоятельство играет важную роль для понимания отношения сторонников школы Фишера к попыткам рассматривать проблемы статистики с позиций субъективного подхода, а также объясняет тот факт, что

стр. 68


за такими величинами как "степень уверенности" и "правдоподобие", которыми оперирует статистика Фишера, не признается право обладать свойствами вероятности.

Итак, подход Фишера отвергает интерпретацию теста значимости и доверительных интервалов с помощью понятия частоты как методологически неправильную позицию, приводящую в конце концов к неправильной трактовке рассматриваемых процедур, "теряющей их существенную природу", сводящей науку к процедуре принятия решений, принижающей роль ученого в процессе "индуктивного вывода". Фишер называет "неясной" и "явно ошибочной" попытку рассматривать тест значимости как один из серии подобных тестов, применимых к последовательности подобных тел данных, поскольку на ней основывается интерпретация уровня значимости как частоты, с которой экспериментатор совершает ошибочный выбор из двух или более гипотез в длинной серии таких решений. Интерпретация, даваемая Фишером, требует рассматривать тест значимости как процедуру, применяемую к определенной, особой, единичной гипотезе с уникальными данными наблюдений. В этом случае уровень значимости и доверительный интервал не ведут к каким-либо вероятностным утверждениям о реальном мире, а определяют лишь те границы, в пределах которых исследователь готов либо принять, либо отбросить испытуемую гипотезу. Природа уровня значимости здесь определяется уже не частотой, а "интеллектуальным нежеланием" принять испытуемую гипотезу при попадании выборочной характеристики в критическую зону при данном "состоянии ума". Количественное определение уровня значимости, утверждает Р. Фишер, играет роль меры тех оснований, которые вызывают определенные сомнения в правильности рассматриваемой гипотезы. Естественно, что подобные сомнения по своей интенсивности будут различными для различных гипотез, и это выразится в различии уровней значимости при их проверке. Однако в объяснении сущности тех оснований, которые вызывают сомнения в правильности выдвинутой гипотезы, Р. Фишер не идет дальше либо признания "психологической" природы указанных сомнений, либо редких и туманных намеков на состояние ума или идеи, которыми руководствуется исследователь при проверке своих предположений. "Хотя и признается, что в основе нежелания или сопротивления принять данное высказывание лежит психологическая природа, чувства эти, выраженные с помощью теста значимос-

стр. 69


ти, имеют объективную основу в том, что они являются фактом, воспринимаемым и проверяемым другими рациональными умами. Уровень значимости в таких случаях, - утверждает Фишер, - играет роль рациональной меры оснований для недоверия, которое ими вызывается. Это просто и элементарно и не требует оправдывать какое-либо точное вероятностное утверждение по поводу рассматриваемого высказывания" 19 . Понимание Фишером доверительной вероятности и уровня значимости как рациональной меры в одном случае "психологической уверенности" в том, что выдвинутая гипотеза верна, а в другом как меры "психологического сопротивления", которое ощущается исследователем по отношению к принятию выдвинутого предположения дает сторонникам субъективного подхода возможность говорить об определенной консолидации взглядов в понимании и использовании вероятности в статистике. И все-же "психологическая уверенность" или "сопротивление" обеспечивают довольно зыбкое основание, исходя из которого исследователь каждый раз должен приписывать количественно определенный уровень значимости или доверительную вероятность. Возникает трудность и в объяснении того, почему чувства "уверенности" или "сопротивления" должны меняться от одной гипотезы к другой. И, наконец, подходу Фишера могут быть совершенно справедливо предъявлены претензии по поводу того, что в конкретном понимании теста значимости и доверительного интервала он не реализует те установки, которые высказываются в качестве аргументов против понимания данных процедур в рамках школы Неймана-Пирсона. В частности, требования рассматривать тест значимости в широком контексте исследовательской деятельности ученого, включая воображение и интуицию, "состояние ума", выбор уровня значимости с учетом имеющейся очевидности и идей в реальном воплощении предстают в концепции Фишера в виде не требующих обоснования чувств "уверенности" и "нежелания". Столь непоследовательная позиция порождает солидную брешь в обосновании фишеровской концепции теста значимости, вынуждает использовать в полемике аргументацию, не относящуюся к существу обсуждаемой проблемы. Так, например, Дж. Барнард, сторонник концепции Фишера, вынужден привлекать для обоснования своей позиции термин "акт воли". По его мнению, не все исследователи следуют требованиям, предъявляемым той или иной концепцией доверительных интервалов и тестов значимо-

стр. 70


сти, и что в конечном итоге выбор одной из концепций "произволен, то есть зависит от акта воли" 20 .

Непоследовательность, выявляемая в подходе Р. Фишера к интерпретации рассматриваемых статистических процедур, имеет свои причины, которые в дальнейшем мы попытаемся понять. Здесь же следует указать на то, что данная особенность концепции Фишера зачастую приводит к непониманию различий в "логике" двух подходов. Так, например. Н. К. Дружинин в "Логике оценки статистических гипотез" находит, что различия в интерпретациях тестов значимости и доверительных интервалов вытекает из того, что одна концепция (Неймана-Пирсона) относит рассматриваемые процедуры к выборочному статистическому наблюдению, а другая (Фишера) - "к экспериментальной работе, а не к выборочному статистическому наблюдению в собственном смысле этого слова". "При экспериментальной работе, как правило, - рассуждает он далее, - в действительности не существует генеральной совокупности, из которой производится выборка" 21 .

Если же вспомним, что в основе применения статистических процедур лежит понятие генеральной совокупности, является ли это совокупностью всех возможных или мыслимых исходов эксперимента, повторяемого в одних и тех же условиях, или речь идет о популяции определенного вида животных, что позволяет судить о реальном существовании рассматриваемой совокупности, тогда проведение и признание каких-либо различий между двумя подходами с приводимой точки зрения теряет всякий смысл. Именно это в конце концов, и вынужден признать автор "Логики ...": "Однако, нам представляется, что нет оснований для проведения такой разграничительной черты между ними... К этому надо добавить, что практические результаты, получаемые как при применении теста существенности, так и при установлении доверительных интервалов, обычно сходятся" 22 . Такой вывод, исходя из того, что мы уже знаем о существе двух концепций, принять невозможно. Различия между ними сохраняются, и прежде всего в трактовке уровня значимости и доверительной вероятности. Если в теории Неймана- Пирсона эти величины, исходя из представления о вероятности как частоте, объявляются функцией бесконечно повторяемых выборок из данной совокупности или популяции и определяются предельным значением со всеми вытекающими из такого предположения следствиями, то подход Фишера, как мы видели, требует

стр. 71


признания их уникальности для каждой ситуации испытания гипотезы, и определяются они как рациональные меры чувств уверенности и нежелания, испытываемых статистиком по отношению к рассматриваемой гипотезе. Фиксируемое различие не является формальным - содержательно оно опирается на различные представления о роли и месте частотной концепции вероятности в статистике и применимости математической теории к процессам испытания гипотез, и проявляется в том, что практические результаты, получаемые при использовании двух подходов, вопреки утверждениям Н. К. Дружинина, обычно не сходятся. К такому выводу можно прийти уже исходя из того, что подход Фишера требует "анализа чувств" каждый раз при испытании гипотезы и лишь случайным совпадением объясняется приписывание одинаковых уровней значимости различным гипотезам, в то время как другой подход навязывает использование конвенционально определенных численных значений требуемых величин. Одно это дает слишком слабую надежду на то, что в условиях одного эксперимента два испытателя, принадлежащие различным школам, припишут испытуемой гипотезе одинаковые уровни значимости. Факт различий в результатах исследований, получаемых в рамках разных подходов, широко признан статистической литературой. Р. Фишер, например, дает анализ некоторых случаев таких расхождений, и делает следующий вывод: "Примеры, - пишет он, - данные в предшествующих разделах, о числовых расхождениях, возникающих при строгой формулировке правила, которое при первом знакомстве с ним навязывает вполне естественно мысль о применимости его ко всем тестам значимости, представляет только один аспект несогласия с точкой зрения, по которой тест значимости интерпретируется по аналогии с принятием решения. На самом деле, не только численно ошибочные выводы, серьезные сами по себе, удерживают от некритического принятия такой аналогии" 23 .

* * *

Приверженцы теории субъективных вероятностей едины в понимании требований, предъявляемых этой теорией к множеству оценок вероятностей - подчинение их аксиомам теории вероятностей и измерение оценок при получении дополнительной информации. Процедура пересмотра первоначальных мнений описывается теоремой Бейеса. Сторонников применения этой

стр. 72


теоремы для проверки статистических гипотез в рамках математической статистики часто поэтому называют бейезианцами (необейезианцы).

"Существует несколько типов бейезианцев, - пишет по этому поводу Гуд, - но мне кажется, что существенной определяющей чертой бейезианца является то, что он считает разумным говорить о вероятности P (H/E) гипотезы H при данной очевидности Е. Следовательно, он будет чаще использовать теорему Бейеса, чем не бейезианец" 24 . Сосредоточим внимание на некоторых основных моментах данной процедуры.

Во-первых, предполагается существование определенного множества гипотез, уместных для рассматриваемого случая. В нашем примере с металлургическим заводом их две: "сталь кондиционна" (нулевая гипотеза) и "сталь некондиционна" (альтернативная гипотеза).

Во-вторых, использование теоремы предполагает существование первоначального (априорного) вероятностного распределения для рассматриваемых гипотез. Мы пока отвлекаемся от вопроса о характере вероятностей и способов получения их количественной оценки.

В-третьих, распределение первоначальных оценок вероятностей гипотез должно быть нормировано, т. е. отвечать требованиям математических аксиом. В нашем примере сумма вероятностей нулевой и альтернативной гипотез должна быть равна 1.

В-четвертых, пересмотр оценки вероятности одной из гипотез для того, чтобы учесть вновь полученную информацию, с необходимостью влечет пересмотр всего множества распределения вероятностей. В результате, мы получаем апостериорное распределение вероятностей гипотез, отвечающее требованиям аксиом.

В-пятых, предпочтение оказывается той гипотезе, апостериорная вероятность которой является самой высокой.

Доверительный интервал и тест значимости строится только для одной гипотезы, причем предполагается, что опровержение этой гипотезы автоматически приводит к решению принять ее альтернативу. Почему мы выбираем именно данную гипотезу, а не другую из всех возможных? Эксплицитного ответа на этот вопрос мы не получаем, хотя, по- видимому, речь должна идти о том, что исследователь рассматривает проверяемую гипотезу наиболее вероятной. Так или иначе, но интервальный подход предполагает какую-то предварительную "дискриминацию" гипотез до

стр. 73


проверки, однако мы не имеем каких-либо явных указаний на критерии, согласно которым такое различение может и должно быть проведено.

Мы уже указывали на различия подходов Неймана-Пирсона и Р. Фишера в понимании того, что представляет собой уровень значимости и доверительная вероятность. Как мы видели, согласно первому подходу тест значимости интерпретируется как решающий алгоритм: попадание выборочной характеристики в критическую зону обязывает принять нас определенное действие - практическое решение зависит здесь от опытных данных, а опытным данным "позволяется" влиять на наше решение в рамках, которые предписываются практической целью. В фишеровском понимании мы встречаемся, отвлекаясь от различий в детерминации уровня значимости и доверительной вероятности, с такой же ситуацией - гипотезу мы либо обязаны принять, либо опровергнуть. Если испытуемая гипотеза опровергается или принимается, то это еще не дает нам право говорить о том, как изменилась степень ее подтверждения, справедлива она или нет: все, что может быть сказано, сводится к утверждению о том, что гипотеза данным опытом подтверждена или опровергнута. Если гипотеза опровергнута, то почему мы должны принять альтернативную гипотезу, а не вернуться к рассмотрению множества гипотез, уместных для данного случая, с учетом полученной информации? Ответа мы не получим.

Процедура интервальной проверки гипотез встречается с серьезными трудностями и в том случае, когда необходимо построить общее утверждение или принять решение для двух и более проверок одной и той же гипотезы. Как должен поступить исследователь, если из пяти проверок три подтвердили гипотезу, а две опровергли? И на этот вопрос мы не получим ответа.

Использование процедуры Бейеса устраняет эти трудности. Новая информация учитывается при пересчете вероятностей рассматриваемых гипотез. Мы всегда можем указать на гипотезу, вероятность которой оказывается больше, чем у других. Простота применения теоремы Бейеса для проверки гипотез является тем фактором, который обусловливает повышенный интерес к ней среди статистиков. Так, Н. Винер, говоря о возможностях расширения существующих методов обработки выборочного материала, пишет: "Это связано со всеми сложностями применения закона Бейеса либо тех терминологических ухищрений теории правдоподобия (см. работы Р. А. Фишера и Дж. Нейма-

стр. 74


на), которые, на первый взгляд, устраняют необходимость в применении закона Бейеса, но в действительности лишь перелагают ответственность за его применение на статистика- практика или на лицо, использующее в конце концов результаты, полученные статистиком-практиком. Тем временем статистик-теоретик может вполне честно утверждать, что все сказанное им является совершенно строгим и безупречным" 25 .

Использование теоремы Бейеса в статистике предполагает признание за вероятностью гипотез свойств математической вероятности - другими словами, вероятность гипотезы подчиняется математическим законам исчисления вероятностей. Такая позиция противоречит подходу Р. Фишера, в рамках которого за вероятностями гипотез в выводах обратного характера таких свойств не признается. Поэтому в современной литературе, посвященной обсуждению проблемы применения теоремы Бейеса, встречаются указания на неправомерность введения фактора нормализации, ответственного за упорядочивание множества рассматриваемых гипотез. Так, например, сторонник концепции Р. Фишера Дж. Барнард отрицает правомерность применения этого принципа. В качестве общего довода для обоснования такой позиции выдвигается утверждение о том, что фактор нормализации (согласованности, когерентности) может быть применен лишь тогда, когда приняты во внимание все возможные объяснения исследуемой ситуации. Другими словами, требование, чтобы сумма вероятностей рассматриваемых гипотез была равна единице, справедливо только тогда, когда исследователь в состоянии указать на все возможные гипотезы, уместные в данном случае. Однако существование такой возможности полностью отрицается. "Я думаю, - указывает Дж. Барнард, - что мы никогда не сможем указать на все возможные альтернативы. Мы всегда оставляем вопрос об этом открытым и предполагаем, что кто-то с большим воображением или с большим знанием или с большей информацией может пойти дальше и предложить такое объяснение, о существовании которого мы не могли и подозревать. Если это так, то мы всегда должны учитывать возможность расширения множества рассматриваемых нами гипотез, и поскольку мы вынуждены поступать таким образом, фактор нормализации вероятностей теряет свою силу" 26 .

Подобные возражения возвращают к обсуждению правомерности использования законов математической теории к множеству доверий, которым, как утверждается, обладает каждый

стр. 75


субъект. Имеет ли какой-либо смысл соблюдение этого требования? На наш взгляд, целесообразность введения требования "рациональности", предъявляемого к мнениям субъекта, заключающегося в соблюдении законов логики, в том числе и вероятностной, вряд ли может вызывать сомнения.

В рамках бейесовской модели вывода оказалось возможным сформулировать реальный подход к формальному описанию процедуры принятия решения, принимающий во внимание информацию о внешнем мире и цель, которую ставит перед собой человек, принимающий решение. Так, Л. Сэведж 27 при построении теории принятия решений исходит из представления о "рациональном" человеке, который принимает решения, учитывая существование вероятностного распределения, подчиняющегося требованию нормализации (когерентности), по отношению к различным гипотезам, описывающим состояние дел в мире, и полезностную функцию, описывающую полезность каждого решения предпринять то или иное действие при принятии соответствующей гипотезы. Рациональный человек, по мнению Сэведжа, поступает так, чтобы максимизировать ожидаемую полезность.

Если, например, рассматриваются две альтернативы H 1 и H 2, то подход Сэвиджа может быть проиллюстрирован следующим образом: каждой альтернативе приписывается положительное число p 1 и p 2 , в сумме, согласно требованию когерентности равные единице (p 1 + p 2 = 1), выражающие данную неопределенную ситуацию, поскольку принимающий решение не знает, какая из двух альтернатив истинна (если известно, какая из альтернатив истинна, определение наилучшего решения будет выражаться просто из учета полезностей, связанных с тем или иным действием). В распоряжении субъекта имеются два действия, в 1 и в 2 , каждое из которых выбирается в том случае, если ожидаемая полезность одного из них будет больше полезности другого. Другими словами, каждому действию в 1 приписывается полезность U 1j , когда альтернатива H j рассматривается наиболее вероятной. Принимающий решение выберет действие в 1 в том случае, если U 11 p 1 + U 21 p 2 будет превышать полезность в 2 , т. е. U 21 p 1 + U 22 p 2 . Если субъект руководствуется другой целью при таком же знании ситуации, его вероятностное распределение останется неизменным, в то время как полезности, приписываемые различным действиям, могут измениться. С другой стороны, если цель не меняется, но принимающий решение считает необходимым уточ-

стр. 76


нить свое знание ситуации посредством проведения эксперимента [вынужден "купить информацию" для уменьшения риска ошибиться], то вероятности альтернатив изменятся и будут получены по теореме Бейеса посредством умножения первоначальных вероятностей на правдоподобия полученного результата. Первоначальные вероятности каждой гипотезы Сэведж называет персональными вероятностями, которые могут быть измерены путем предложения субъекту пари, что позволяет посредством подбора отношения ставок определить вероятности, которые приписывает субъект различным гипотезам с точки зрения имеющегося у него знания.

Принцип, положенный в основу теории решения, как мы видим, состоит в том, что эффективность (полезность) любого действия связывается прежде всего с тем, насколько информация принимающего решение соответствует реальному положению дел. В этом главное преимущество подхода Сэведжа перед попыткой Неймана построить теорию принятия решений, в которой вероятность зависела бы от полезности принимаемого действия.

Сегодня за необейесовским подходом при рассмотрении проблем статистического вывода стоит огромная литература. К числу авторов относятся такие видные статистики как Б. Де Финетти, Л. Сэведж, И. Сэведж, И. Гуд и целый ряд других ученых. За идеями субъективной теории признается право на применение в статистике. В качестве основания для правомерности существования такого подхода выдвигается соображение, указывающее на полезность рассмотрения различных проблем с точки зрения альтернативных подходов, в результате чего наука лишь выигрывает. "Я уверен, - пишет, например, Е. Пирсон, - что показ того, как одна и та же ситуация решается альтернативными подходами, дает всему предмету обсуждения такое богатство, которое, наверное, не имело бы место в том случае, если бы одна из линий решения дискредитировала другую, заявляя, что она следует ошибочным путем" 28 .

Наличие различных подходов к проверке статистических гипотез, как мы видели, основывается на различиях в понимании вероятности. Это создает огромные трудности для тех, кто использует статистические приемы в своей деятельности и порождает вполне законную тревогу в справедливости результатов, полученных с помощью тех методов, которые рекомендуются статистиками-теоретиками. Так, например, представитель попу-

стр. 77


ляционной генетики А. В. Эдвардс, обосновывая обращение к фундаментальным вопросам статистики, замечает, что статистик-практик оказался сегодня в положении человека, который вынужден строить дом в местности, где взгляду открывается лишь один песок. Как выбрать место для строительства? "Обращаясь к геологическим картам района (составленным профессиональными статистиками), - пишет он, - этот человек обнаруживает, что сведения, почерпнутые из них, противоречат друг другу. И все же, остро нуждаясь в кровле над своей головой, он решается строить, выбирая место с помощью интуиции и надежды, сознавая, что эксперимент может заставить его строиться в другом месте и, может быть, к тому времени он получит такую геологическую карту, которой можно доверять. Лишь спустя некоторое время, когда постройка докажет свою жизненность, он может почувствовать достаточно уверенности для того, чтобы пригласить других строиться рядом" 29 .

Сам Эдварде в конечном итоге использует и рекомендует другим методы, развиваемые в рамках подхода Р. Фишера, основанные на утверждении об ограниченных возможностях частотного понимания вероятности. Эдварде не может принять и те предложения, которые выдвигаются сторонниками необейесовского направления, поскольку это требует признания роли "степени доверия" в статистических выводах. "И хотя довольно убедительно показано, - пишет он далее, - что абсолютная мера доверия для того, чтобы быть когерентной, должна удовлетворять законам вероятности, это не является аргументом в пользу существования в статистике какой-либо абсолютной меры. Новая теория, по моему мнению, должна быть отброшена, как и ее предшественница" 30 .

Камнем преткновения для развиваемых различными направлениями процедур оказался вопрос о том, чем может быть обоснована та или иная количественная оценка уровня значимости и доверительной вероятности в одном случае и первоначальных вероятностей в схеме Бейеса, в другом. Обоснование конвенционально определяемых уровней значимости в подходе Неймана-Пирсона ссылкой на гармонию ошибок первого и второго рода, на наш взгляд, нельзя признать удовлетворительным. В этом пункте мы приблизились к вопросу о понимании знания "априори", его функции в процессе выдвижения и проверки статистических гипотез.

Общим методологическим недостатком подходов Неймана-Пирсона и Фишера является стремление избавиться от какого-

стр. 78


то ни было знания "априори"; попытки обосновать возможность получения ценного вывода из одних только опытных данных. Однако, как показывает история науки, подобного рода попытки с самого начала обречены на провал и могут рассматриваться как рецидив эмпиризма, не способного рационально объяснить процесс получения "ценных выводов" в научном познании. Но ведь процесс построения тестов значимости и доверительных интервалов требует принятия определенных предположений относительно природы исследуемого параметра, почему именно такая количественная оценка этого параметра приписана проверяемой гипотезе, почему мы должны принять тот или иной уровень значимости или доверительную вероятность, согласно которым мы будем судить о справедливости проверяемой гипотезы. Обоснование этих предположений может быть получено лишь благодаря анализу первоначального знания, с точки зрения которого мы выдвигаем данную гипотезу. "Принятие или непринятие всех этих предположений, естественно, требует глубокого содержательного анализа не только исследуемых нами фактов, но и даже гораздо более широкого их класса, - пишут по этому поводу С. П. Будбаева и Б. Н. Пятницын. - Действительно, установить, какой случайной величиной, а следовательно, каким распределением может быть описана та или иная ситуация, какой доверительный уровень в том или ином случае лучше принять, - всего этого невозможно вывести из исследуемых нами в данном конкретном случае фактов без того, чтобы не впасть в самый явный порочный круг. В этом смысле, выше указанные предположения по отношению к нашим конкретным исследованиям будут, действительно, как бы априорными" 31 .

Таким образом, анализ первоначального знания необходим при построении интервалов доверия и теста значимости, и с этого момента центральным вопросом становится вопрос о том, как могут быть получены количественные оценки уровня значимости и доверительные вероятности.

Проверка статистических гипотез в рамках теории субъективных вероятностей описывается довольно простыми правилами: исследователь должен задать первоначальную вероятностную оценку, выражающую степень обоснованности рассматриваемой гипотезы принятой во внимание первоначальной информацией; эта оценка трансформируется в апостериорную вероятность при получении любой добавочной информации; при необходимости принять решение, какой гипотезы

стр. 79


придерживаться, статистик использует правило выбора, согласно которому следует придерживаться той из них, апостериорная вероятность которой оказывается наиболее высокой. "Используя апостериорную вероятность, - пишет по этому поводу В. В. Налимов, - мы принимаем решения, основываясь на некоторой смеси из новых знаний и прошлого знания или незнания, т. е. поступаем так, как человек в своей повседневной деятельности" 32 .

* * *

Обзор дискуссии по проблеме испытания статистических гипотез показывает, что теория субъективных вероятностей не есть просто "мода", как утверждает процитированный в начале данной статьи Г. Кайберг. Речь идет о реальной эпистемологической ситуации, возникшей в рамках математической статистики, в разрешении которой эта теория имеет преимущества. С философской точки зрения главное достоинство данного подхода заключается в попытке преодолеть явный эмпиризм, свойственный школам Неймана- Пирсона и Р. Фишера, благодаря стремлению привлечь к процедуре оценки вероятности гипотезы, ее достоверности более полную информацию - не только эмпирического, но и теоретического характера.

Рамки статьи не позволяют проанализировать аргументацию Г. Кайберга в пользу "моды", "ловушки", "заблуждения" - термины, которыми он характеризует субъективный подход. Но это - дело будущего.

-----

1 Kyberg H. Epistemology and inference. Minneapolis. University of Minnesota Press, 1983. P. 79 - 80.

2 Фишер Р. Статистические методы для исследователей. М., 1958. С. 16.

3 Нейман Ю. Вводный курс теории вероятностей и математической статистики. М., 1968. С. 340.

4 Шанявский К. // Вопросы философии. 1969. N 3. С. 58.

5 Дружинин Н. К. Логика оценки статистических гипотез. М., 1973. С. 41.

6 Шанявский К. // Указ. соч. С. 58 - 59.

7 Нейман Ю. Вводный курс теории вероятностей и математической статистики. М., 1968. С. 12.

8 Там же. С. 333.

9 Исследование операций. М., 1972. С. 92. См. также: Воробьев Н. Н. Теория игр // Философская энциклопедия. Т. 5. С. 208.

стр. 80


10 Исследование операций. М., 1972. С. 98 - 111.

11 Нейман Ю. Вводный курс... С. 17.

12 Дружинин Н. Н. Логика оценки статистических гипотез. С. 40.

13 Fischer P. Statistical Methods and Scientific Inference. L., 1959. P. 100.

14 Ibid. P. 42.

15 Фишер Р. Статистические методы для исследователей. М., 1958. С. 17.

16 Fischer P. Statistical Methods and Scientific Inference. P. 32 - 33.

17 Ibid. P. 33.

18 Edwards A. W. Likelihood. Cambridge. At the University press, 1972. P. XV.

19 Fischer P. Statistical Methods... P. 43.

20 Barnard G.A. The Use of the Likelihood function in Statistical Practice // Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability: University of California Press, 1967. T. 1. P. 34.

21 Дружинин Н. К. Логика оценки статистических гипотез. С. 45.

22 Там же. С. 46.

23 Fischer P. Statistical Methods... P. 99.

24 Good H. The Estimation of Probabilities. Cambridge. Massachusetts, 1965. P. 8.

25 Винер Н. Кибернетика. М., 1968. C. 155.

26 Savage L. and other contributors. The Foundations of Statistical Inference. Methuen, 1962. P. 80.

27 Savage L. The Foundations of Statistics. New York, 1954.

28 Savage L.A. and other contributors. The Foundations of Statistical Inference. Methuen. 1962. P. 54.

29 Edwards A. W. Likelihood. Cambridge, 1972. P. XI.

30 Ibid. P. 3.

31 Логика и эмпирическое познание. М., 1972. С. 145.

32 Налимов В. В. Теория эксперимента. М., 1971. С. 43.


© libmonster.ru

Постоянный адрес данной публикации:

https://libmonster.ru/m/articles/view/ЭПИСТЕМОЛОГИЯ-И-СУБЪЕКТИВНАЯ-ВЕРОЯТНОСТЬ

Похожие публикации: LРоссия LWorld Y G


Публикатор:

Tatiana SvechinaКонтакты и другие материалы (статьи, фото, файлы и пр.)

Официальная страница автора на Либмонстре: https://libmonster.ru/Svechina

Искать материалы публикатора в системах: Либмонстр (весь мир)GoogleYandex

Постоянная ссылка для научных работ (для цитирования):

В. В. ПИРОЖКОВ, ЭПИСТЕМОЛОГИЯ И СУБЪЕКТИВНАЯ ВЕРОЯТНОСТЬ // Москва: Либмонстр Россия (LIBMONSTER.RU). Дата обновления: 10.09.2015. URL: https://libmonster.ru/m/articles/view/ЭПИСТЕМОЛОГИЯ-И-СУБЪЕКТИВНАЯ-ВЕРОЯТНОСТЬ (дата обращения: 29.03.2024).

Автор(ы) публикации - В. В. ПИРОЖКОВ:

В. В. ПИРОЖКОВ → другие работы, поиск: Либмонстр - РоссияЛибмонстр - мирGoogleYandex

Комментарии:



Рецензии авторов-профессионалов
Сортировка: 
Показывать по: 
 
  • Комментариев пока нет
Похожие темы
Публикатор
Tatiana Svechina
Yamal, Россия
1467 просмотров рейтинг
10.09.2015 (3123 дней(я) назад)
0 подписчиков
Рейтинг
0 голос(а,ов)
Похожие статьи
ЛЕТОПИСЬ РОССИЙСКО-ТУРЕЦКИХ ОТНОШЕНИЙ
Каталог: Политология 
11 часов(а) назад · от Zakhar Prilepin
Стихи, находки, древние поделки
Каталог: Разное 
ЦИТАТИ З ВОСЬМИКНИЖЖЯ В РАННІХ ДАВНЬОРУСЬКИХ ЛІТОПИСАХ, АБО ЯК ЗМІНЮЄТЬСЯ СМИСЛ ІСТОРИЧНИХ ПОВІДОМЛЕНЬ
Каталог: История 
3 дней(я) назад · от Zakhar Prilepin
Туристы едут, жилье дорожает, Солнце - бесплатное
Каталог: Экономика 
4 дней(я) назад · от Россия Онлайн
ТУРЦИЯ: МАРАФОН НА ПУТИ В ЕВРОПУ
Каталог: Политология 
5 дней(я) назад · от Zakhar Prilepin
ТУРЕЦКИЙ ТЕАТР И РУССКОЕ ТЕАТРАЛЬНОЕ ИСКУССТВО
7 дней(я) назад · от Zakhar Prilepin
Произведём расчёт виртуального нейтронного астрономического объекта значением размера 〖1m〗^3. Найдём скрытые сущности частиц, энергии и массы. Найдём квантовые значения нейтронного ядра. Найдём энергию удержания нейтрона в этом объекте, которая является энергией удержания нейтронных ядер, астрономических объектов. Рассмотрим физику распада нейтронного ядра. Уточним образование зоны распада ядра и зоны синтеза ядра. Каким образом эти зоны регулируют скорость излучения нейтронов из ядра. Как образуется материя ядра элементов, которая является своеобразной “шубой” любого астрономического объекта. Эта материя является видимой частью Вселенной.
Каталог: Физика 
8 дней(я) назад · от Владимир Груздов
Стихи, находки, артефакты
Каталог: Разное 
8 дней(я) назад · от Денис Николайчиков
ГОД КИНО В РОССИЙСКО-ЯПОНСКИХ ОТНОШЕНИЯХ
8 дней(я) назад · от Вадим Казаков
Несправедливо! Кощунственно! Мерзко! Тема: Сколько россиян считают себя счастливыми и чего им не хватает? По данным опроса ФОМ РФ, 38% граждан РФ чувствуют себя счастливыми. 5% - не чувствуют себя счастливыми. Статистическая погрешность 3,5 %. (Радио Спутник, 19.03.2024, Встречаем Зарю. 07:04 мск, из 114 мин >31:42-53:40
Каталог: История 
9 дней(я) назад · от Анатолий Дмитриев

Новые публикации:

Популярные у читателей:

Новинки из других стран:

LIBMONSTER.RU - Цифровая библиотека России

Создайте свою авторскую коллекцию статей, книг, авторских работ, биографий, фотодокументов, файлов. Сохраните навсегда своё авторское Наследие в цифровом виде. Нажмите сюда, чтобы зарегистрироваться в качестве автора.
Партнёры библиотеки
ЭПИСТЕМОЛОГИЯ И СУБЪЕКТИВНАЯ ВЕРОЯТНОСТЬ
 

Контакты редакции
Чат авторов: RU LIVE: Мы в соцсетях:

О проекте · Новости · Реклама

Либмонстр Россия ® Все права защищены.
2014-2024, LIBMONSTER.RU - составная часть международной библиотечной сети Либмонстр (открыть карту)
Сохраняя наследие России


LIBMONSTER NETWORK ОДИН МИР - ОДНА БИБЛИОТЕКА

Россия Беларусь Украина Казахстан Молдова Таджикистан Эстония Россия-2 Беларусь-2
США-Великобритания Швеция Сербия

Создавайте и храните на Либмонстре свою авторскую коллекцию: статьи, книги, исследования. Либмонстр распространит Ваши труды по всему миру (через сеть филиалов, библиотеки-партнеры, поисковики, соцсети). Вы сможете делиться ссылкой на свой профиль с коллегами, учениками, читателями и другими заинтересованными лицами, чтобы ознакомить их со своим авторским наследием. После регистрации в Вашем распоряжении - более 100 инструментов для создания собственной авторской коллекции. Это бесплатно: так было, так есть и так будет всегда.

Скачать приложение для Android