litceysel.ru
добавить свой файл
1

Лекция 22. Основные принципы планирования эксперимента. План эксперимента. Определение базисных функций с помощью регрессионного анализа

Основные принципы планирования эксперимента

Для получения адекватной математической модели необходимо обеспечить выполнение определенных условий проведения эксперимента. Модель называют адекватной, если в оговоренной области варьирования факторов Х полученные с помощью модели значения функций отклика Y отличаются от истинных не более чем на заданную величину.

Методы построения экспериментальных факторных моделей рассматриваются в теории планирования эксперимента.

Цель планирования эксперимента – получение максимума информации о свойствах исследуемого объекта при минимуме опытов. Такой подход обусловлен высокой стоимостью экспериментов, как физических, так и вычислительных, и вместе с тем необходимостью построения адекватной модели.

Планируют как активный, так и пассивный эксперимент. Планируемый активный эксперимент при прочих равных условиях точнее и информативнее, а иногда и дешевле пассивного. Это следует учитывать при выборе вида эксперимента. В вычислительном эксперименте, в отличие от физического, нет никаких ограничений на выбор управляемых факторов и характер их изменения. Поэтому вычислительные эксперименты обычно всегда реализуются как активные. В дальнейшем будут рассматриваться в основном вопросы, связанные с планированием активных экспериментов.

При планировании активных экспериментов используются следующие принципы:


  • отказ от полного перебора всех возможных состояний объекта;

  • постепенное усложнение структуры математической модели;

  • сопоставление результатов эксперимента с величиной случайных помех;

  • рандомизация опытов;

  • оптимальное планирование эксперимента.

Детальное представление о свойствах поверхности отклика может быть получено лишь при условии использования густой дискретной сетки значений факторов, покрывающей все факторное пространство. В узлах этой многомерной сетки находятся точки плана, в которых проводятся опыты. В этом случае в принципе можно получить факторную модель, которая будет практически почти полностью соответствовать исходной теоретической модели. Однако в большинстве случаев при решении практических задач, для которых используется факторная модель, такого детального описания не требуется. Выбор структуры факторной модели основан на постулировании определенной степени гладкости поверхности отклика. Поэтому с целью уменьшения количества опытов принимают небольшое число точек плана, для которых осуществляется реализация эксперимента.


В отсутствие априорной информации о свойствах функции отклика нет смысла сразу строить сложную математическую модель объекта. Если проверка этой модели на адекватность не дает удовлетворительного результата, ее постепенно усложняют путем изменения структуры (например, повышая степень полинома, принятого в качестве факторной модели, или вводя в модель дополнительные факторы и т.п.). При этом используются результаты опытов, выполненных при построении простой модели, и проводится некоторое количество дополнительных опытов.

При большом уровне случайной помехи получается большой разброс значений функции отклика Y в опытах, проведенных в одной и той же точке плана. В этом случае оказывается, что чем выше уровень помехи, тем с большей вероятностью простая модель окажется работоспособной, чем меньше уровень помехи, тем точнее должна быть факторная модель.

Кроме случайной помехи при проведении эксперимента может иметь место систематическая помеха. Наличие этой помехи практически никак не обнаруживается и результат ее воздействия на функцию не поддается контролю. Однако если путем соответствующей организации проведения опытов искусственно создать случайную ситуацию, то систематическую помеху можно перевести в разряд случайных. Такой принцип организации эксперимента называют рандомизацией систематически действующих помех.

Наличие помех приводит к ошибкам эксперимента. Ошибки подразделяют на систематические и случайные, соответственно наименованиям вызывающих их факторов – помех.

В вычислительных активных экспериментах ошибки характерны только для определяемых значений функций отклика. Если исходить из целей построения факторных моделей на основе теоретических моделей, полагая, что теоретические модели дают точное описание физических свойств технического объекта, а регрессионная модель является ее аппроксимацией, то значения функций отклика будут содержать только случайную ошибку. В этом случае необходимости в рандомизации опытов не возникает.


Рандомизацию опытов осуществляют только в физических экспериментах. Следует отметить, что в этих экспериментах систематическую ошибку может порождать, наряду с отмеченными в предыдущем параграфе факторами, также неточное задание значений управляемых факторов, обусловленное некачественной калибровкой приборов для их измерения (инструментальная ошибка), конструктивными или технологическими факторами.

К факторам в активном эксперименте предъявляются определенные требования. Они должны быть:

1) управляемыми (установка заданных значений и поддержание постоянными в процессе опыта);

2) совместными (их взаимное влияние не должно нарушать процесс функционирования объекта);

3) независимыми (уровень любого фактора должен устанавливаться независимо от уровней остальных);

4) однозначными (одни факторы не должны быть функцией других);

5) непосредственно влияющими на выходные параметры.

В вычислительном эксперименте реализация трех первых требований не создает никаких затруднений, а в физическом эксперименте могут возникнуть сложности и далее невозможность их осуществления, что приведет к необходимости замены активного эксперимента пассивным.

Функции отклика должны быть:

1) численно измеряемыми;

2) иметь четкий физический смысл;

3) однозначными (характеризовать только одно свойство

объекта);

4) информативными (полностью характеризовать определенное свойство объекта);

5) статистически эффективными (измеряться с достаточной точностью с целью сокращения дублирования опытов).

План эксперимента


При проведении активного эксперимента задается определенный план варьирования факторов, т.е. эксперимент заранее планируется.

План эксперимента – совокупность данных, определяю­щих число, условия и порядок реализации опытов.


Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям.

Точка плана – упорядоченная совокупность численных значений факторов, соответствующая условиям проведения опыта, т.е. точка факторного пространства, в которой проводится эксперимент. Точке плана с номером i соответствует вектор-строка

.

Общая совокупность таких векторов образует план эксперимента, а совокупность различных векторов, число которых обозначим N, – спектр плана.

В активном эксперименте факторы могут принимать только фиксированные значения. Фиксированное значение фактора называют уровнем фактора. Количество принимаемых уровней факторов зависит от выбранной структуры факторной модели и принятого плана эксперимента. Минимальный и максимальный , (k число факторов) уровни всех факторов выделяют в факторном пространстве некоторый гиперпараллелепипед, представляющий собой область планирования. В области планирования находятся все возможные значения факторов, используемые в эксперименте.

Вектор задает точку центра области планирования. Координаты этой точки обычно выбирают из соотношения

. (6.1)

Точку называют центром эксперимента. Она определяет основной уровень факторов , . Центр эксперимента стремятся выбрать как можно ближе к точке, которая соответствует искомым оптимальным значениям факторов. Для этого используется априорная информация об объекте.


Интервалом (или шагом) варьирования фактора xj называют величину, вычисляемую по формуле

(6.2)

Факторы нормируют, а их уровни кодируют. В кодированном виде верхний уровень обозначают +1, нижний 1, а основной 0. Нормирование факторов осуществляют на основе соотношения

(6.3)

Для переменных , начало координат совмещено с центром эксперимента, а в качестве единиц измерения используются интервалы варьирования факторов. Геометрическое представление области планирования при двух факторах показано на рис. 6.3. Центр эксперимента находится в точке 0 с координатами . Точки 1, 2, 3, 4 являются точками плана эксперимента. Например, значения факторов x1 и x2 в точке 1 равны соответственно и , а нормированные их значения

В дальнейшем будем предполагать, что в планах активных экспериментов факторы нормированы.


х2

х2max 3 +1 4

х2

–1 0 +1

х2min 1 2

1


0 х1min х1 max х1



Рис. 6.3. Геометрическое представление области планирования при двух факторах: x1 и x2

План эксперимента удобно представлять в матричной форме. План эксперимента задается либо матрицей плана, либо матрицей спектра плана в совокупности с матрицей дублирования.

Матрица плана представляет собой прямоугольную таблицу, содержащую информацию о количестве и условиях проведения опытов. Строки матрицы плана соответствуют опытам, а столбцы факторам. Размерность матрицы плана L х k, где L число опытов, k число факторов. При проведении повторных (дублирующих) опытов в одних и тех же точках плана матрица плана содержит ряд совпадающих строк.

Матрица спектра плана – это матрица, в которую входят только различающиеся между собой строки матрицы плана. Размерность матрицы спектра плана N х k, где N – число точек плана, различающихся между собой хотя бы одной координатой .

Матрица спектра плана имеет вид

(6.4)

где вектор, определяющий нормированные значения координат точки плана в i-м опыте; xij нормированное значение j-го фактора в i-м опыте.

Матрица дублирования – квадратная диагональная матрица n, диагональные элементы которой равны числам параллельных опытов в соответствующих точках спектра плана:

. (6.5)

Опыты при выполнении эксперимента проводятся в последовательности, предусмотренной матрицей плана. Эта матрица составляется лишь при необходимости рандомизации опытов, когда в результатах эксперимента можно ожидать наличие систематических ошибок. Для выбора случайной последовательности опытов используется таблица равномерно распределенных случайных чисел. Первое число таблицы выбирают произвольно, желательно случайным образом, а затем, начиная с этого числа, выписывают L чисел таблицы, где L число опытов (с учетом их дублирования). При этом числа, большие L, а также уже выписанные, отбрасываются.


В вычислительных экспериментах опыты проводят в соответствии с матрицей спектра плана, так как предполагается отсутствие систематических ошибок и поэтому нет необходимости в рандомизации опытов.

Определение базисных функций с помощью регрессионного анализа


Регрессионный анализ проводится с целью получения по экспериментальным данным регрессионных моделей, представляющих собой экспериментальные факторные модели. Задачей регрессионного анализа является определение параметров экспериментальных факторных моделей объектов проектирования или исследования, т.е. определение коэффициентов уравнений моделей при выбранной их структуре.

Регрессионный анализ включает три основных этапа:

1) статистический анализ результатов эксперимента;

2) получение оценок искомых коэффициентов регрессии ;

3) оценку адекватности и работоспособности полученной экспериментальной факторной модели технической системы.

Под структурой экспериментальной факторной математической модели понимается вид математических соотношений между факторами X, V и откликом Y. В качестве факторов принимают внутренние и внешние параметры технической системы, подлежащие оптимизации в процессе ее проектирования. Внутренние параметры системы это параметры ее элементов, внешние это параметры внешней среды, в условиях воздействий которой осуществляется функционирование системы. Функциями отклика Y являются выходные параметры технической системы, характеризующие ее эффективность и качество процессов функционирования. Выходные параметры системы принимаются в качестве критериев оптимальности.

Как уже отмечалось, структура факторной модели выбирается на основе априорной информации, используя принцип постепенного ее усложнения. Параметры факторной математической модели определяются методами регрессионного анализа. При определении параметров этими методами нет необходимости различать виды факторов, т. е. подразделять факторы на управляемые Х и неуправляемые V. Поэтому в дальнейшем все они будут обозначаться буквой Х. Тогда факторную модель можно представить векторным уравнением регрессии вида


. (6.6)

Определение параметров В этой модели будем рассматривать на примере одного уравнения . Для определения параметров используются результаты эксперимента. Результаты эксперимента можно представить функцией вида

(6.7)

где аддитивная помеха случайного характера с нормальным законом распределения.

Так как каждый опыт проводится при определенном сочетании уровней факторов X, то функцию представим выражением

(6.8)

где j-й элемент вектора искомых коэффициентов уравнения регрессии: j-я базисная функция элемент вектора базисных функций

В качестве базисных функций используют полиномы простейших переменных, системы ортогональных полиномов, тригонометрические функции. Наиболее часто пользуются полиномами первой и второй степеней. Например, полином первой степени, описывающий функцию отклика у при двух факторах x1 и x2, может иметь вид

(6.9)

или

(6.10)

а полином второй степени

(6.11)

Базисные функции в случае использования последнего выражения имеют вид:.


Если уравнение регрессии имеет вид выражений (6.9), (6.10), его называют уравнением линейной регрессии (линейной регрессией или регрессией первого порядка), а если содержит факторы во второй и более высокой степени нелинейной регрессией (регрессией соответствующего порядка).

Линейная регрессия может представлять как линейную математическую модель, так и нелинейную, в зависимости от того, содержит ли она линейные эффекты (как в выражении (6.9), или наряду с ними также эффекты взаимодействия (как в выражении (6.10)). Линейным называют эффект, характеризующий линейную зависимость выходного параметра у от соответствующего фактора xi. Эффектом взаимодействия называют эффект, характеризующий совместное влияние нескольких факторов на у (например, в выражении (6.10) ). Эффекты взаимодействия двух факторов называют парным взаимодействием, трех факторов тройным взаимодействием и т.д.

Как всякий статистический метод, регрессионный анализ применим при определенных предпосылках (постулатах).

1. Аддитивная помеха случайная нормально распределенная величина с параметрами =0 и =const. В этом случае функция отклика Y также случайная величина с нормальным законом распределения. Гипотезу о нормальном распределении Y можно проверить по критерию Пирсона.

2. Постоянство дисперсии помехи означает, что интенсивность ошибки определения Y не меняется при изменении уровня факторов в процессе эксперимента. Выполнение этого постулата проверяется по критерию однородности дисперсии в разных точках опыта.

3. Значения факторов в активном эксперименте неслучайные величины. Это означает, что установление каждого фактора на заданном уровне и удерживание его на этом уровне во время опыта точнее, чем ошибка воспроизводимости. В вычислительном эксперименте это выполняется однозначно, а в физическом вклад, вносимый ошибками измерения факторов Х, должен быть пренебрежимо малым в сравнении с действием других неконтролируемых факторов, образующих ошибку определения функции Y.


  1. Значения помехи в различных точках опыта некоррелированны. Для обеспечения этих требований используется рандомизация опытов. В пассивном эксперименте условие некоррелированности помехи обеспечивают путем соответствующего выбора временного интервала съема информации об условиях и результатах опытов.

  2. Векторы-столбцы базисных функций должны быть линейно независимыми. Выполнение этого требования необходимо для получения раздельных оценок всех коэффициентов регрессии . В активном эксперименте оно обеспечивается соответствующим выбором спектра плана эксперимента. При этом число опытов N (без учета дублирования) должно быть не меньше, чем число оцениваемых коэффициентов NB, т. е. N≥NB.

В пассивном эксперименте линейная зависимость между столбцами практически исключается, так как факторы неуправляемы и принимают случайные значения в различных опытах, но может наблюдаться сильная коррелированность столбцов, что повлечет за собой большие ошибки вычисления коэффициентов регрессии. Для выявления коррелированности столбцов проводят корреляционный анализ результатов пассивного эксперимента.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК


  1. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,
    С.А. Яковлев. 3-е изд., перераб. и доп. М. : Высш. шк., 2001. 343 с.

  2. Тарасик В.П. Математическое моделирование технических систем: учеб. для вузов / В.П. Тарасик. М.: Наука, 1997. 600 с.

  3. Введение в математическое моделирование: учеб. пособие для вузов / под ред. П.В.Тарасова. М.: Интермет Инжиниринг, 2000. 200 с.

  4. Советов Б.Я. Моделирование систем : учеб. для вузов / Б.Я. Советов,

    С.А. Яковлев. 2-е изд. М.: Высшая школа, 1998. 319 с.


  5. Шеннон Р. Имитационное моделирование систем – искусство и наука /
    Р. Шеннон. М.: Мир, 1978. 308 с.

  6. Максимей И.В. Имитация моделирования на ЭВМ / И.В. Максимей.
    М.: Радио и связь, 1988. 232 с.

  7. Литвинов В.В. Методы построения имитационных систем / В.В. Литвинов Т.П.Марьянович. Киев Наукова Думка 1991. 120 с.

  8. Шрайбер Т.Дж. Моделирование на GPSS / Т.Дж. Шрайбер.
    М.: Машиностроение, 1980. 592 с.

  9. Технология системного моделирования / Е.Ф. Аврамчук [и др.]. М. Машиностроение 1988. 520 с.

  10. Альянах И.Н. Моделирование вычислительных систем / И.Н. Альянах.
    Л. Машиностроение 1988. 233 с.

  11. Балакирев В.С. Оптимальное управление процессами химической технологии / В.С. Балакирев В.М. Володин А.М. Цирлин. М. Химия 1978. 384 с.

  12. Пакеты прикладных программ: Математическое моделирование / под ред. А.А. Самарского. М.: Наука, 1989. 128 с.

  13. Системное обеспечение пакетов прикладных программ / под ред.
    А.А. Самарского. М.: Наука, 1990. 208 с.