Недостатки персептронов

Нейронные сети не позволяют достаточно легко извлечь содержащиеся в них знания; безусловно, можно легко определить, какие значения имеют сами весовые коэффициенты, но непосредственно из этих значений нельзя извлечь какой-либо смысл, не потратив целые часы на их анализ. Из этого также следует, что успешное функционирование персептронов полностью зависит от того, какие алгоритмы использовались для их создания. Дело в том, что разработчик не может вручную модифицировать значения весовых коэффициентов персептрона, не понимая, что они означают!
Кроме того, после завершения процесса обучения в многослойном персептроне создается представление результатов обучения, которое остается неизменным. Это означает, что для обновления состояния персептрона необходимо либо начинать обучение с нуля, либо проводить переобучение. Однако переобучение не дает никаких гарантий того, что будут сохранены знания, которые были ранее получены в процессе обучения. Это означает, что после переобучения может потребоваться повторно выполнить все действия, которые были осуществлены до сих пор в ходе проверки и отладки персептронов.
Для того чтобы разработка многослойного персептрона завершилась успешно, приходится проводить очень много экспериментов, при этом возникает необходимость рассматривать в качестве параметров, подлежащих исследованию, не только количество обрабатывающих элементов, но и количество слоев. Кроме того, в процессе проектирования особое внимание необходимо уделять вопросам определения входных и выходных данных, поскольку от правильного решения этих вопросов в значительной степени зависит успешное решение задачи. К тому же, многослойные персептроны часто нуждаются в получении заранее отформатированных данных. Это означает, что для них должна быть предусмотрена предварительная и последовательная обработка данных для приведения этих данных в соответствии с истинным характером решаемой задачи (поскольку нейронные сети фактически не позволяют выделять из потока данных только те данные, которые относятся к решаемой задаче).
Наконец, при использовании многослойных персептронов возникают серьезные проблемы, связанные с масштабироваїшем. В частности, обнаруживаются весьма значительные трудности при использовании персептронов для формирования сложных поверхностей решений или для решения задач, имеющих высокую размерность (поскольку при этом затраты памяти и вычислительных ресурсов возрасгакгг по экспонетгге).
> Для вычисления выходных данных входные данные распространяются последовательно через слои, проходя один слой за другим.
> В связи с наличием промежуточного слоя возникают дополнительные трудности, поэтому задача обучения многослойного персептрона становится сложнее.
> В ходе реализации алгоритма обратного распространения происходит вычисление градиента ошибки в последнем слое, после чего ошибка распространяется через слои в обратном направлении с учетом определенных критериев.
> Для обучения многослойных персептронов могут применяться и пакетные, и ин-крементные алгоритмы, в том числе с применением решений на основе дельта-правила или адаптивных стратегий корректировки весовых коэффициентов.
Результатом создания многослойного персептрона становится способ реализации средств ИИ, способных к обучению в целях оптимальной аппроксимации функций. На практике многослойные персептроны могут использоваться при программировании игровых средств ИИ для принятия решений, прогнозирования результатов или распознавания образов в картине текущей ситуации. В следующей главе показаны примеры применения многослойных персептронов для выбора цели и оценки преимуществ прицеливания в определенную точку в пространстве.