На z/OS не запускается сервер приложений

     Хочу рассказать об одной проблеме, связанной с запуском сервера приложений на z/OS.

   Краткое описание случившегося: сервер приложений прекрасно работал, в какой-то момент его потребовалось перезапустить, была выдана соответствующая команда, после останова сервер пытается запуститься и тут же “падает“. Встает вопрос – что случилось?

     Никаких изменений в конфигурацию не вносилось. В среде окружения вроде бы ничего не поменялось. Что же произошло?

   Начинаем разбираться в проблеме постепенно. Запуск сервера приложений на z/OS начинается с вызова процедуры на запуск CR (Control Region) сервера. Поэтому, нужно посмотреть в системную выходную очередь (SDSF Output queue) и найти там адресное пространство CR сервера, мы увидим, что оно завершилось с кодом 0001. Это мало о чем говорит, поэтому “раскрываем” CR сервера и смотрим, как происходил запуск.

     Любой компонент WebSphere Application Server for z/OS, первое, что делает при запуске, это проверяет возможность запуска shell:

*************************************************************
* Test that OMVS can successfully launch a shell and return *
*************************************************************

     Если проверка выполнена успешно, код возврата RC=13, то выполняется следующий шаг процедуры на запуск:

*********************************************************
* If the shell RC code is as expected (13) – proceed    *
*********************************************************

     Следующим шагом является запуск скрипта applyPTF.sh, который проверяет, выполнялась ли установка пакетов обновлений (PTF) для WAS в системе, и если это так, то начинает процесс установки обновлений:

***********************************************
* Start the Multi-Product PTF Post-Installer  *
***********************************************

     Post-instaler осуществляет вывод своей работы в applyPTF.out, расположение которого отражено в той же процедуре на запуск CR.

     Открыв лог applyPTF.out, можно увидеть следующие строки, свидетельствующие о том, что:

Установка пакетов обновлений не проводилась:

No post install service pending, no action taken. Fri Oct 25 16:36:27 MSK 2013

PTF были установлены в системе, выполняется запуск установщика PTF Installer, выполняется установка обновлений на WAS:

Calling the Multi-Product PTF Installer

далее

****************************************
Multi-Product PTF Installer Begin
****************************************

далее

Install Begin on WebSphere Product

Самая распространенная ошибка, при работе  applyPTF.sh:

/etc/profile 273: FSUMF316 Cannot open temporary file /tmp/shGeHGFbHeA: EDC5133I No space left on device.

     Эта ошибка информирует о том, что переполнен системный каталог для временных данных /tmp, что и является причиной “падения” сервера при запуске. После того, как /tmp был очищен, сервер благополучно запустился.

UPD 27.01.14: Забыл отметить, что все вышесказанное относится не только к серверам приложений, но и к узлам, и администратору развертывания.

VN:F [1.9.22_1171]
Rating: 0.0/5 (0 votes cast)
Tagged with: , , , , , ,
Posted in WebSphere Application Server, Troubleshooting

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

Language: