HPC Administrator : Свободные узлы кластера SKIF-BLADES50 : showbf vs pbsnodes

Контекст: Система очередей Torque PBS. Система управления заданиями Maui.

Доступна программная компонента showbf, которая выводит список узлов по заданному свойству узла.
Пример использования для поиска количества свободных вычислительных виртуальных процессорных эквивалентов:

$ showbf -f batch
backfill window (user: 'test' group: 'grp_test' partition: ALL) Wed Sep  8 10:32:59
40 procs available with no timelimit
$

В данном случае нам доступно 40 процессоров, принадлежащих к группе “batch” с неограниченным временем выполнения задачи. Следует отметить что отдельно возможно появление периода времени доступности в зависимости от ожидающих задач, но еще не получивших резервацию ресурсов. Также заметим, что использование программной компоненты pbsnodes, не отражает реального состояния занятости узлов, так как опирается при вычислении занятости только на уровень загрузки. При включенном правиле только одного задания на каждом вычислительном узле в отдельный момент времени. Таким образом следующий вывод:

$ pbsnodes -l all :batch
node-01              down
node-02              down
node-03              down
node-04              down
node-06              down
node-07              down
node-08              down
node-09              down
node-10              down
node-17              job-exclusive,busy
node-18              busy
node-19              busy
node-20              busy
node-21              busy
node-22              free
node-23              job-exclusive,busy
node-24              free
node-25              job-exclusive,busy
node-26              free
node-27              free
node-28              free
node-29              job-exclusive,busy
node-30              down
node-51              job-exclusive,busy
node-52              job-exclusive,busy
$

для узлов 26,27,28 может означать не “свободность”, а только слабую загрузку.

Scroll to top