Имам достъп до 128-ядрен клъстер, на който бих искал да изпълнявам паралелна работа. Клъстерът използва Sun GridEngine и моята програма е написана да работи с помощта на Parallel Python, numpy, scipy на Python 2.5.8. Изпълнението на заданието на единичен възел (4 ядра) дава ~3,5 пъти подобрение спрямо едно ядро. Сега бих искал да пренеса това на следващото ниво и да разделя работата на ~4 възела. Моят qsub
скрипт изглежда по следния начин:
#!/bin/bash
# The name of the job, can be whatever makes sense to you
#$ -N jobname
# The job should be placed into the queue 'all.q'.
#$ -q all.q
# Redirect output stream to this file.
#$ -o jobname_output.dat
# Redirect error stream to this file.
#$ -e jobname_error.dat
# The batchsystem should use the current directory as working directory.
# Both files will be placed in the current
# directory. The batchsystem assumes to find the executable in this directory.
#$ -cwd
# request Bourne shell as shell for job.
#$ -S /bin/sh
# print date and time
date
# spython is the server's version of Python 2.5. Using python instead of spython causes the program to run in python 2.3
spython programname.py
# print date and time again
date
Някой има ли идея как да стане това?