Python LanguageПараллельное вычисление

замечания

Из-за GIL (блокировка глобального интерпретатора) только один экземпляр интерпретатора python выполняется в одном процессе. В общем, использование многопоточности только улучшает привязку IO, а не связанные с ЦП. Модуль multiprocessing рекомендуется, если вы хотите параллельно выполнять задачи, связанные с ЦП.

GIL применяется к CPython, самой популярной реализации Python, а также PyPy. Другие реализации, такие как Jython и IronPython, не имеют GIL .

Использование многопроцессорного модуля для параллелизации задач

import multiprocessing

def fib(n):
    """computing the Fibonacci in an inefficient way
    was chosen to slow down the CPU."""
    if n <= 2:
        return 1
    else:
        return fib(n-1)+fib(n-2) 
p = multiprocessing.Pool() 
print(p.map(fib,[38,37,36,35,34,33]))

# Out: [39088169, 24157817, 14930352, 9227465, 5702887, 3524578]

Поскольку выполнение каждого вызова fib происходит параллельно, время выполнения полного примера составляет 1,8 × быстрее, чем если бы последовательное выполнение на двоичном процессоре.

Python 2.2+

Использование скриптов Parent и Children для параллельного выполнения кода

child.py

import time

def main():
    print "starting work"
    time.sleep(1)
    print "work work work work work"
    time.sleep(1)
    print "done working"

if __name__ == '__main__':
    main()

parent.py

import os

def main():
    for i in range(5):
        os.system("python child.py &")

if __name__ == '__main__':
    main()

Это полезно для параллельных независимых запросов HTTP-запроса / ответа или выбора / вставки базы данных. Аргументы командной строки могут быть предоставлены и скрипту child.py . Синхронизация между сценариями может быть достигнута всеми скриптами, регулярно проверяющими отдельный сервер (например, экземпляр Redis).

Использование C-расширения для параллелизации задач

Идея здесь состоит в том, чтобы переместить интенсивные вычислительные задания на C (используя специальные макросы), независимо от Python, и иметь C-код для выпуска GIL во время работы.

#include "Python.h"
...
PyObject *pyfunc(PyObject *self, PyObject *args) {
    ...
    Py_BEGIN_ALLOW_THREADS
    // Threaded C code
    ...
    Py_END_ALLOW_THREADS
    ...
}

Использование модуля PyPar для параллелизации

PyPar - это библиотека, которая использует интерфейс передачи сообщений (MPI) для обеспечения параллелизма в Python. Простой пример в PyPar (см. Https://github.com/daleroberts/pypar) выглядит следующим образом:

import pypar as pp

ncpus = pp.size()
rank = pp.rank()
node = pp.get_processor_name()

print 'I am rank %d of %d on node %s' % (rank, ncpus, node)

if rank == 0:
  msh = 'P0'
  pp.send(msg, destination=1)
  msg = pp.receive(source=rank-1)
  print 'Processor 0 received message "%s" from rank %d' % (msg, rank-1)
else:
  source = rank-1
  destination = (rank+1) % ncpus
  msg = pp.receive(source)
  msg = msg + 'P' + str(rank)
  pypar.send(msg, destination)
pp.finalize()