Pourquoi les files d'attente multitraitement sont-elles lentes lors du partage d'objets volumineux en Python ?

Mohamed Biaz

Dernière mise à jour le

Mar 2, 2023

min. de lecture

lunettes devant un ordinateur affichant un code

Sommaire

Guide pour choisir une solution OCR

Les files d'attente de multi-processing len Python permettent à plusieurs processus d'échanger des objets entre eux en toute sécurité. Cependant, ces files d'attente peuvent devenir lentes lorsque des objets volumineux sont partagés entre des processus. Cela peut être le cas pour plusieurs raisons :

Décapage et décapage : Les objets placés dans des files d'attente multitraitement sont décapés, transférés sur la file d'attente, puis dédécapés. Les étapes de décapage et de dédécapage entraînent des frais supplémentaires, qui peuvent être importants pour les objets volumineux. En effet, les objets volumineux nécessitent davantage de données pour être décapées et transférées, et l'étape de dédécapage nécessite la reconstruction de l'objet entier.
Limites du GIL : Le Global Interpreter Lock (GIL) empêche plusieurs threads natifs d'exécuter des byte-codes Python à la fois. Ce verrouillage est nécessaire principalement parce que la gestion de la mémoire de Python n'est pas sûre pour les threads. Étant donné que les files d'attente multitraitement utilisent des verrous pour transférer des objets en toute sécurité entre les processus, le GIL peut limiter les performances lors du transfert d'objets volumineux nécessitant l'acquisition du verrou pendant de longues périodes.
Copie de mémoire : Les files d'attente multitraitement créent des copies des objets lorsqu'ils sont transférés d'un processus à l'autre. Pour les objets volumineux, la création de copies peut être très coûteuse en termes de temps et de mémoire.

Pour améliorer les performances, il est préférable d'éviter autant que possible de partager des objets volumineux sur des files d'attente multitraitements.

Si nécessaire, une approche consiste à partager des objets de mémoire à l'aide du types de cc partagés et multiprocesseurs module au lieu du décapage, ce qui évite les frais liés au décapage et au dédécapage.

‍

Expérience de multi-processing mettant en évidence le problème

Voici l'expérience en Python. La seule différence entre nos deux expériences est la taille des objets partagés dans la file d'attente. Tous les calculs intensifs (la multiplication matricielle) sont exactement les mêmes, quel que soit ce que nous mettons dans la file d'attente.

from tqdm import tqdm
import multiprocessing as mp
from time import time
import numpy as np

def heavy_function(n):
    for _ in range(n):
        # some computation
        a = np.random.random((500, 500))
        b = np.random.random((500, 500))
        _ = a.dot(b)
        q.put(1)

if __name__ == "__main__":
    num_workers = 16
    n = 100
    q = mp.Queue(maxsize=100)

    t0 = time()
    processes = []
    for _ in range(num_workers):
        p = mp.Process(target=heavy_function, args=(n,))
        p.start()
        processes.append(p)

    for i in tqdm(range(num_workers)):
        el = q.get(block=True, timeout=10)
    for p in processes:
        assert not p.is_alive()
        p.join()
    t1 = time()
    print(f"{(t1 - t0) :.1f} seconds.")

Cela s'exécute sur mon ordinateur en 7 secondes environ. Comme nous pouvons le voir, l'état de chaque sous-processus est R, ce qui signifie qu'il est en cours d'exécution.

Mettons plutôt un tableau numpy lourd dans la file d'attente.

Remplacez la ligne où nous avons mis un 1 dans la file d'attente par :

q.put(np.zeros((1500, 1500, 3))

Cela s'exécute sur mon ordinateur en 145 secondes environ. Il est plus de 20 fois plus lent même si les calculs sont exactement les mêmes. Comme nous pouvons le voir, l'état de chaque sous-processus est S, ce qui signifie qu'il est en veille.

Écrire directement sur le disque dur pour communiquer entre les processus au lieu d'utiliser des files d'attente multitraitement en Python présente des avantages et des inconvénients :

Avantages :

Éviter le décapage et le dédécapage en hauteur pour les gros objets. L'écriture sur disque permet d'éviter de sérialiser les objets.
Éviter la copie de mémoire qui se produit avec les files d'attente. Les objets sont écrits une seule fois sur le disque au lieu d'être copiés dans la file d'attente.
Performances d'E/S potentiellement plus rapides en écrivant de manière séquentielle sur le disque au lieu de l'ajouter à une file d'attente.

Inconvénients :

La synchronisation entre les processus doit être gérée manuellement. Les files d'attente fournissent une implémentation sûre pour l'échange d'objets entre les processus.
La gestion des erreurs est plus complexe. L'implémentation de la file d'attente gère les erreurs qui peuvent survenir lors des transferts d'objets. Cette logique devrait être réimplémentée.
Les objets sur le disque ne sont pas accessibles depuis Python et doivent être chargés avant utilisation. Les objets de la file d'attente restent en mémoire.

Developer-first

À propos

Qu'il s'agisse de simples photos, de fichiers PDF complexes ou de fichiers manuscrits, l'API de Mindee transforme les données de vos documents en JSON structuré de manière hautement fiable. Aucune formation sur les modèles n'est requise. Tous les alphabets et toutes les langues sont pris en charge.

Explorez la plateforme

Articles suggérés selon vos centres d'intérêt

Voir toutes les ressources

OCR IA

by The Mindee Team

Automatiser le traitement de vos factures : guide pour gére les comptes fournisseurs

Impact business

Automatisation

OCR IA

by The Mindee Team

Mettre fin au stress des fins de mois : Guide du rapprochement bancaire automatisé

Impact business

Automatisation

OCR IA

by The Mindee Team

Comment convertir l'écriture manuscrite en texte à l'aide de l'IA (HTR)

OCR IA

by The Mindee Team

Données structurées et données non structurées : Ce que vous devez savoir

Basiques/Fondations

Pourquoi les files d'attente multitraitement sont-elles lentes lors du partage d'objets volumineux en Python ?

Sommaire

Related Articles

Expérience de multi-processing mettant en évidence le problème

Key Takeway

Key Takeway

Articles suggérés selon vos centres d'intérêt