banner

Blog

Sep 02, 2023

ALICE améliore son jeu pour l'informatique durable

La conception et le déploiement d'un tout nouveau modèle informatique – le projet O2 – permettent à la collaboration ALICE de fusionner le traitement des données en ligne et hors ligne dans un cadre logiciel unique pour répondre aux exigences de Run 3 et au-delà. Volker Lindenstruth se rend dans les coulisses.

Le Grand collisionneur de hadrons (LHC) a repris vie le 5 juillet 2022, lorsque les collisions proton-proton à une énergie record dans le centre de masse de 13,6 TeV ont repris pour la troisième exploitation. Pour permettre à la collaboration ALICE de bénéficier de l'augmentation de la luminosité instantanée Suite à cette exploitation et aux futures exploitations du LHC, l’expérience ALICE a subi une mise à niveau majeure au cours de Long Shutdown 2 (2019-2022), qui améliorera considérablement la reconstruction des traces en termes de précision spatiale et d’efficacité de suivi, en particulier pour les particules à faible impulsion. La mise à niveau permettra également d'augmenter le taux d'interaction jusqu'à 50 kHz pour les collisions plomb-plomb (PbPb) en mode de lecture continue, ce qui permettra à ALICE de collecter un échantillon de données plus de 10 fois plus grand que les échantillons combinés des analyses 1 et 2. .

ALICE est une expérience unique au LHC consacrée à l'étude de la matière nucléaire extrême. Il comprend un barillet central (le plus grand producteur de données) et un « bras » avant à muons. Le canon central s'appuie principalement sur quatre sous-détecteurs pour le suivi des particules : le nouveau système de suivi interne (ITS), qui est un tracker en silicium monolithique à sept couches de 12,5 gigapixels (Courrier CERN juillet/août 2021 p29) ; une chambre de projection temporelle (TPC) améliorée avec lecture basée sur GEM pour un fonctionnement continu ; un détecteur de rayonnement de transition ; et un détecteur de temps de vol. Le bras à muons est composé de trois dispositifs de suivi : un traqueur de muons nouvellement installé (un traqueur en silicium basé sur des capteurs à pixels actifs monolithiques), des chambres à muons remaniées et un identifiant de muons.

En raison du volume de données accru dans le détecteur ALICE mis à niveau, il est impossible de stocker toutes les données brutes produites au cours de l'exécution 3. L'une des mises à niveau majeures d'ALICE en préparation pour la dernière exécution a donc été la conception et le déploiement d'un tout nouveau modèle informatique : le projet O2, qui fusionne le traitement des données en ligne (synchrone) et hors ligne (asynchrone) dans un cadre logiciel unique. Outre une mise à niveau des fermes informatiques de l'expérience pour la lecture et le traitement des données, cela nécessite une compression en ligne efficace et l'utilisation d'unités de traitement graphique (GPU) pour accélérer le traitement.

Comme leur nom l’indique, les GPU ont été initialement conçus pour accélérer le rendu infographique, notamment dans les jeux 3D. Bien qu’ils continuent d’être utilisés pour de telles charges de travail, les GPU sont devenus des processeurs vectoriels à usage général destinés à être utilisés dans divers contextes. Leur capacité intrinsèque à effectuer plusieurs tâches simultanément leur confère un débit de calcul bien supérieur à celui des processeurs traditionnels et leur permet d'être optimisés pour le traitement des données plutôt que, par exemple, pour la mise en cache des données. Les GPU réduisent ainsi le coût et la consommation d'énergie des fermes de calcul associées : sans eux, environ huit fois plus de serveurs du même type et d'autres ressources seraient nécessaires pour gérer le traitement en ligne ALICE TPC des données de collision PbPb à un taux d'interaction de 50 kHz.

Depuis 2010, date à laquelle la ferme informatique en ligne de déclenchement de haut niveau (HLT) est entrée en service, le détecteur ALICE a été le pionnier de l'utilisation de GPU pour la compression et le traitement des données en physique des hautes énergies. Le HLT avait un accès direct au matériel de lecture du détecteur et était crucial pour compresser les données obtenues lors des collisions d'ions lourds. De plus, le cadre logiciel HLT était suffisamment avancé pour effectuer la reconstruction des données en ligne. L’expérience acquise lors de son exploitation dans le cadre des exploitations 1 et 2 du LHC s’est avérée essentielle pour la conception et le développement des systèmes logiciels et matériels actuels d’O2.

Pour la lecture et le traitement des données au cours de l'exécution 3, l'électronique frontale du détecteur ALICE est connectée via des liaisons émetteur-récepteur gigabit tolérantes aux rayonnements à des réseaux de portes programmables sur site personnalisés (voir la figure « Flux de données »). Ces derniers, hébergés dans les nœuds de la batterie de processeurs de premier niveau (FLP), effectuent une lecture continue et une suppression des zéros (la suppression des données sans signal physique). Dans le cas d'ALICE TPC, la suppression zéro réduit le débit de données d'un niveau prohibitif de 3,3 To/s au niveau du frontal à 900 Go/s pour les opérations PbPb à polarisation minimale de 50 kHz. Ce flux de données est ensuite transmis par la batterie de lecture FLP vers les nœuds de traitement d'événements (EPN) à l'aide d'un logiciel de distribution de données exécuté sur les deux batteries.

 0.1 GeV/c. Here the fake-track rate is rather negligible, however the clone rate increases significantly for low-pT primary tracks due to incomplete track merging of very low-momentum particles that curl in the ALICE solenoidal field and leave and enter the TPC multiple times./p>
PARTAGER