LIBRISTO
LIBROAMANTO
obbligatorio
Entra a far parte di una comunità di amanti dei libri di tutto il mondo e ottieni numerosi vantaggi. Crea un account gratuito
0
Spedizione gratuita con Packeta per un prezzo superiore a 69.99 €
Bartolini 4.49 Punto Poste 5.49 Punto Poste 5.49 Punto Bartolini 3.49 DHL 6.99 GLS 7.99

Spedizione gratuita per ordini superiori a 69,99 euro.

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Lingua IngleseInglese
Libro In brossura
Libro HPC Observability M. Edwards
Codice Libristo: 52747456
Casa editrice Independently published, maggio 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Descrizione completa
? points 55 b Nuovi Nuovi
22.29
Immagazzinamento previsto Pubblicazione 02. 06. 2026

30 giorni per il reso

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Attrice & Poliglotta
EWA KASP per
Riproduci video
Ewa Kasp
Libristo ha la più grande selezione di letteratura in lingue straniere. Per questo compro i miei libri qui.

Informazioni sul libro

Titolo completo HPC Observability
Autore M. Edwards
Lingua Inglese
Rilegatura Libro - In brossura
Data di pubblicazione 2026
Numero di pagine 164
EAN 9798198765443
Codice Libristo 52747456
Casa editrice Independently published
Peso 397
Dimensioni 216 x 280 x 9
Regala questo libro oggi stesso
È facile
1 Aggiungi il libro al carrello e scegli la consegna come regalo 2 Ti invieremo subito il buono 3 Il libro arriverà all'indirizzo del destinatario

Accesso

Accedi al tuo account. Non hai ancora un account Libristo? Crealo ora!

 
obbligatorio
obbligatorio

Non hai un account? Ottieni i vantaggi di un account Libristo!

Con un account Libristo, avrai tutto sotto controllo.

Crea un account Libristo
Consulente di libri Libroamiko
Ciao, sono Libroamiko, posso aiutarti?