Caracterización de una estrategia de detección de fallos transitorios en HPC
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedades y tasas de errores, intervalos de detección más largos y fallos silenciosos. Se proyecta que, en sistemas de exa-escala, los errores ocurran varias veces al día y se propaguen para generar desde caí...
Guardado en:
| Autores principales: | Montezanti, Diego Miguel, Rexachs del Rosario, Dolores, Rucci, Enzo, Luque, Emilio, Naiouf, Marcelo, De Giusti, Armando Eduardo |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2015
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/50189 |
| Aporte de: |
Ejemplares similares
-
SEDAR: Detectando y recuperando fallos transitorios en aplicaciones de HPC
por: Montezanti, Diego Miguel, et al.
Publicado: (2019) -
Characterizing a Detection Strategy for Transient Faults in HPC
por: Montezanti, Diego Miguel, et al.
Publicado: (2016) -
Some Issues to Consider in the Management of Energy Consumption in HPC Systems with Fault Tolerance
por: Morán, Marina, et al.
Publicado: (2022) -
SEDAR: Detección y recuperación automática de fallos transitorios en sistemas de cómputo de altas prestaciones
por: Montezanti, Diego Miguel
Publicado: (2020) -
Exploring Energy Saving Opportunities in Fault Tolerant HPC Systems
por: Morán, Marina, et al.
Publicado: (2024)