COMPTOIR
  
register

Du machine learning chez Google et Seagate pour prédire la panne d'un disque dur

Contrairement au SSD, il est beaucoup plus difficile d'estimer l'usure et d'anticiper la panne d'un disque dur, un vrai défi pour les centres de données, dont il est un équipement crucial. Qu'à cela ne tienne, Google et Seagate se sont associés pour tenter de remédier à ce problème ! L'expérience s'est traduite par le développement d'un modèle de machine learning pour prédire le moment où un disque dur serait susceptible de rendre l'âme. Une tâche plus difficile qu'elle pourrait en avoir l'air, même pour Google et en dépit d'avoir accès à plus de 20 ans de données sur les comportements de millions de disques durs dans les datacenters. Plus exactement, il s'agit dans le cadre de cette expérience d'exploiter une importante quantité (volume non spécifié) de données tirées du SMART de chaque disque, combinée avec les données des systèmes hôtes, de leurs logs (OVD, FARM) et des informations de fabrication, notamment le numéro du modèle et son lot.

Pour l'anecdote, en 2016, Backblaze avait déjà tenté une expérience un peu semblable, avec le suivi sur une période fixe de 5 attributs spécifiques de SMART, afin de tenter de prédire la panne d'un disque, mais établir des corrélations entre ces 5 éléments fut complexe et parfois impossible. De plus, Backblaze avait conclu que les modèles de pannes étaient différents entre un lecteur où les erreurs s'étaient accumulées lentement au fil du temps et un disque sur lequel les erreurs étaient apparues soudainement.

 

Cette fois-ci, deux approches différentes ont été utilisées pour tenter de percer le secret, l'une via le classificateur AutoML Tables, et l'autre avec un modèle TensorFlow personnalisé Transformer-based, dans les deux cas via Google Cloud. Les modèles ont ensuite été évalués selon deux mesures, la précision (la valeur prédictive positive) et le rappel (Ia sensibilité), en retenant pour le premier la proportion d'identifications positives correctes, et pour le second la proportion de positifs réels correctement identifiés. À ce jeu, c'est l'AutoML Tables qui s'en est sorti le mieux, avec une précision de 98 % et un rappel de 35 %, contre 70-80 % et 20-25 % pour le modèle custom. Google n'a pas vraiment précisé si ces niveaux de résultats étaient déjà satisfaisants, mais précise qu'ils ont été en mesure de déterminer par ce moyen les causes principales des pannes de disque dur, ce qui a déjà permis d'entreprendre des actions préventives dans l'anticipation de la panne.

 

Quoiqu'il en est, le projet n'est apparemment pas prévu pour s'arrêter là (ce serait bien dommage). En effet, Google songe déjà à d'améliorer le système pour être compatible avec tous les disques de chez Seagate et entend bien convaincre les OEM et ses clients de l'adopter. Il faut bien l'avouer, nul doute qu'un système de détection permettant de tacler la panne avec précision avant même qu'elle ne se produise peut avoir du succès dans bien des entreprises ! Minority Report, mais pour les disques durs, en somme ! (Source : Google, via ExtremeTech)

 

google ia deploy

Un poil avant ?

Le nouvel AIO d'In Win fait "brrr" aussi pour l'environnement du socket

Un peu plus tard ...

Un refresh à venir pour les processeurs AMD Ryzen 5000 ?

Les 6 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par JoeBar, le Mardi 25 Mai 2021 à 19h43  
Moi c'est 2 3To de chez Seagate qui avaient environ 6 ans, qui sont décédés sans crier gare.
par Un #ragoteur connecté embusqué, le Jeudi 20 Mai 2021 à 09h25  
Bof, avec les disques de Seagate, la base de données est vite remplie. Exemple d'une ligne dans cette base:

Seagate 7200.11: DOA failure: 25% - Failure rate 100% - Min time to fail: 9000 hours - Max time to fail: 21000 hours

Et j'écris ceci en parfaite connaissance de cause, malheureusement: une triplette de DD dans un RAID 5, tous morts (dans les délais listé ci-dessus), plus un qui a du être remplacé dés réception car défectueux à l'arrivé !
par dfd, le Jeudi 20 Mai 2021 à 00h15  
par _m_, le Mercredi 19 Mai 2021 à 10h14
Et après ça, ils comptent s'attaquer à l'être humain, pour nous donner la date de notre mort?
Avec toutes les données qu'ils collectent sur nous, ça ne doit pas être beaucoup plus compliqué.
Ils veulent mon SMART?
Hey pas con l'idée : en même temps que l'injection de Pfizer/Covid on nous greffe une puce 'Human Smart Machine Learning" et hop !
Dans 12 ans : Failure detected, please backup (your genes)
par Un hardeur des ragots du Grand Est, le Mercredi 19 Mai 2021 à 12h15  
Petit retour d'expérience.
Il y a deux jours mon disque le plus vieux (+3200 allumages +20000 heures Seagate 2To ST2000DM001-1CH164) qui était dans la tour m'a lâché sans prévenir à la fin d'une session d'écriture. J'avais regardé avec Crystaldisk la veille tout était ok...
Bip Bip clic clic. Depuis en le positionnant dans un dock, il se lance mais clic 2-3 fois puis s'éteint. Il n'apparait plus sous windows.
par _m_, le Mercredi 19 Mai 2021 à 10h14  
Et après ça, ils comptent s'attaquer à l'être humain, pour nous donner la date de notre mort?
Avec toutes les données qu'ils collectent sur nous, ça ne doit pas être beaucoup plus compliqué.
Ils veulent mon SMART?
par Jemporte, le Mercredi 19 Mai 2021 à 08h00  
Et pour avoir cette détection de panne améliorée il faudra être tout le temps connecté au cloud Google qui devra avoir accès à toutes les données que vous écrivez ou lisez sur votre disque...