Sauvegarde de données : ce que vous faites, questions, réponses ...

Démarré par oeufmollet, Janvier 15, 2020, 11:42:00

« précédent - suivant »

egtegt²

#25
C'est un dialogue de sourds, vous dites tous les deux en gros la même chose et chacun veut absolument avoir raison :)

Personne n'a remis en cause l'intérêt du RAID pour faire une sauvegarde, la seule question est de l'intérêt du RAID 5 qui contrairement à ce que certains (mais pas vous deux ni moi ;) ) pensent, est juste un mécanisme pratique pour s'économiser du travail en cas de panne mais n'offre en fin de compte que peu de sécurité en plus dans le cadre d'une sauvegarde.

Accessoirement, quand tu as 12 To de photos, dans les faits, ça n'est pas vraiment de sauvegarde que tu as besoin, c'est plutôt d'un moyen d'archivage, sauf si tu retravailles de façon très régulière l'intégralité de tes photos, ce qui me semble peu probable.

La sauvegarde sert à protéger l'intégrité de données vivantes, l'archivage sert à stocker de manière sécurisée des données mortes.

Pour moi, tu devrais séparer tes photos en deux parties :
- Une grosse dizaine de To de photos "mortes", c'est à dire que tu n'utiliseras probablement plus que pour les consulter de façon rare
- 1 ou 2 To de photos "vivantes", c'est à dire récentes et encore susceptibles d'être retravaillées et consultées de façon régulière. Les plus anciennes de cette catégorie passant régulièrement dans la première.

Ca te permettrait d'archiver les premières de façon rare, par exemple une fois par an ou quand l'espace pour les photos vivantes est saturé et d'avoir des mécanismes plus faciles à mettre en œuvre pour la sauvegarde régulière des photos vivantes.

Je ne parle pas du stockage primaire, rien n'empêche de conserver tes 12 To sur ton PC, ça n'est plus tellement cher, mais juste des copies.

La différence se fait au niveau des procédures. Par exemple prendre un gros disque, faire une archive dessus, puis l'emmener chez un proche  est envisageable une ou deux fois par an, le faire toutes les semaines s'avère quasi impossible.

En contrepartie, sauvegarder 1 To par internet de façon automatique est envisageable, même avec une ligne ADSL, le faire pour 12 To est complexe et coûteux.

Si je prends mon exemple, je classe les photos par année, pour l'instant je suis en dessous d'1 To donc je ne m'embête pas, mais quand je dépasserai 1 To, je prendrai les 10 ou 15 années les plus anciennes et je les stockerai sur 2 disques externes que je mettrai chez des proches. Je les conserverai sur mon disque mais je les exclurai du stockage cloud qui est limité à 1 To avec mon abonnement.

baséli

Citation de: Stepbystep le Février 06, 2020, 11:33:24
Pour le moment, c'est TOI qui NE COMPREND RIEN.

Encore une fois, c'est TON problème, TES données, TES risques. Mes données sont bien au chaud en de multiples exemplaires depuis des décennies. Bises.

baséli

Citation de: Stepbystep le Février 06, 2020, 14:05:35
Conclusion, à moins d'un désastre, type incendie ou catastrophe naturelle, qui détruise à la fois le PC et le NAS,

J'ai vu une sauvegarde sur réseau local détruite par un ransomware. Sans autre copie disponible. A toi de voir.

baséli

Citation de: Stepbystep le Février 06, 2020, 14:28:08
A quelle fréquence, tu vas vérifier qu'elles sont toujours lisibles ?

Avant on faisait de la rotation de bandes. Aujourd'hui je fais de la rotation de disques. Si le disque est HS, ça se voit lors de la rotation. Je ne vais pas jusqu'à vérifier que le file system n'est pas corrompu, je laisse l'OS se débrouiller.

Je n'ai (presque) jamais eu de disque HS: l'augmentation de la taille des données fait que j'en rachète de plus gros avant qu'ils cassent. Et comme la plupart du temps ils sont à l'arrêt...

Zaphod

Perso, une sauvegarde délocalisée - en PLUS d'une sauvegarde locale - ça me semble être la base.
Après c'est chiant à faire... donc ça m'arrive de ne pas la faire assez souvent... et c'est dommage.

J'utilise :
1) une sauvegarde incrémentale locale automatique sur disque interne (ça sera sur un NAS le jour où j'aurais un réseau chez moi avec un débit correct). Ca permet de récupérer des effacements suite à erreur humaine, ou même une panne sur un disque local.
2) une sauvegarde complète sur un disque portable que je prends avec moi quand je pars de chez moi.
3) une sauvegarde complète délocalisée, avec disques tournants (sauvegarde N délocalisée, sauvegarde N-1 chez moi en attente de la N+1).

L'inconvénient du (2) et (3) étant que c'est ponctuel et non automatisé... c'est toujours plus efficace quand c'est automatique, mais pour du délocalisé, c'est plus compliqué.

Donc bref, c'est surement perfectible.

Zaphod

Citation de: baséli le Février 06, 2020, 18:29:01Je n'ai (presque) jamais eu de disque HS: l'augmentation de la taille des données fait que j'en rachète de plus gros avant qu'ils cassent. Et comme la plupart du temps ils sont à l'arrêt...
Moi ça m'est arrivé deux fois, le même jour.
J'ai perdu :
- le disque externe de sauvegarde du mac ma femme (qui avait aussi fait de l'archivage... forcément ce qui était archivé a été perdu).
- quand j'allume mon PC pour essayer de récupérer quelques données sur le disque externe (je n'arrivais à rien depuis son mac), mon PC ne démarre pas... il n'a bien voulu redémarrer que quand j'ai débrancher mon disque où je stocke mes photos.

J'avais passé la journée à trier et traiter des photos... mais j'ai tout récupéré sur ma sauvegarde locale automatique :)

baséli

Citation de: Stepbystep le Février 06, 2020, 20:12:30
Dans ce cas, il ne faut pas venir raconter qu'un particulier ne peut pas utiliser un NAS comme système de sauvegarde.

CE N'EST PAS CE QUE J'AI ÉCRIT. (D'ailleurs ma sauvegarde Time Machine principale est sur un Synology, mais pas en RAID). Donc je recommence:

ON NE DOIT PAS CONSIDÉRER LE RAID COMME UNE SAUVEGARDE. C'EST DE LA TOLÉRANCE DE PANNES ET CE N'EST PAS PAREIL.

Mais on peut avoir une sauvegarde à tolérance de pannes. Ca aussi je l'ai écrit, relis. C'est quand même chiant (et hélas commun) de constater que les gens lisent ce qu'ils ont envie de lire et pas ce qui est écrit. Bref.

baséli

Citation de: Stepbystep le Février 06, 2020, 20:12:30
Donc, ce  n'est pas parce que ton disque est dans une armoire que tu peux être sûr qu'il fonctionne encore ou que les données sont lisibles.

Ce n'est encore PAS ce que j'ai écrit. J'ai parlé de rotation de disques comme on fait de la rotation de bandes. Mes disques déportés servent l'un après l'autre, alternativement. Tu crois que parce qu'on est sur un forum photo on est un clampin dans les autres domaines? M'enfin...

egtegt²

Citation de: Stepbystep le Février 06, 2020, 14:28:08
Et qui qu'est-ce qui se passe si le jour où tu en as besoin, tu t'aperçois que les sauvegardes chez tes proches sont illisibles ? 

A quelle fréquence, tu vas vérifier qu'elles sont toujours lisibles ?
Si je le fais, j'aurai deux disques à deux endroits différents et je les vérifierai une fois par an à chaque fois que j'archiverai. Avoir deux disques à deux endroits différents stockés à l'arrêt qui sont illisibles en même temps le jour ou le disque de mon PC tombe en panne, c'est largement moins probable qu'une panne sur un RAID 5 qui fait perdre toutes les données ou même qu'un autre événement genre incendie ou vol.

Cela dit, quoi que je fasse, je n'arriverai jamais à une fiabilité à 100%, et si je devais perdre toutes mes photos, ça me ferait énormément chier mais j'y survivrais.

Et j'ai oublié de préciser : je ne parle que de tous mes raws, dans les faits j'exporte en jpeg dans un autre répertoire les photos intéressantes, celles-ci ne représentent que quelques dizaines de Go et elles sont copiées sur le cloud, donc si ça arrivait, je conserverais la version développée des photos intéressantes, ce qui est l'essentiel.

Et si le jour ou mes deux disques d'archives et mon PC perdent leurs données, Microsoft m'annonce qu'ils ont eu un problème technique et que mes photos sont perdues ... ben ça sera vraiment pas de chance  :-[ Mais alors vraiment vraiment pas !

egtegt²

Citation de: Zaphod le Février 06, 2020, 18:31:40
Perso, une sauvegarde délocalisée - en PLUS d'une sauvegarde locale - ça me semble être la base.
Après c'est chiant à faire... donc ça m'arrive de ne pas la faire assez souvent... et c'est dommage.

J'utilise :
1) une sauvegarde incrémentale locale automatique sur disque interne (ça sera sur un NAS le jour où j'aurais un réseau chez moi avec un débit correct). Ca permet de récupérer des effacements suite à erreur humaine, ou même une panne sur un disque local.
2) une sauvegarde complète sur un disque portable que je prends avec moi quand je pars de chez moi.
3) une sauvegarde complète délocalisée, avec disques tournants (sauvegarde N délocalisée, sauvegarde N-1 chez moi en attente de la N+1).

L'inconvénient du (2) et (3) étant que c'est ponctuel et non automatisé... c'est toujours plus efficace quand c'est automatique, mais pour du délocalisé, c'est plus compliqué.

Donc bref, c'est surement perfectible.

C'est pour ça qu'en général je conseille de faire une sauvegarde sur le cloud. Ca permet d'avoir une sauvegarde automatique très fiable. Et quand tu as une grosse quantité de données, de faire la sauvegarde sur le cloud pour la partie la plus vivante (en général les photos récentes) et de l'archivage rare délocalisé comme tu le fais.

Mais comme Stepbystep l'a fait remarquer, ça peut ne pas convenir à tout le monde, par exemple si comme lui tu reprends régulièrement d'anciennes photos. Si tu le fais rarement, il suffit de les déplacer dans la partie "vivante"

egtegt²

Citation de: Stepbystep le Février 07, 2020, 11:37:07
[...]

Quand au fait d'estimer que c'est plus fiable qu'un RAID 5, c'est une affirmation gratuite qui ne repose sur rien de valable. De mon côté, je ferai plus confiance à du RAID 5 qu'à stocker des disques quelque part sans avoir aucune visibilité sur leur contenu pendant un an.
Heu ... un peu quand même.
RAID5 : perte de données dans les cas suivants :
- Perte de trois disques (deux dans le RAID plus le disque primaire) dans un délai court,
- Problème logiciel du RAID qui provoque une corruption des données (en fait ça arrive plus souvent que la perte de deux disques)
- Problème matériel du système qui contrôle les disques du RAID qui provoque une corruption des données
- Tout étant en ligne en même temps, un ransomware est susceptible de corrompre les données de sauvegarde en même temps que les données primaires
Je ne parle que de problèmes que j'ai déjà vu arriver
- Evénement impliquant le disque primaire et les disques de sauvegarde (incendie, vol ...)

La solution que je décris : perte de données dans les cas suivants :
- perte de trois disques dont deux arrêtés dans un délai d'un an (personnellement, je n'ai jamais perdu de données sur un disque stocké à l'arrêt), sachant qu'il s'agit de disques à priori différents
- Je ne vois pas d'autre cas

Donc pour moi objectivement c'est plus fiable. La grosse différence, c'est que sur le RAID, les disques ont beaucoup de choses en commun, dans mon cas, ils sont totalement indépendants.

egtegt²

Je confirme pour Hitachi, il s'agit en fait de l'activité disque d'IBM qu'il ont rachetée il y a longtemps, et ils ont toujours été plus fiables que les Seagate.

Mais d'expérience, les pertes de données dues au matériel sont devenues de plus en plus rares. De ce que je constate, l'essentiel des pertes est dû à des erreurs humaines, en second viennent les bugs logiciels, les pannes matérielles sont loin derrière, en particulier en entreprise.

Si je suis si frileux au sujet des RAIDS, c'est que la plupart des pertes de données que j'ai rencontrées sur ce type de matériel n'étaient pas provoquées par des pannes de disque mais par des erreurs de manip ou des erreurs logicielles, même sur des grosses baies à plusieurs millions d'euros.

Un des cas les plus fréquents se passe lorsqu'on remplace un disque en panne. Soit parce que le logiciel est mal foutu soit parce que celui qui remplace le disque fait une erreur. Le cas classique, c'est de mal identifier le disque en panne et de retirer un disque qui fonctionne, du coup il te manque deux disques et certains matériels sont incapables de récupérer les données, même si on remet le disque en place.

Pour moi, quand tu perds un disque sur un RAID 5 pas cher, tu as au moins 10% de chances de perdre des données pour une des raisons ci-dessus.

Zaphod

Citation de: Stepbystep le Février 06, 2020, 23:48:22
Ah bon ? Alzheimer en plus ?
C'est marrant de se fritter pendant plusieurs pages juste une sur interprétation différente des phrases :)
Pour moi la phrase que tu cites ne dit pas qu'on ne peut pas utiliser un système de RAID pour faire une sauvegarde, mais que le principe du RAID n'est pas la sauvegarde (= il faut quand même dupliquer les données par ailleurs).

Zaphod

Citation de: egtegt² le Février 07, 2020, 11:21:07Cela dit, quoi que je fasse, je n'arriverai jamais à une fiabilité à 100%, et si je devais perdre toutes mes photos, ça me ferait énormément chier mais j'y survivrais.
Non, mais on diminue la chance d'avoir une perte de données en utilisant des systèmes totalement différents.
En utilisant un système qui a 1% de chance de perte, et un autre qui en a 2-3%, par exemple, on arrive à une probabilité de perdre ses données qui devient très faible.
(on a même plus de chance de disparaitre soi-même que ses données :) ).

Citation de: egtegt² le Février 07, 2020, 11:21:07Et j'ai oublié de préciser : je ne parle que de tous mes raws, dans les faits j'exporte en jpeg dans un autre répertoire les photos intéressantes, celles-ci ne représentent que quelques dizaines de Go et elles sont copiées sur le cloud, donc si ça arrivait, je conserverais la version développée des photos intéressantes, ce qui est l'essentiel.
Yep, c'est ce que je fais, sur google photos entre autres.
Ca permet de garder ses fichiers développés, prêts à l'emploi (ma femme y a accès aussi).
Si jamais je perds tout le reste, je serais dég d'avoir perdu mes RAW, mais j'aurais encore ça.
(sauf si je me fais cambrioler, voler mon PC, que le mec accède à mon google photos et qu'il supprime tout. Moralité faudrait que je "cloudise" ça ailleurs aussi. Ca ne prend pas tant de place que ça)

Citation de: egtegt² le Février 07, 2020, 11:25:31
C'est pour ça qu'en général je conseille de faire une sauvegarde sur le cloud. Ca permet d'avoir une sauvegarde automatique très fiable. Et quand tu as une grosse quantité de données, de faire la sauvegarde sur le cloud pour la partie la plus vivante (en général les photos récentes) et de l'archivage rare délocalisé comme tu le fais.
Moi je reprends souvent des anciennes photos, mais même si j'ai le déclencheur facile, j'arrive à 800 Go sur 15 ans de RAW (par contre je supprime définitivement entre 2/3 et 3/4 des photos quand je les trie).
Donc pas besoin d'avoir une partie non accessible.

En revanche j'ai un ADSL lent donc la sauvegarde cloud des RAW c'est totalement injouable.
Le jour où j'ai la fibre (dans moins d'1 an normalement...), par contre, ça me fera une sauvegarde supplémentaire.

jeandemi

perso, la majorité des disques que j'ai eu en panne sont des IBM... dans toutes les gammes (SCSI, IDE, SATA)
pratiquement un sur deux...  ::) :-\

puis les Maxtor (Quantum était assez fiable avant de se faire racheter par Maxtor) qui s'est fait manger par Seagate

Western est la marque avec laquelle j'ai eu le moins de souci

Zaphod

J'avoue que le graphique au-dessus ne donne pas envie d'acheter des seagate...
Est-ce qu'il y a des stats sur le taux de panne selon la gamme ?

Après ça date de 2013... ça laisse le temps à certaines boites de s'améliorer ou l'inverse... suffit de pas grand chose pour faire baisser le niveau de fiabilité...

zuiko

Citation de: Stepbystep le Février 09, 2020, 11:31:49
Backblaze produit régulièrement des statistiques sur les taux de pannes des disques et il y a régulièrement des gammes qui ont un taux de panne élevé chez Seagate. De mon côté, les DD qui sont tombés en panne étaient tous des Seagate. Du coup, j'évite cette marque maintenant (attention aux marques type maxtor, LaCie qui contiennent en fait des disques Seagate).

Je l'ai expérimenté également, seul disque tombé en panne avant obsolescence du PC : un Maxtor (donc Seagate), Aucuns problèmes avec tous les Western Digital que je privilégie depuis longtemps, y compris quand j'achète une machine toute équipée. (Je touche du bois, évidemment).

Zaphod

Citation de: Stepbystep le Février 09, 2020, 11:31:49
Backblaze produit régulièrement des statistiques sur les taux de pannes des disques et il y a régulièrement des gammes qui ont un taux de panne élevé chez Seagate. De mon côté, les DD qui sont tombés en panne étaient tous des Seagate. Du coup, j'évite cette marque maintenant (attention aux marques type maxtor, LaCie qui contiennent en fait des disques Seagate).
Ouais, en gros ça laisse Western Digital :)
Par contre en général j'essaie d'avoir des marques différentes pour les disques de travail et de sauvegarde ou pour les disques durs en rotation (au moins des modèles différents, pour éviter une mauvaise série).
Dans mon PC actuel, j'ai principalement des Seagate (hors SSD), mais faut que je les change car certains sont vieux et saturés.

En tous cas celui qui avait claqué il y a 3 ans était un Seagate :)
Par contre le disque portable 2"5 que j'ai perdu était un WD Passport (qui a été changé sous garantie, mais forcément, les données restent perdues)

Laurent-421

Hello,

faites attention au RAID 5 et 6 sur gros disque dur. La probabilité de ne jamais pouvoir reconstruire le tableau sur des gros disques dur est bien réelle. Voici un outil permettant de calculer la probabilité de reconstruire (ou pas son tableau) : https://wintelguy.com/raidmttdl.pl . Quelques explications simples ici : http://raidtips.com/raid5-ure.aspx .

Concernant le backup, les bonnes pratiques sont d'avoir 3 copies des données à des endroits si possible différents. Dans mon cas :
- l'ensemble de mes PC sont sauvegardés tous les jours sur un NAS (4 disques en RAID 5 de 2To chacun). La sauvegarde est incrémentale et à ce jour sans limitation de durée (ça fait 2 ans que ça tourne). Je pense pruner les sauvegardes plus vieilles que 2 ans, j'ai pas statué encore :-)
- le NAS fait une sauvegarde quotidienne vers backblaze b2 (qui est le fournisseur le moins cher que j'ai trouvé) de la dernière sauvegarde du jour. Cette sauvegarde est chiffrée en locale, dédupliquée en local et envoyé sur le cloud. La politique de rétention est : les 7 derniers jours, tous les mois.

4TiO sont sauvegardés tous les jours, avec la dédup, ça pèse à ce jour 2TiO sur backblaze.

En cas de vol de l'ensemble de mon matériel ou un incendie, la clé de chiffrement de la sauvegarde sur le cloud ainsi que le mot de passe de mon compte backblaze sont écrit sur papier (sous forme de QRCode) que je conserve au bureau.

Laurent

Laurent-421

Citation de: Stepbystep le Février 11, 2020, 00:11:47
10 To chez Bakblaze => 50 euros par mois, soit 600 euros par an à multiplier par 20, 30, 40 ans, ... ?.  ;D ;D ;D

C'est le problème des couts récurrents. Internet avec Orange & Netflix me coute 70e / mois, mon serveur dédié chez OVH m'en coute 25, l'assurance de la voiture 125, etc etc ... Si tu multiplies tout par 12 et par 40 (ton reste à vivre estimé ?  ;D ), tu n'achètes plus rien de récurrent ...

egtegt²

Citation de: Stepbystep le Février 11, 2020, 00:11:47
Sans être naïf sur la fiabilité des solutions, il ne faut pas non plus tomber dans la parano. Un RAID 5 en tant que disques de travail doit être sauvegardé. Si le raid 5 sert lui-même de sauvegarde, il faut juste s'assurer qu'il est en état de fonctionnement.

Comme dèjà dit plusieurs fois :
- mixer les DD afin d'avoir des DD de différents lots et marques afin d'éviter des probabilités similaires de panne au même moment.
- Prendre des DD spécifiques NAS et non pas des DD classiques.
- Eviter les Seagate.

10 To chez Bakblaze => 50 euros par mois, soit 600 euros par an à multiplier par 20, 30, 40 ans, ... ?.  ;D ;D ;D

Dans les faits, un disque a rarement une durée de vie de plus de 10 ans, et si tu veux faire les choses bien, il t'en faut au moins deux. Ca ne coûtera pas 6000 € mais une fraction non négligeable quand même.

Sinon OVH offre un archivage cloud à 0,001 €/mois/Go, ça fait seulement 10 € par mois pour 10 To, plus 100 € de frais de transfert une fois. (en fait 12 € par mois et 120 € car c'est du HT) Par contre ça n'est pas aussi simple d'utilisation qu'un Drive Google ou Microsoft, c'est à toi de lancer les copies manuelles de tes données. Mais à 150 € par an en gros, ça me semble difficile de faire mieux en achetant soi-même le matériel.

Zaphod

Ah oui ça a pas mal augmenté les prix du stockage cloud...

zuiko

Citation de: Stepbystep le Février 11, 2020, 00:11:47
10 To chez Bakblaze => 50 euros par mois, soit 600 euros par an à multiplier par 20, 30, 40 ans, ... ?.  ;D ;D ;D

Pour éviter les coûts récurrents, et pour des besoins un peu plus modestes il y a aussi l'offre suisse Pcloud :
2To à vie (99 ans) pour 350 € (et il y a régulièrement des promos)
https://www.pcloud.com/fr/lifetime/

Et pour tester, ils ont une offre gratuite de 10G0

Laurent-421

Citation de: egtegt² le Février 11, 2020, 10:02:33
Sinon OVH offre un archivage cloud à 0,001 €/mois/Go, ça fait seulement 10 € par mois pour 10 To, plus 100 € de frais de transfert une fois. (en fait 12 € par mois et 120 € car c'est du HT) Par contre ça n'est pas aussi simple d'utilisation qu'un Drive Google ou Microsoft, c'est à toi de lancer les copies manuelles de tes données. Mais à 150 € par an en gros, ça me semble difficile de faire mieux en achetant soi-même le matériel.

Concernant le stockage, OVH m'a vacciné avec HubiC.

Laurent

Laurent-421

Citation de: Stepbystep le Février 11, 2020, 12:25:33
Sachant qu'aujourd'hui, on n'a aucune idée de ce qui se passera si un hébergeur fait faillite.

La même chose que lorsque 2 disques de ton RAID 5 tombent en panne. Tu restaures les sauvegarde. Ou si ton RAID 5 était la sauvegarde, et bien tu relances les sauvegarde depuis les emplacement d'origine  ;)

Dans mon cas, si blackbaze fait faillite, j'en trouve un autre et je configure mon NAS pour qu'il sauvegarde chez le nouveau. Tout simplement.