Tote Links in alten Beiträgen

Ich habe im Zuge von ein paar Hosting Umstellungen vor allem meine alten Webseiten mal wieder angefasst. Bei meinem alten Blog wollte ich mich nicht mehr darum kümmern müssen das die Artikel online bleiben und dachte mir wieso die nicht auf Github Pages lagern.
Der Vorteil war schon klar, der Blog war eh mit jekyll gebaut und Github würde den umsonst hosten. Beim Umbau kam mir gleich die Idee mal was mit Travis CI zu machen und htmlproof zu benutzen. Das Ergebnis war interessant, htmlproof testet auch externe Links auf Erreichbarkeit. Viele Fehler kamen nun daher das die verlinkte Seite nicht mehr verfügbar war. Schon ein kleiner Schock, viele Beiträge ergaben nun keinen Sinn mehr, oder der komplette Kontext war verloren gegangen. Ein nicht wirklich tragbarer Zustand, aber was tun?
Es gibt nun ein paar Möglichkeiten, die einfachste wäre das einfach zu ignorieren und sagen ist dann halt so. Aber das wäre nichts für mich. Ich habe schon einen gewissen Anreiz das erstens der htmlproof Aufruf keine Fehler auswirft und zweitens das meine alten Beiträge wenigstens minimal korrekt/nützlich sind.  Nun, damit war meine Wahl klar, ich versuchte zu retten was zu retten ist. Also auf archive.org mal schnell geschaut welche Seiten die im Cache haben. War leider nicht so viel wie ich gehofft hatten. Ein paar haben ihre Seiten so umgebaut oder Artikel gelöscht und sie so weiter geleitet das es nur ein „not-found“ in das archive geschafft hat. Habe also die Links auf meiner alten Seite so gut es geht auf snapshots von archive.org verlinkt und den Rest halt als Tod markiert. Schade.

Was ist aber nun die Konsequenz des ganzen. Außer das ich ein paar Euro in Richtung archive.org gepumpt habe. Nun, die Antwort habe ich nach etwas Googlen gefunden. Amber, ein Archive zum selber Hosten (leider closed beta, Email ist raus, mal abwarten). Ich fand die Idee sehr charmant. Wenn ich also einen neuen Artikel hier in mein WordPress haue, dann zieht sich Amber ein aktuellen snapshot und speichert den.  Das baut also ein eigens kleines Archive aller Links auf und wenn dann einer mal verschwindet bietet Amber den interessierten automatisch den gespeicherten snapshot an. Leider löst es natürlich nicht mein Problem mit dem schon verlorenen Kontext. Aber zumindest würde es ein Zukünftiges Problem lösen. Ich habe nach einer Kurzen Recherche festgestellt das fast 20% der Links die ich gespeichert habe, nicht mehr wirklich erreichbar sind. Es gibt also einen gewissen Verfall an Informationen und Wissen im Netz. Das betrifft besonders ältere Links. Was natürlich ein großes Problem darstellt wenn man eine Quelle lesen will auf die ich verweise, sie es aber nicht mehr gibt und meine Meinung damit ohne Kontext quasi frei steht. Persönlich glaube ich das diese Problem in den nächsten Jahren auch noch zu nimmt. Nicht jeder hat den Anspruch oder gar die Fähigkeiten alles was er selbst ins nett an Seiten gebaut hat für immer weiter zu betreiben. Mein alter Blog läuft auch nur noch, gerade weil ich selbst den Anspruch an mich habe und es github pages es einen einfach macht.

Als Fazit muss ich sagen das gerade Projekte wie archive.org und Amber immer wichtiger werden im Kampf gegen das Digitale Vergessen, denn auch das Internet kann vergessen es dauert halt etwas länger.