Project Description
Für das geologische Archiv des Bundesamtes für Landestopografie (swisstopo) hat soom-it eine Lösung zur Verarbeitung von retrodigitalisierten Mikrofilm-Fichen konzipiert und umgesetzt. Unsere Softwarelösung basiert auf einem OpenStack-Cluster, welcher ein Hadoop-Cluster betreibt. Unsere Hadoop-Pipeline hat die Verarbeitung der Daten, die manuell mehrere Jahre in Anspruch nehmen würde, auf ein paar Tage verkürzt.
Kunde
Bundesamt für Landestopografie swisstopo
Herausforderungen
- Grosse Sammlung an digitalen Fichen in der Form von riesigen Bildern mittels eines Tools zerlegen.
- Datenhaltung in der Schweiz.
- Datenmenge auf Standardrechner nicht verarbeitbar.
Lösungen
- Bau eines kleinen Servers zur parallelen Verarbeitung der Daten.
- Tool, welches automatisch aus grossen Bildern PDFs mit Einzelseiten erstellt.