[OSM in MV] Prüfen von URLs der OSM Objekte in MV mit dem Tool OSM-Link-Validator (OLV)
Sven Fischer
lists.openstreetmap.de at linux4tw.de
Fr Dez 2 16:49:25 CET 2022
Moin *,
liest hier noch jemand mit? Es ist ganz schön ruhig hier.
Heute möchte ich euch mein Tool vorstellen, das ich seit ein paar
Monaten betreibe. Das heißt OSM-Link-Validator oder kurz OLV.
OLV funktioniert so, dass für das Gebiet von MV (Relation 28322) eine
Overpass-Abfrage gestellt wird, die nach OSM-Objekten mit den Keys
contact:website, url, website, usw. usf. sucht[0].
Die URLs dieser OSM-Objekte werden einzeln geprüft und das Ergebnis der
Analyse ist eine lange, aber sortier- und filterbare Tabelle unter [1].
Achtung: ca. 8 MB Daten, es könnte ordentlich Last im Browser geben.
Jede Zeile der Tabelle zeigt ein potentielles Problem mit der getaggten
URL an. Aber nicht jede Zeile dieser Tabelle sollte eine Änderung in OSM
werden. Manchmal werden Seiten auch sinnvoll umgeleitet. Das Gros der
Zeilen sind eben auch URLs, die einen HTTP-Status im 300er-Bereich
zurückliefern. Allgemein sollte man jede Zeile einzeln bewerten, ob eine
Änderung in OSM sinnvoll ist.
Es gibt Bearbeitungs-Links für iD und JOSM. Nicht wundern: Diese Links
fügen automatisch einen Changeset-Kommentar und Changeset-Hashtag hinzu.
Den Hashtag könnte man nutzen, um herauszufinden, wie viele Änderungen
aufgrund dieses Tools gemacht worden sind. Ansonsten kann der
Kommentar/Hashtag selbstverständlich der gemachten Änderung angepasst
oder ganz entfernt werden.
Für die Visualisierung gibt es auch eine Leaflet-basierte Kartenansicht
unter [2]. Achtung, auch diese Website ist auch groß (~ 10 MB). Der
Landkreis VR war mein bisheriges Testgebiet und ist daher schon etwas
ausgedünnt bzgl. fehlerhafter URLs.
Die Auswertung läuft einmal täglich und dauert für die Analyse der fast
17.000 URLs fast 4 h. Um die 7000 getaggte URLs in MV haben derzeit
evtl. ein Problem.
Die Auswertung für MV läuft erst seit zwei Tagen. Nach ein paar Tagen
mehr kommen Statistikfreunde auch auf ihre Kosten durch die
Diagrammansicht in [3].
Für München läuft so eine Analyse schon etwas länger, siehe [4] und dort
im Dropdown-Menü die Anzahl der Tage auf "All" setzen. Die Erfahrung mit
der Nutzung des Tools zeigt, dass man damit ganz gut Geschäfte, die
nicht mehr existieren, findet.
Der Quellcode des Tools ist auch einsehbar [5] und man könnte das Tool
auch lokal bei sich zB. für ein kleineres Gebiet laufen lassen. Wie das
geht, ist auch auf der Seite beschrieben.
Im Moment gibt es schon eine Möglichkeit falsche Treffer (false
positives), z.B. Websites mit DigiCert Zertifikat oder Websites hinter
einem CDN, als solche zu markieren und damit in der Auswertung
auszublenden. Das erfolgt aber bisher manuell durch mich durch die
Pflege von Dateien wie z.B. der Ignorierliste in [6].
Falls ihr das Tool nutzen mögt, um die Situation mit Websites in MV zu
verbessern, viel Spaß. Feedback gerne hier per Mail, per PN an Strubbl
auf OSM.org oder auf Codeberg [5].
Viele Grüße
Sven
[0] https://codeberg.org/strubbl/osm-link-validator#used-openstreetmap-keys
[1] https://osm.strubbl.de/olv/table-3600028322.html
[2] https://osm.strubbl.de/olv/map-3600028322.html#9/53.8549/13.1177
[3] https://osm.strubbl.de/olv/chart-3600028322.html
[4] https://osm.strubbl.de/olv/chart-3600062428.html
[5] https://codeberg.org/strubbl/osm-link-validator
[6]
https://codeberg.org/strubbl/osm-link-validator/src/branch/main/ignorelist.json
Mehr Informationen über die Mailingliste MeckPomm