[OSM-Bayern] Prüfen von Links an OSM Objekten in München mit OSM-Link-Validator (OLV)

Sven Fischer lists.openstreetmap.de at linux4tw.de
So Sep 11 17:58:23 CEST 2022


Hallo zusammen,

anbei eine kurze Info zu dem Tool, das ich auf dem letzten Münchner 
Stammtisch gezeigt hatte. Das heißt OSM-Link-Validator oder kurz OLV.

Eine kurze Erklärung dazu: OLV funktioniert so, dass für das Gebiet von 
München eine Overpass-Abfrage gestellt wird, die nach OSM-Objekten mit 
den Keys contact:website, url und website sucht. Die URLs dieser 
OSM-Objekte werden einzeln geprüft und das Ergebnis der Analyse ist die 
lange, aber sortier- und filterbare Tabelle unter: 
https://osm.strubbl.de/olv/minga.html (Achtung: ca. 5 MB Daten, das 
könnte ordentlich Last im Browser geben)

Nicht jede Zeile dieser Tabelle sollte eine Änderung in OSM werden. 
Manchmal werden Seiten auch sinnvoll umgeleitet. Das Gros der Zeilen 
sind eben auch URLs, die einen HTTP-Status im 300er-Bereich 
zurückliefern. Allgemein sollte man jede Zeile einzeln bewerten, ob eine 
Änderung in OSM sinnvoll ist.

Die Links zu iD bzw. JOSM fügen automatisch einen Changeset-Kommentar 
und Changeset-Hashtag hinzu. Den Hashtag könnte man evtl. später nutzen, 
um herauszufinden, wie viele Änderungen aufgrund dieses Tools gemacht 
werden sind.

Unter der Tabelle gibt es ein paar Statistiken rund um die Analyse und 
einen Link zum Quellcode. Unter dem Link für den Quellcode gibt es in 
der Readme.md eine Anleitung, wie man die Analyse auch selber lokal 
laufen lassen kann für ein selbst gewähltes Gebiet. Die Readme erklärt 
auch, was die einzelnen Spalten bedeuten.

Für München dauert die Analyse von ca. 12500 Links ca. 2,5h, weil alle 
Links in Reihe geprüft werden. Die Analyse läuft bei mir in der Regel 
täglich einmal. Ausnahmen bestätigen die Regel. :)

Im Moment gibt es keine Möglichkeit falsche Treffer (false positve), 
z.B. Timeouts oder Websites mit DigiCert Zertifikat, als solche zu 
markieren. Da fehlt mir noch Idee, wie ich das einfach und gescheit 
umsetzen kann, dass man damit wenig Adminaufwand hat und ohne größere 
Abhängigkeiten hinzu zu fügen.

Falls ihr das Tool nutzen mögt, um die Situation mit Websites in München 
zu verbessern, viel Spaß. Feedback gerne hier per Mail, per PN auf 
OSM.org oder beim Stammtisch.


Viele Grüße
Sven


Mehr Informationen über die Mailingliste Bayern