[halLEipzig] Datenqualität in OSM

Maik Seyring maik at seyring.org
Fr Jun 8 15:46:03 CEST 2012


Am 8. Juni 2012 14:41 schrieb Fabian Schmidt
<fschmidt at informatik.uni-leipzig.de>:

> es ist leichter, neue Daten zu finden, als dass zu löschende auffallen. Es
> gibt Validierungen für Straßen, Bibliotheken, ... aber mit ist keine für
> Apotheken bekannt.

Apotheken stehen hier lediglich als Beispiel. Ich möchte eine Vielzahl
an unterschiedlichen POI nutzen.

>> Ich spiele gerade mit dem Gedanken auf die places api von google zu
>> wechseln.
> Wie funktioniert eigentlich die Moderation der Ortsberichtsanfragen? Wie
> wird überprüft und wie lange dauert die Überprüfung?

Keine Ahnung wie genau das Google handhabt, ist aber auch nicht so
sonderlich relevant für mich, da die beantragten POI direkt für die
meldende Anwendung verfügbar sind, auch nachdem die eventuell
abgelehnt wurden. Diese Spots halte ich dann auch in meiner eigenen
Datenbasis vor.

>> Vielleicht mache ich ja aber auch etwas falsch. Bleiben invalide nodes
>> im Datenbestand und werden nur als invalid markiert, oder werden sie
>> komplett entfernt?
> Es gibt sowohl falsche Daten als auch als invalid markierte Daten, z.B. mit
> http://wiki.openstreetmap.org/wiki/Key:disused
> Das sollte aber direkt aus den Daten hervorgehen, zumindest, wenn man als
> Mensch draufschaut.

Wie ich das wiki verstehe werden als falsch (oder nicht mehr richtig)
erkannte Daten nicht entfernt, sondern verbleiben als "disused" im
Datenbestand.
Leider (aus Sicht des Datennutzers) scheint ja jeder alles taggen zu
können, wie er es möchte, das stellt für mich die größte
Herausforderung dar.

Dann werde ich noch mal ein Bisschen an meinem "extractor" arbeiten
und jede Zeile xml zusätzlich nach disused scannen.

Hat jemand noch schnell andere tags parat, die auf invalide Daten
hindeuten außer "fixme" und  "disused"?

> OSM steht Eintragungen, die nicht an den Nutzeraccount des Eintragenden
> gebunden sind, eher skeptisch gegenüber.

Das ist schade, denn mit einfacheren Tools oder in andere Anwendungen
eingebundene "Dtanerfassungsmechanismen" ließen sich sicherlich auch
eine Menge Leute dazu animieren, einen Beitrag zu leisten.

Ich hatte mir es so vorgestellt, dass die Daten erst an OSM gehen wenn
sie eine gewisse Zahl an "Unterstützern" gefunden haben, Quasi eine
Validierung vor Eintragung in OSM. (wobei ich gerade feststelle, dass
die Daten dann ja an OSM und an google gehen könnten).

Beste Grüße

Maik