Wertvolle Tips für die Programmierer der
Post-Leitcodierung
Was ist das Problem der Postleitcodierung ?
Basis ist eine Textdatei der Post mit 1,3 Millionen
Strassen, 90000 Orten, 43000 Postleitzahlen, 20000 Ortsteilen und 17000 Eintragungen
über umbenannte, archivierte oder anderen Orten zugeordnete Strassen. Das
Problem besteht darin, diese Datei zunächst überhaupt auswertbar zu gestalten.
Danach muß zu einer gegebenen Adresse genau der für diese Strasse und
Hausnummer passende Code ermittelt werden. Die Problematik: Dorfstr. 23684
Scharbeutz gibt es fünf mal, die Kastanienallee in Berlin 18 Mal, zu einigen
Postleitzahlen gibt es bis zu 18 Orte die meisten haben eine Dorfstrasse, viele
davon sind mittlerweile umbenannt. Die
meisten Strassen haben bestimmte Hausnummernbereiche mit eigenen Leitcodes.
Hausnummern über 1000 müssen eine Spezialbehandlung erfahren. Außerdem zu
berücksichtigen : die verschiedensten Schreibweisen z.B. von
"Bürgermeister Johann Hinrich von Wiechern Allee" und die Ermittlung
von Hausnummern z.B. aus "Strasse des 13. Januar 12-14 a Block 4
Eingang 3"
Aus alldem muß genau der eine richtige Code ermittelt
werden, ohne einen falschen Code zu treffen.
Und: 1,3 Millionen Strassen mit 10 verschiedenen
Schreibweisen zu durchsuchen bedeutet 13 Millionen Datensätze auszufiltern (Die
90000 Ortsdatensätze lassen wir mal weg)
Unser Algorithmus schafft das im Schnitt in 0.6 Sekunden
und ist damit der schnellste, derzeit verfügbare Leitcodealgorithmus (das sagen unsere Kunden)
Zur Programmierung der Leitcodierung der Post sind außerdem folgende Sonderfälle bei der Entwicklung des Algorithmusses nicht unbedingt von vornherein ersichtlich.müssen jedoch unbedingt korrekt behandelt werden, da es sonst zu fehlgeleiteten Paketen kommt :
Viele Adressen sind mehrdeutig :
z.B. Dorfstrasse 23684 Scharbeutz gibt es 5 mal in verschiedenen Ortsteilen (nur nicht in Scharbeutz)
Bei korrektiver Ergänzung des Zusatzes "WEG" , falls dieser fehlt :
Es gibt die Strasse
Birken in 53797 Lohmar (OT Scheid)
Und
Birkenweg in 53797 Lohmar (OT Lohmar)
Bei Korrektur Zahlendreher in Plz:
Es gibt die Strassen
Hauptstr. In 66132 Saarbrücken
und
Hauptstr. In 66123 Saarbrücken
Es gibt die Adresse
Hauptstr. In 67125 Dannstadt-Schauenheim
Wird nur ein Ort eingegeben, besteht die Gefahr eines Links auf eine umbenannte Strasse, die dann auf 67152 Ruppersberg verweist, wenn statt des vollen Ortsnamens nur Dannstadt oder nur Schauenheim eingegeben/gesucht wird.
Der Steinbachweg 2 in 04509 Radefeld ist archiviert, zeigt als neue Strasse jedoch auf sich selbst. Es gibt lediglich eine Änderung im Feld Alort, das jetzt statt auf Radefeld auf Leipzig zeigt.
Dorfsr. 17498 gibt es in neunzehn verschiedenen Orten – einige mit Mehrfachnennungen :
Einige dieser
Einträge wurden umbenannt, z.t. anderen Orten zugeordnet :
Mehrere Möglichkeiten, jedoch dennoch codierbar :
Wird die Thomas-Müntzer-Str. 06184 Raßnitz ohne Hausnummer eingegeben, so gibt es
zwei verschiedene Einträge – normalerweise ein Grund nachzufragen – in diesem Fall beinhalten die Einträge jedoch denselben Strassencode und sind deshalb codierbar.
Umbenennung Schulstr.1 08427 Fraureuth
es gibt: Schulstr. 08427 Fraureuth OT Gospersgrün
und : Schulstr -> umbenannt in alte Schulstr in 08427 Fraureuth OT Fraureuth
Hier muß das Programm nachfragen
Ortsschreibweisen :
Bad Grund, Harz (Ortszusatz im Ortsnamen – wird so nicht gefunden)
Weißig a Raschütz (dto)
Scharbeutz / Klingberg (Klingberg ist Ortsteil)
Klingberg (hier muß erst der Hauptort Scharbeutz ermittelt werden)
Zur Leitcodierung muß
die Hausnummer aus der Strasse extrahiert werden – bitte berücksichtigen Sie :
An der B75 12 Hausnr 12
An der A 1 ohne Hausnummer
M1 oder M 1 ohne Hausnummer (M1; M2, G1, G2 ...
sind Planquadrate in Mannheim)
1853er Strasse ohne Hausnummer
1. Querstrasse ohne Hausnummer
Strasse des 13. Januar ohne Hausnummer
Klgv 150 pz 1168 Hausnummer 1168
Straße des 20. Juli 8-10 a Block 4 Eingang 3 Hausnummer 8
Dies sind nur einige Auszüge der spezielleren Probleme, die zunächst nicht ersichtlich sind. Hinzu kommen natürlich Ähnlichkeitsalgorithmen, welche die unterschiedlichsten Schreibweisen und Abkürzungen berücksichtigt Können Sie sich die möglichen Abkürzungen zu Bürgermeister-Johann-Hinrich-von-Wiechern-Allee vorstellen ? Die Kunst ist hierbei nicht, so viele Codes wie möglich zu finden, sondern zu verhindern, daß über die Korrektur falsche Adressen codiert werden. (Gleschendorf, Geschendorf, Beschendorf nur zwei haben eine Dorfstrasse)
Alle Probleme müssen für maximal 1.498,- gelöst werden, denn
das kostet unser komplettes Leitcodemodul, das sich in jede
Windows-Programmierung direkt integrieren läßt. Download über www.paketpartner.de
Kontakt:
Bucko Versandsysteme
Kamperdahl 9
23738 Lensahn
T: 04363-901324
F: 04363-901307