- Beiträge: 9
Adressaufbereitung von chaotischem Datenbestand
- Rabe
- Autor
- Offline
- Benutzer
Weniger
Mehr
8 Jahre 1 Woche her #2934
von Rabe
Adressaufbereitung von chaotischem Datenbestand wurde erstellt von Rabe
Hallo zusammen,
ich habe eine chaotische Adressliste (alles in einem Feld und ohne logische Struktur) und muss diese in Spalten (Name, Straße, Ort, etc.) zerlegen. Klar ist mir schon, dass sich das nur über Script-Code verarbeiten lässt. Ich finde jedoch keinen logischen Ansatz und freue mich daher über jeglichen Input wie ich hier vorgehen kann, bzw. ob sich eine maschinelle die Abarbeitung überhaupt darstellen lässt. Die finale Liste umfasst ca. 7.000 Adressen.
Anbei ein Beispiel der Ausgansdatei. Danke für Input.
ich habe eine chaotische Adressliste (alles in einem Feld und ohne logische Struktur) und muss diese in Spalten (Name, Straße, Ort, etc.) zerlegen. Klar ist mir schon, dass sich das nur über Script-Code verarbeiten lässt. Ich finde jedoch keinen logischen Ansatz und freue mich daher über jeglichen Input wie ich hier vorgehen kann, bzw. ob sich eine maschinelle die Abarbeitung überhaupt darstellen lässt. Die finale Liste umfasst ca. 7.000 Adressen.
Anbei ein Beispiel der Ausgansdatei. Danke für Input.
Anhänge:
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
- FlowHeater-Team
- Offline
- Administrator
8 Jahre 1 Woche her #2939
von FlowHeater-Team
gruß
Robert Stark
Wurde Ihre Frage damit beantwortet? Bitte geben Sie ein kurzes Feedback, Sie helfen damit auch anderen die evtl. ein ähnliches Problem haben. Danke.
FlowHeater-Team antwortete auf Adressaufbereitung von chaotischem Datenbestand
Hallo Herr Rabe,
das wird auf jeden Fall schwierig eine 100%ige Lösung wird es dafür nicht geben, auch nicht per Skripte über den .NET Script Heater .
Ich würde eher einen anderen Weg einschlagen. Zuerst einmal den Feldinhalt in Spalten bringen. Hierzu habe ich Ihnen mal ein Beispiel erstellt, dass aus der Excel Liste eine CSV Datei erstellt in der der Inhalt pro Excel Zelle in Spalten aufgeteilt wird.
Wenn Sie sich nun die Ausgabe ansehen können Sie hier schon Muster erkennen anhand Sie die einzelnen Werte weiter bearbeiten können.
z.B. Fällt auf, dass wenn in der 5 CSV Spalte „Deutschland“ oder „France“ steht die Adresse gleich aufgebaut ist. Dann können wahrscheinlich CSV Datensätze bei denen lediglich 3 bzw. 4 Spalten befüllt sind ebenfalls relativ eindeutig einer Adresse zugeordnet werden, usw.
Verarbeitung) Pro Muster benötigen Sie eine FlowHeater Definition die einmal nur die gerade benötigten Dateien bearbeitet, der REST muss gefiltert werden. Im Anschluss müssen die verarbeiteten Datensätze aus der Ursprünglichen CSV Datei entfernt werden, damit diese in einem weiteren Durchgang nicht noch einmal verarbeitet werden. Aus diesem Grund wurde im Beispiel oben ein Datensatzzähler über den AutoID Heater eingefügt.
Im Anhang finden Sie ein weiteres Beispiel wie Sie z.B. nur Datensätze bei denen lediglich die ersten 3 Spalten befüllt sind verarbeiten und dann anschließend die ursprüngliche CSV Datei um diese Datensätze verkleinert.
das wird auf jeden Fall schwierig eine 100%ige Lösung wird es dafür nicht geben, auch nicht per Skripte über den .NET Script Heater .
Ich würde eher einen anderen Weg einschlagen. Zuerst einmal den Feldinhalt in Spalten bringen. Hierzu habe ich Ihnen mal ein Beispiel erstellt, dass aus der Excel Liste eine CSV Datei erstellt in der der Inhalt pro Excel Zelle in Spalten aufgeteilt wird.
Wenn Sie sich nun die Ausgabe ansehen können Sie hier schon Muster erkennen anhand Sie die einzelnen Werte weiter bearbeiten können.
z.B. Fällt auf, dass wenn in der 5 CSV Spalte „Deutschland“ oder „France“ steht die Adresse gleich aufgebaut ist. Dann können wahrscheinlich CSV Datensätze bei denen lediglich 3 bzw. 4 Spalten befüllt sind ebenfalls relativ eindeutig einer Adresse zugeordnet werden, usw.
Verarbeitung) Pro Muster benötigen Sie eine FlowHeater Definition die einmal nur die gerade benötigten Dateien bearbeitet, der REST muss gefiltert werden. Im Anschluss müssen die verarbeiteten Datensätze aus der Ursprünglichen CSV Datei entfernt werden, damit diese in einem weiteren Durchgang nicht noch einmal verarbeitet werden. Aus diesem Grund wurde im Beispiel oben ein Datensatzzähler über den AutoID Heater eingefügt.
Im Anhang finden Sie ein weiteres Beispiel wie Sie z.B. nur Datensätze bei denen lediglich die ersten 3 Spalten befüllt sind verarbeiten und dann anschließend die ursprüngliche CSV Datei um diese Datensätze verkleinert.
gruß
Robert Stark
Wurde Ihre Frage damit beantwortet? Bitte geben Sie ein kurzes Feedback, Sie helfen damit auch anderen die evtl. ein ähnliches Problem haben. Danke.
Anhänge:
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
Ladezeit der Seite: 0.268 Sekunden