- Beiträge: 132
Steuerzeichen im Read entfernen
- Ralf Birk
- Autor
- Offline
- Benutzer
Weniger
Mehr
4 Jahre 4 Monate her #3980
von Ralf Birk
Steuerzeichen im Read entfernen - Beitrag(3980) wurde erstellt von Ralf Birk
Hallo Robert,
ich habe immer mal wieder den Fall, das sich in Textdateien, die ich von Kunden bekomme Steuerzeichen befinden, die meine Datenstruktur schon beim Import in den Flowheater total zerschießen. Im Moment öffne ich diese "Problemfälle" vorab in Excel und wende hier den "Säubern" Befehl an.
Danach lassen sich die Daten gut mit dem FH verarbeiten.
Gibt es eine Möglichkeit Sonderzeichen (Dez 0 - 31 und 127) schon im Read-Adapter zu eliminieren?
Sollte dies funktionieren würde ich diese Option gerne defaultmäßig aktivieren, da bei zig-tausenden Datensätzen einige wenige "verschobene" nicht auffallen. Diese "Zerschossenen" Datensätze können aber schwerwiegende Fehler bzw. Kosten nach sich ziehen.
Gibt es aus deiner Sicht einen Lösungsweg?
Gruß Ralf
ich habe immer mal wieder den Fall, das sich in Textdateien, die ich von Kunden bekomme Steuerzeichen befinden, die meine Datenstruktur schon beim Import in den Flowheater total zerschießen. Im Moment öffne ich diese "Problemfälle" vorab in Excel und wende hier den "Säubern" Befehl an.
Danach lassen sich die Daten gut mit dem FH verarbeiten.
Gibt es eine Möglichkeit Sonderzeichen (Dez 0 - 31 und 127) schon im Read-Adapter zu eliminieren?
Sollte dies funktionieren würde ich diese Option gerne defaultmäßig aktivieren, da bei zig-tausenden Datensätzen einige wenige "verschobene" nicht auffallen. Diese "Zerschossenen" Datensätze können aber schwerwiegende Fehler bzw. Kosten nach sich ziehen.
Gibt es aus deiner Sicht einen Lösungsweg?
Gruß Ralf
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
- FlowHeater-Team
- Offline
- Administrator
4 Jahre 4 Monate her #3981
von FlowHeater-Team
gruß
Robert Stark
FlowHeater-Team antwortete auf Steuerzeichen im Read entfernen - Beitrag(3981)
Hallo Ralf,
nicht druckbare Sonder- bzw. Steuerzeichen können aktuell nicht direkt über den TextFile Adpater auf der READ Seite entfernt werden. Die Zeilen/Spalten müssen gelesen werden um Sie dann im FlowHeater bearbeiten zu können.
Der TextFile Adapter kann diese nicht druckbaren Sonder-/Steuerzeichen aber problemlos lesen und auch den definierten Spalten zuordnen, lediglich die Anzeige im Konfigurator könnte etwas verschoben aussehen, falls nicht druckbare Sonder- bzw. Steuerzeichen vorhanden sein sollten. ggf. stimmt aber auch die ausgewählte Codepage nicht?
Was du tun kannst ist folgendes. Du erstellst Dir eine FlowHeater Definition, oder einen vorgelagerten Verarbeitungsschritt. Hier liest du eine komplette Zeile der CSV Datei in ein Feld im FlowHeater ein und schickst das Feld durch unten aufgeführtes C# Skript für den .NET Script Heater .
Wie das einlesen einer kompletten CSV Zeile in eine Spalte geht wird näher in folgenden Artikel beschrieben: Berechneten Wert an Write-Datei anhängen
Das C# Skript entfernt dann alle nicht druckbaren Sonder- bzw. Steuerzeichen aus dem Inhalt. Im Anschluss kannst du dann deine ganz normale Verarbeitung über die neu geschrieben CSV Datei laufen lassen.
Im Anhang findest Du ein kleines Beispiel dazu.
C# Skript um nicht druckbare Steuerzeichen aus Zeichenkette zu entfernen
nicht druckbare Sonder- bzw. Steuerzeichen können aktuell nicht direkt über den TextFile Adpater auf der READ Seite entfernt werden. Die Zeilen/Spalten müssen gelesen werden um Sie dann im FlowHeater bearbeiten zu können.
Der TextFile Adapter kann diese nicht druckbaren Sonder-/Steuerzeichen aber problemlos lesen und auch den definierten Spalten zuordnen, lediglich die Anzeige im Konfigurator könnte etwas verschoben aussehen, falls nicht druckbare Sonder- bzw. Steuerzeichen vorhanden sein sollten. ggf. stimmt aber auch die ausgewählte Codepage nicht?
Was du tun kannst ist folgendes. Du erstellst Dir eine FlowHeater Definition, oder einen vorgelagerten Verarbeitungsschritt. Hier liest du eine komplette Zeile der CSV Datei in ein Feld im FlowHeater ein und schickst das Feld durch unten aufgeführtes C# Skript für den .NET Script Heater .
Wie das einlesen einer kompletten CSV Zeile in eine Spalte geht wird näher in folgenden Artikel beschrieben: Berechneten Wert an Write-Datei anhängen
Das C# Skript entfernt dann alle nicht druckbaren Sonder- bzw. Steuerzeichen aus dem Inhalt. Im Anschluss kannst du dann deine ganz normale Verarbeitung über die neu geschrieben CSV Datei laufen lassen.
Im Anhang findest Du ein kleines Beispiel dazu.
C# Skript um nicht druckbare Steuerzeichen aus Zeichenkette zu entfernen
Code:
public object DoWork()
{
string sIN = (string)InValues[0].GetString();
StringBuilder sOUT = new StringBuilder();
foreach(char c in sIN)
{
// nicht druckbare Sonder- bzw. Steuerzeichen aus Zeichenfolge entfernen, Tabulator und Zeilenumbruch aber zulassen!
if (char.IsControl(c) && c != '\t' && c != '\n' && c != '\r')
continue;
sOUT.Append(c);
}
return sOUT.ToString();
}
gruß
Robert Stark
Anhänge:
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
Ladezeit der Seite: 0.269 Sekunden