- Beiträge: 31
Konvertierung kyrillischer Texte
- Matthias Rindt
- Autor
- Offline
- Benutzer
Weniger
Mehr
4 Jahre 10 Monate her #3874
von Matthias Rindt
Konvertierung kyrillischer Texte wurde erstellt von Matthias Rindt
Hallo und ein gesundes Neues Jahr in die Runde!
Wir konvertieren regelmäßig aus einer csv-Datei in ein txt-Datei mit fester Satzlänge Rechnungen um Import in eine Finanzbuchführung.
Nun kommen Buchungstexte und Belegnummer mit kyrillischen Buchstaben vor und diese werden im UTF8 (mit oder ohne BOM) ausgegeben.
In der Ausgabedatei kommt es nun deswegen zu Spaltenverschiebungen. Diese bringen natürlich das Importprogramm durcheinander bzw. lassen es abstürzen.
Prüft man die Datei vorab z.B. mit den Notepad++ ist diese Spaltenverschiebung zu erkennen wenn man die nicht druckbaren Zeichen anzeigen lässt.
Das Ergebnis sieht z.B. so aus wie in der Datei im Anhang ab Zeile 17.
Aber auch in den ersten Zeilen kommt es schon zu Verschiebungen. Diese sind aber im Notepad++ gar nicht nachvollziehbar sondern nur im Fehlerprotokoll des Importprogramms durch Auszählen der Spalten ermittelbar.
Was können wir hier noch tun?
Mit IBM855 wird die Ausgabedatei zwar korrekt erstellt. Dann importiert das auf UTF8 eingestellte Importprogramm die kyrillichen Buchstaben aber als Fragezeichen u.ä.
VG und vielen dank, Matthias
Wir konvertieren regelmäßig aus einer csv-Datei in ein txt-Datei mit fester Satzlänge Rechnungen um Import in eine Finanzbuchführung.
Nun kommen Buchungstexte und Belegnummer mit kyrillischen Buchstaben vor und diese werden im UTF8 (mit oder ohne BOM) ausgegeben.
In der Ausgabedatei kommt es nun deswegen zu Spaltenverschiebungen. Diese bringen natürlich das Importprogramm durcheinander bzw. lassen es abstürzen.
Prüft man die Datei vorab z.B. mit den Notepad++ ist diese Spaltenverschiebung zu erkennen wenn man die nicht druckbaren Zeichen anzeigen lässt.
Das Ergebnis sieht z.B. so aus wie in der Datei im Anhang ab Zeile 17.
Aber auch in den ersten Zeilen kommt es schon zu Verschiebungen. Diese sind aber im Notepad++ gar nicht nachvollziehbar sondern nur im Fehlerprotokoll des Importprogramms durch Auszählen der Spalten ermittelbar.
Was können wir hier noch tun?
Mit IBM855 wird die Ausgabedatei zwar korrekt erstellt. Dann importiert das auf UTF8 eingestellte Importprogramm die kyrillichen Buchstaben aber als Fragezeichen u.ä.
VG und vielen dank, Matthias
Anhänge:
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
- FlowHeater-Team
- Offline
- Administrator
4 Jahre 10 Monate her - 4 Jahre 10 Monate her #3875
von FlowHeater-Team
gruß
Robert Stark
Wurde Ihre Frage damit beantwortet? Bitte geben Sie ein kurzes Feedback, Sie helfen damit auch anderen die evtl. ein ähnliches Problem haben. Danke.
FlowHeater-Team antwortete auf Konvertierung kyrillischer Texte
Hallo Herr Rindt,
Wie bzw. von welcher Quelle wurde den die UTF-8 Datei erzeugt? Für mich sieht es so aus als ob hier im TextFile Adapter auf der READ Seite schon falsche Codepage Einstellungen verwendet wurden und dann ziehen sich falsche/fehlerhafte Codepage Umwandlungen auch auf die WRITE Seite durch.
Im Anhang finden Sie eine Definition wo ich Ihre Kyrillische IBM855 Textdatei in UTF-8 konvertiere. Hier stimmt bei mir die UTF-8 Umwandlung, sowie sind keine Spaltenverschiebungen mehr zu erkennen.
Wie bzw. von welcher Quelle wurde den die UTF-8 Datei erzeugt? Für mich sieht es so aus als ob hier im TextFile Adapter auf der READ Seite schon falsche Codepage Einstellungen verwendet wurden und dann ziehen sich falsche/fehlerhafte Codepage Umwandlungen auch auf die WRITE Seite durch.
Im Anhang finden Sie eine Definition wo ich Ihre Kyrillische IBM855 Textdatei in UTF-8 konvertiere. Hier stimmt bei mir die UTF-8 Umwandlung, sowie sind keine Spaltenverschiebungen mehr zu erkennen.
gruß
Robert Stark
Wurde Ihre Frage damit beantwortet? Bitte geben Sie ein kurzes Feedback, Sie helfen damit auch anderen die evtl. ein ähnliches Problem haben. Danke.
Anhänge:
Letzte Änderung: 4 Jahre 10 Monate her von FlowHeater-Team. Begründung: Anhang hinzugefügt
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
- Matthias Rindt
- Autor
- Offline
- Benutzer
Weniger
Mehr
- Beiträge: 31
4 Jahre 10 Monate her #3876
von Matthias Rindt
Matthias Rindt antwortete auf Konvertierung kyrillischer Texte
Vielen Dank für die schnelle Antwort. Die Quelle ist eine Excel-Datei. Diese habe ich nun als UTF-8 abgespeichert. Die Konvertierung funktioniert und wenn ich mir die Ausgabe anschaue dann sind alle kyrillischen Buchstaben korrekt dargestellt und es sind auch keine Verschiebungen zu erkennen.
Bitte Anmelden oder Registrieren um der Konversation beizutreten.
Ladezeit der Seite: 0.270 Sekunden