it-swarm.com.de

So fügen Sie eine UTF-8-Stückliste in Java hinzu

Ich habe eine gespeicherte Java-Prozedur, die mithilfe des Resultset-Objekts einen Datensatz aus der Tabelle abruft und eine CSV-Datei erstellt.

BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);
ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('\ufeff');
out.flush();
zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
    out.print("\"" + rs.getString(i) + "\"");
    out.print(",");
}
out.flush();
zipOut.closeEntry();
zipOut.close();
retBLOB.close();
return retBLOB;

Die generierte CSV-Datei zeigt jedoch nicht das richtige deutsche Zeichen. Oracle-Datenbank hat auch einen NLS_CHARACTERSET-Wert von UTF8.

Bitte vorschlagen.

18
Fadd

Um eine Stückliste in UTF-8 zu schreiben, benötigen Sie PrintStream.print() und nicht PrintStream.write().

Wenn Sie eine Stückliste in Ihrer csv-Datei haben möchten, müssen Sie nach putNextEntry() eine Stückliste drucken.

8
axtavt
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);

Dies schreibt 0xEF 0xBB 0xBF korrekt in die Datei, die die UTF-8-Darstellung der Stückliste darstellt.

57
astro

Nur für den Fall, dass Personen sind mit PrintStreams, müssen Sie es etwas anders machen. Während eine Writer ein kleines Byte in 3 Bytes konvertiert, benötigt eine PrintStream alle 3 Bytes der UTF-8-Stückliste einzeln:

    // Print utf-8 BOM
    PrintStream out = System.out;
    out.write('\ufeef'); // emits 0xef
    out.write('\ufebb'); // emits 0xbb
    out.write('\ufebf'); // emits 0xbf

Alternativ können Sie die Hex-Werte direkt für diese verwenden:

    PrintStream out = System.out;
    out.write(0xef); // emits 0xef
    out.write(0xbb); // emits 0xbb
    out.write(0xbf); // emits 0xbf
7

Ich denke, dass out.write('\ufeff'); eigentlich out.print('\ufeff'); sein sollte. 

Gemäß dem Javadoc schreibt die write(int)-Methode tatsächlich ein Byte ... ohne Zeichencodierung. out.write('\ufeff'); schreibt also das Byte 0xff. Im Gegensatz dazu codiert die print(char)-Methode das Zeichen mit der Codierung des Streams als eines oder als Bytes und schreibt diese Bytes dann.

7
Stephen C

In meinem Fall funktioniert es mit dem Code:

PrintWriter out = new PrintWriter(new File(filePath), "UTF-8");
out.write(csvContent);
out.flush();
out.close();
0
Rocio