it-swarm.com.de

So entpacken Sie eine japanische Zip-Datei und vermeiden mojibake / verstümmelte Zeichen

Ich habe eine Zip-Datei von einem japanischen Kunden erhalten.

Wenn ich versuche, es zu entpacken, sind die Namen der Dateien und Ordner durcheinander:

$ unzip ~/Downloads/【新入荷ECM】資料.Zip
...
 inflating: БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx

Was ist das Problem und wie kann es vermieden werden?

3
Nicolas Raoul

Das Problem ist, dass die meisten in Japan verbreiteten ZIPs ihren Inhalt codiert als Shift JIS haben, was unter Ubuntu standardmäßig nicht korrekt angezeigt wird.

Die Lösung besteht darin, die Option -O shift-jis in Ihrem Befehl zu verwenden:

$ unzip -O shift-jis ~/Downloads/【新入荷ECM】資料.Zip
...
 inflating: 【新入荷ECM】資料/123_ユースケース.xlsx

Auf diese Weise sind die erweiterten Dateien in Ubuntu perfekt lesbar.

5
Nicolas Raoul

Einfache Antwort dafür

$ Sudo apt install unar
$ unar ~/Downloads/【新入荷ECM】資料.Zip

unar kann automatisch erkennen, welche Codierung verwendet wird. Es wird nur extrahiert und nicht komprimiert.

Verwenden Sie dann ' convmv ', um den Text nach dem Extrahieren zu kodieren.

$ convmv -f shift_jis -t utf8 БyРVУ№Й╫ECMБzОСЧ┐/123_ГЖБ[ГXГPБ[ГX.xlsx --notest

Umgekehrt, wenn Sie Dateien aus utf8 in shift_jis Text für Windows erstellen möchten.

$ convmv -f utf8 -t shift_jis <filename> --notest

Alternative Antworten, Verwendung von Ubuntu Japanisch Team gebaut automatische Codierung " entpacken ", aber Sie müssen Repository hinzufügen.

2