it-swarm.com.de

Wie kann ich unter Windows den Dateityp ohne Erweiterung bestimmen?

Ich erhalte manchmal Dateien von meinen Kunden, die die falsche Dateierweiterung haben. Der Name lautet beispielsweise image.jpg, die Datei ist jedoch tatsächlich ein TIFF-Bild. In vielen Fällen kann ich dies klären, indem ich die Datei in einem Texteditor öffne, die ersten Bytes betrachte und dann den Dateityp feststelle.

Dies funktioniert bei mir mit JPEG-, TIFF-, GIF- und PDF -Dateien. Es gibt jedoch noch viel mehr Dateitypen.

Ist es möglich, die Identifizierung des richtigen Dateityps durch Analyse der enthaltenen Daten zu automatisieren?

148
Martin

Sie können das TrID - Tool verwenden, das eine wachsende Bibliothek von Dateitypdefinitionen zur Identifizierung von Dateien mit enthält.

 Screenshot

Platzhalter werden unterstützt, sodass Sie in Ihrem Beispiel einfach alle zu untersuchenden Bilder in einen Ordner legen können, z. C:\verifyimages - dann können Sie den Befehl verwenden:

trid C:\verifyimages\*

Dadurch werden alle Dateien im Ordner verifyimages überprüft.


Es gibt auch eine GUI-Version, TrIDNet :

 Screenshot

Es gibt eine Dokumentation darüber, wie Sie TrID oder TrIDNet einfach in Windows Explorer und Total Commander integrieren können:

Windows Explorer

Total Commander

141
3498DB

Datei

Datei testet jedes Argument, um es zu klassifizieren. Es gibt drei Testreihenfolgen, die in dieser Reihenfolge ausgeführt werden: Dateisystemtests, Tests mit magischen Zahlen und Sprachtests. Der erfolgreiche Test first bewirkt, dass der Dateityp gedruckt wird.

Der gedruckte Typ enthält normalerweise eines der Wörter Text (die Datei enthält nur Druckzeichen und einige gebräuchliche Steuerzeichen und ist wahrscheinlich auf einem ASCII-Terminal sicher lesbar), ausführbar (die Datei enthält das Ergebnis der Kompilierung eines Programms in einer Form, die für einen UNIX-Kernel oder einen anderen verständlich ist), oder Daten, was etwas anderes bedeutet (Daten sind normalerweise "binär" oder nicht druckbar) . Ausnahmen sind bekannte Dateiformate (Core-Dateien, Tar-Archive), die bekanntermaßen Binärdaten enthalten.

Ich habe für die Französische Nationalbibliothek gearbeitet, um ein digitales Archivsystem aufzubauen, das nicht nur digitalisierte Bücher, sondern auch Millionen digitaler Artefakte mit allen Arten von seltsamen Dateitypen enthält. Wir haben JHOVE verwendet, um Dateiformate zu erkennen.

JHOVE ist Open Source und wird von JSTOR und der Harvard University Library gepflegt. Es ist ziemlich einfach zu verwenden .

12
Nicolas Raoul

Ich verwende die OutsideIn-Bibliotheken von Oracle in meinen Programmen. Nicht kostenlos, aber sie funktionieren gut, besonders für Bilder. Der Markt spricht von über 500 Dateitypen.

1

Sie können den Dateityp von jedem Computer aus überprüfen, einschließlich Windows unter

http://www.checkfiletype.com

0
John Williams