it-swarm.com.de

Voice to Text Inhalt duplizieren?

Wird eine direkte Abschrift einer Stimme in einem Blog-Textbeitrag als doppelter Inhalt angesehen? Sehen Google-Webcrawler dies als doppelten Inhalt? Verfügen sie über die Technologie und können und verwenden sie diese, um solche möglichen doppelten Inhalte zu erkennen Probleme?

2
Timothy Coetzee

Wenn Sie befürchten, dass eine Audiodatei und eine Abschrift der Datei doppelt vorhanden sind, kann ich Ihnen versichern, dass dies keine Überlegung ist. Es ist zwar technisch möglich, eine Audiodatei zu transkribieren, dies ist jedoch keine pragmatische Übung. Die Befürchtungen, dass Google versucht, alles zu verstehen, ignorieren, ob es einem Zweck dient oder nicht. Es tut nicht. Nicht auf der Suche. Nicht, wenn das Web als eine zu verstehende Ontologie angesehen wird. Audio und Video passen überhaupt nicht zu diesem Modell und werden möglicherweise nie verwendet.

Lassen Sie mich erklären.

Vor Google waren Suchmaschinen recht einfache textbasierte Suchanwendungen. Dies änderte sich alles, als Google in der Szene erschien, die vollständig als semantikbasierte Suchmaschine gedacht war. Die Semantik existiert seit Jahrzehnten, zumindest seit den frühen 70er Jahren. Während die Technologie zu dieser Zeit ausgereift war, ist das Hauptproblem bei der Anwendung der Semantik als Technologie die Möglichkeit, die Technologie anzuwenden. Einfach ausgedrückt, waren die Ontologien, in diesem Fall eine Sammlung von Dokumenten, in Bezug auf Größe und Umfang nicht signifikant genug, um die Technologie anzuwenden, außer in seltenen Fällen.

Betreten Sie das Web.

Heiliges snarky SE poster Batman! Möglicherweise haben wir tatsächlich die Gelegenheit, die Semantik zu verwenden. Zwar wandte Google die Semantik zu Beginn recht rudimentär an, doch die Anwendung der Technologie explodierte auf eine Weise, die sich niemand hätte vorstellen können.

Das heißt, es ist technisch möglich, Text aus Bildern, Videos und Gesangsinhalten aus Audio zu extrahieren. Da die Semantik jedoch so konzipiert ist, dass sie das geschriebene Wort versteht und so gründlich auf Text angewendet wird, wie er im Web vorhanden ist, müsste sich vieles ändern.

Bedenken Sie auch, dass Audio beispielsweise andere Töne enthalten kann, um eine Aufnahme zu erschweren oder zu unmöglich zu machen, aus der die Sprache extrahiert werden kann. Bei so vielen Aufnahmen stellt sich auch die Frage, was aus der Aufnahme extrahiert werden könnte und welchen Wert sie haben würde.

Lassen Sie uns für den Moment die Dinge vereinfachen. Nehmen Sie als Beispiel das Extrahieren von Text aus Bildern. Nicht viele Bilder würden Text enthalten, und von denen, die dies tun, würde nicht viel Text extrahiert. Die nächste Frage wäre: Wäre der Text von Wert? Für die Bildersuche? Ja. Für die Dokumentensuche? Nein, warum? Wegen des hohen Rauschens in den Daten. Selbst wenn der Text klar ist, würde er wenig bis gar keinen Wert haben. Wenn man bedenkt, dass Daten mit fehlenden Daten oder unsinnigen Daten nicht gut übereinstimmen, wäre der Wert des Signals null. Wenn Sie dies weiter anwenden, haben Audio und Video das gleiche Problem. Es passt nicht zum Modell der Anwendung der semantischen Analyse auf den Text einer groß angelegten Ontologie, die bereits seit Jahrzehnten festgelegt ist.

Heutzutage spielt dies keine Rolle und daher werden Audiodateien nicht indiziert und können kein doppeltes Inhaltsszenario erstellen. Das kann sich natürlich in Zukunft ändern, aber nicht ohne nennenswerten Aufwand. Weil etwas technisch möglich ist, heißt das nicht, dass es praktisch oder sinnvoll ist. Denken Sie an Smellivision für Ihr Fernsehgerät. Die Technologie gibt es schon seit Jahrzehnten, macht aber zu diesem Zeitpunkt keinen Sinn. (Humor)

2
closetnoc