it-swarm.com.de

Eine OpenCV-ähnliche C/C++ - Bibliothek für die Audiobearbeitung?

Gibt es da draußen noch etwas mehr, das (im Geiste) OpenCV ähnelt, aber um Audio zu verarbeiten und daraus einige Intelligenz zu gewinnen? Die Fähigkeiten können reichen von: -

  1. Multi-Plattform-Audioerfassung und -wiedergabe
  2. DSP - Audiofilter
  3. Tonerkennung
  4. Tonale Eigenschaftsanalyse
  5. Tonsynthese (verschiedene Standardwellenformen)
  6. Erkennung bei Erkennung eines bestimmten Erkennungskörpers und -modells (z. B. Bestimmen von Musikinstrumenten, Beats, menschlicher Sprache usw.) - könnte möglicherweise andere Open-Source-Projekte für den tatsächlichen Erkennungsteil (Sphinx) verwenden.
  7. Sprach-/Musiksynthese - könnte wieder andere Open-Source-Projekte verwenden (Festival)

Es ist in Ordnung, wenn die Bibliothek mit Roh-Audio am Tag arbeitet. Format-/Kodierungskonvertierung sind externe Probleme, die von anderen vorhandenen Bibliotheken behandelt werden (z. B. von ffmpeg).

Ich bin kein Experte auf diesem Gebiet, muss aber eine solche API verwenden und wundere mich, ob solche Bibliotheken vorhanden sind. Meine Auswahl von Begriffen zur Bestimmung der Fähigkeiten ist wahrscheinlich nicht die beste, sodass Experten diese Frage gerne bearbeiten möchten.

45
icarus74

Für die Audioaufnahme und -wiedergabe denke ich an portaudio .

Für die Audiobearbeitung sieht STK vielversprechend aus.

Schauen Sie sich auch diese Frage an: Kann jemand eine anständige DSP/Sprachbibliothek in C++ empfehlen?

Ich empfehle diese drei Bibliotheken:

  1. sehr einfach zu bedienen und benutzerfreundlich für die allgemeine Signalverarbeitung Aquila-dsp

  2. starke lib für die Verarbeitung von Audiosignalen, obwohl schwer zu bedienen und für Anfänger sehr umfangreich und kompliziert: CLAM Project

  3. eine andere, über die ich keine Erfahrung habe, ist allerdings eine Überlegung wert. tspl

30
Jong Bor Lee

Schauen Sie sich Essentia http://essentia.upf.edu/ .__ an. Essentia ist eine Open-Source-C++ - Bibliothek für Audioanalyse und audio-basierte Musikinformationen. Sie enthält eine umfangreiche Sammlung wiederverwendbarer Algorithmen, die implementieren Audio-Eingabe-/Ausgabefunktionalität, digitale Standardsignalverarbeitungsblöcke, statistische Charakterisierung von Daten und eine große Anzahl von spektralen, zeitlichen, tonalen und High-Level-Musikdeskriptoren.

Es gibt auch einen openFrameworks-Zweig, obwohl Sie in einigen Monaten vielleicht 64 Bit oder C++ 11 ablehnen möchten https://github.com/GiantSteps/Essentia-Libraries

7
Borg

Ich denke, Sie können Gaudio Sound Library ausprobieren - http://www.geek-audio.org

Die Gaudio-Bibliothek unterstützt Audiodekodierung, Kodierung und dps.

0
Petx