| Audio Feature | Wertebereich | Bedeutung |
| Duration [s] | ≥ 0 |
Die tatsächliche Länge der Datei. |
| Effective Duration [s] | ≥ 0 |
Die "effektive" Dauer unter Ausschluss von Stille. |
| Attack Time [s] | ≥ 0 |
Die Zeit, die ein Klang benötigt, um seine maximale Amplitude
zu erreichen. |
| Loudness [sone] | ≥ 0 |
Psychoakustische Lautheit. Sone ist ein lineares Maß für
die wahrgenommene Lautstärke. |
| Loudness Vickers [dB] | ≤ 0 |
Lautheitsmessung basierend auf dem Vickers-Modell; oft genutzt
für die Normalisierung von Audiomaterial. |
| Leq[dB] | ≤ 0 |
Äquivalenter Dauerschallpegel; ein Maß für die durchschnittliche
Energie über die Zeit. |
| LARM [dB] | ≤ 0 |
Long-term Average RMS Measurement, spezifisches Maß für
die Lautheit, das oft in der automatisierten Audio-Analyse verwendet
wird. |
| Global RMS | 0 bis 1 |
Der quadratische Mittelwert (Root Mean Square) der Amplitude
über die gesamte Dateilänge; ein Maß für
die durchschnittliche Lautstärke. |
| Replay Gain | -20 bis +20 [dB] |
Der Korrekturwert in Dezibel, der nötig ist, um die Datei
auf eine Standard-Referenzlautstärke zu bringen. |
| Dynamic Complexity | ≤ 0 |
Gibt an, wie stark die Dynamik (Lautstärkeunterschiede)
innerhalb des Stücks variiert. |
| Danceability | 0 bis 3 |
Ein Maß dafür, wie geeignet ein Track zum Tanzen
ist (basierend auf Rhythmusstabilität) [the higher, the more
danceable]. |
| Intensity | -1 bis +1 |
Beschreibt die aggressive Intensität des Stücks [-1
= relaxed, 0 = moderate, +1 = aggressive]. |
| Audio Feature | Wertebereich | Bedeutung |
| RMS | 0 bis 1 |
Durchschnittliche Amplitude des aktuellen Zeitfensters (Lautstärkeverlauf). |
| Level | ≥ 0 |
Ein Maß für die Signalstärke (Loudness) des
Frames. |
| Dissonance | 0 bis 1 |
Sensorische Dissonanz (Rauigkeit) des Klangs basierend auf der
Interaktion von Teiltönen. |
| Spectral Centroid | 0 bis halbe Samplefreq. | Der spektrale Schwerpunkt oder "Massemittelpunkt" des Spektrums; korreliert oft mit der wahrgenommenen "Helligkeit" eines Klangs. |
| Spectral Kurtosis | Variabel |
Beschreibt die "Steilheit" oder Wölbung des Spektrums;
gibt an, wie sehr die Verteilung von einer Normalverteilung abweicht. |
| Spectral Skewness | Variabel | Beschreibt die Asymmetrie des Spektrums um den Mittelwert (Schiefe). |
| Spectral Spread | ≥ 0 | Die spektrale Bandbreite; beschreibt, wie stark die Energie um den Spectral Centroid gestreut ist. |
| Barkbands Kurtosis | Variabel |
Die Wölbung (Steilheit) des Spektrums; bezogen auf die
27 Barkbänder. |
| Barkbands Skewness | Variabel | Beschreibt die Asymmetrie des Spektrums um den Mittelwert (Schiefe); bezogen auf die 27 Barkbänder. |
| Barkbands Spread | ≥ 0 |
Die spektrale Bandbreite; beschreibt, wie stark die Energie
um den Spectral Centroid gestreut ist; bezogen auf die 27 Barkbänder. |
| Spectral High Freq Content (HFC) | ≥ 0 |
Ein Maß für den Anteil hoher Frequenzen, oft genutzt
zur Erkennung von perkussiven Onsets. |
| Pitch / Strongest Freq. | ≥ 0 [Hz] |
Die geschätzte Grundtonhöhe bzw. die Frequenz mit
der stärksten Energie im aktuellen Frame. |
| Pitch Inst. Confidence | 0 bis 1 |
Die Vertrauenswürdigkeit der aktuellen Grundtonhöhen-Schätzung
(0 = unsicher, 1 = sehr sicher). |
| Pitch Salience | 0 bis 1 |
Ein Maß für die Dominanz oder "Klarheit" der Tonhöhe
gegenüber dem Rauschen. |
| Silence Rate 20dB | 0 bis 1 | Anteil der Zeitfenster, deren Pegel unter -20dB liegt. |
| Silence Rate 30dB | 0 bis 1 | Anteil der Zeitfenster, deren Pegel unter -30dB liegt. |
| Silence Rate 60dB | 0 bis 1 | Anteil der Zeitfenster, deren Pegel unter -60dB liegt. |
| Spectral Complexity | ≥ 0 |
Misst die Anzahl der Spitzen (Peaks) im Spektrum; ein Maß
für die "Dichte" des Klangs. |
| Spectral Crest | ≥ 1 |
Verhältnis zwischen dem Maximalwert und dem Mittelwert
des Spektrums; ein Indikator für die Tonalität (hoher
Crest = tonal). |
| Spectral Decrease |
0 bis -1 |
Beschreibt die zeitliche Abnahme der spektralen Energie über
die Frequenzbänder. |
| Spectral Energy | ≥ 0 | Die Summe der quadrierten Amplitudenwerte im Spektrum des aktuellen Frames. |
| Spec Energy Low | ≥ 0 | Energieanteile in den Tiefen (20-150 Hz). |
| Spec Energy Mid-Low | ≥ 0 | Energieanteile in den tiefen Mitten (150-800 Hz). |
| Spec Energy Mid-High | ≥ 0 | Energieanteile in den hohen Mitten (800-4000 Hz). |
| Spec Energy High | ≥ 0 |
Energieanteile in den Höhen (4000-20000 Hz). |
| Spectral Flatness | 0 bis 1 | Gibt an, wie "flach" das Spektrum ist. Ein Wert nahe 1 deutet auf Rauschen hin, ein Wert nahe 0 auf einen tonalen Klang. |
| Spectral Flux | ≥ 0 |
Die Änderungsrate des Spektrums von einem Frame zum nächsten;
hoch bei Onsets oder schnellen Klangänderungen. |
| Spectral RMS | 0 bis 1 | Der RMS-Wert berechnet auf den Amplitudenwerten des Spektrums. |
| Spectral Rolloff | 0 bis halbe Samplefreq. | Die Frequenz, unter der 99% der spektralen Energie liegt. |
| Spectral Strong Peak | ≥ 0 |
Misst, wie stark der ausgeprägteste Peak im Spektrum im
Vergleich zum Rest hervorsticht. |
| Zero Crossing Rate | ≥ 0 |
Die Häufigkeit, mit der das Signal die Nullachse schneidet;
ein Indikator für Rauschhaftigkeit oder Helligkeit. |
| Inharmonicity | 0 bis 1 |
Gibt an, wie stark die Obertöne von der idealen harmonischen
Reihe (ganzzahlige Vielfache) abweichen. |
| Odd-to-Even Harmonic Ratio | ≥ 0 |
Verhältnis der Energie ungerader zu geraden Harmonischen;
prägt den "hölzernen" oder "metallischen" Klang. |
| Strongest Frequency [Hz] | 0 bis halbe Samplefreq. | Die exakte Frequenz der Spektrallinie mit der höchsten Energie. |
| Bark Bands (1â27) | ≥ 0 |
Energieverteilung über 27 Frequenzbänder, die der
menschlichen Gehörphysiologie nachempfunden sind. |