| Audio Feature | Wertebereich | Bedeutung |
| Roughness (Vassilakis) |
≥ 0
(typisch 0 bis ~1) |
Frequenzbereichsmodell (MIR-Toolbox-Standard): Berechnet
die Rauigkeit aus der Interaktion isolierter Spektralpeaks. Reagiert
besonders empfindlich auf relative Amplitudenunterschiede zwischen
benachbarten Teiltönen. |
| Roughness (Sethares) |
≥ 0
(typisch 0 bis 500) |
Frequenzbereichsmodell nach W. Sethares: Berechnet die
Dissonanz komplexer Klänge, indem alle Peak-Paare miteinander
verglichen werden. Die Amplituden werden mit einem von der Frequenzdistanz
abhängigen Rauigkeitsfaktor multipliziert. |
| Roughness (Plomp & Levelt) |
≥ 0
(typisch 0 bis 500) |
Klassisches Frequenzbereichsmodell (1965): Die physikalische
Grundlage der sensorischen Konsonanz. Bestimmt die Rauigkeit basierend
auf der Frequenzdistanz von Sinuston-Paaren relativ zur kritischen
Bandbreite des Gehörs. |
| Roughness (Zwicker) |
≥ 0 Asper
(typisch 0 bis ~2) |
Zeitbereichsmodell nach E. Zwicker: Analysiert schnelle
zeitliche Schwankungen (Amplitudenmodulationen) innerhalb von 25
Frequenzgruppenbreiten (Bark). Die psychoakustische Einheit ist
"Asper". Rauigkeit wird vor allem um 70 Hz Modulation
stark gewichtet. |
| Roughness (Aures) |
≥ 0 Asper
(typisch 0 bis ~2) |
Erweitertes Zeitbereichsmodell nach W. Aures (1985): Basiert
auf dem Zwicker-Modell, bezieht jedoch zusätzlich den absoluten
Pegel (in dB) mit ein, da die Rauigkeitswahrnehmung mit der Lautstärke
zunimmt. |
| Roughness (Daniel) |
≥ 0 Asper
(typisch 0 bis ~2) |
Zeitbereichsmodell nach Daniel & Weber (1997): Moderne
Verfeinerung der Modulationsanalyse. Hier geht der Modulationsgrad
quadratisch in die Berechnung ein. Besitzt eine sehr präzise,
pegelabhängige Gewichtungsfunktion. |
| Spectral Magnitude (RMS) |
0 bis 1 |
Effektivwert der Signalamplitude im Kurzzeitfenster. Zeigt die
momentane Gesamtenergie bzw. den zeitlichen Verlauf der physikalischen
Lautheit des Audiosignals an. |
| Audio Feature | Value Range | Meaning |
| Roughness (Vassilakis) |
≥ 0
(typically 0 to ~1) |
Frequency-domain model (MIR Toolbox standard): Calculates
roughness based on the interaction of isolated spectral peaks. Is
particularly sensitive to relative amplitude differences between
adjacent harmonics. |
| Roughness (Sethares) |
≥ 0
(typically 0 to 500) |
Frequency-range model according to W. Sethares: Calculates
the dissonance of complex sounds by comparing all pairs of peaks
with one another. The amplitudes are multiplied by a roughness factor
that depends on the frequency distance. |
| Roughness (Plomp & Levelt) |
≥ 0
(typically 0 to 500) |
Classical Frequency-Range Model (1965): The physical basis
of sensory consonance. It determines roughness based on the frequency
interval between pairs of sine tones relative to the critical bandwidth
of hearing. |
| Roughness (Zwicker) |
≥ 0 Asper
(typically 0 to ~2) |
Time-domain model according to E. Zwicker: Analyzes rapid
temporal fluctuations (amplitude modulations) within 25 critical
bandwidths (Bark). The psychoacoustic unit is the Asper.
Roughness is weighted most heavily around 70 Hz modulation. |
| Roughness (Aures) |
≥ 0 Asper
(typically 0 to ~2) |
Extended time-frequency model according to W. Aures (1985):
Based on the Zwicker model, but also takes into account the absolute
level (in dB), since the perception of roughness increases with
volume. |
| Roughness (Daniel) |
≥ 0 Asper
(typically 0 to ~2) |
Time-domain model according to Daniel & Weber (1997): A
modern refinement of modulation analysis. In this model, the degree
of modulation is included in the calculation as a quadratic term.
It features a highly precise, level-dependent weighting function. |
| Spectral Magnitude (RMS) |
0 to 1 |
The root mean square value of the signal amplitude over a short
time window. Indicates the current total energy or the temporal
variation of the physical loudness of the audio signal. |
| 音频特征 | 数值范围 | 含义 |
| Roughness (Vassilakis) |
≥ 0(通常为 0 至 ~1) |
频域模型(MIR Toolbox 标准):根据孤立谱峰的相互作用计算粗糙度。对相邻谐波之间的相对幅度差异特别敏感。 |
| Roughness (Sethares) |
≥ 0 (typically 0~500) |
根据 W. Sethares 的频率范围模型:通过比较所有成对的峰值来计算复杂声音的不和谐音。振幅乘以取决于频率距离的粗糙度因子。 |
| Roughness (Plomp & Levelt) |
≥ 0 (typically 0~500) |
经典频率范围模型(1965):感觉和谐的物理基础。它根据正弦音对之间相对于听力临界带宽的频率间隔来确定粗糙度。 |
| Roughness (Zwicker) |
≥ 0 Asper(通常为 0 至 ~2) |
根据 E. Zwicker 的时域模型:分析 25 个关键带宽 (Bark) 内的快速时间波动(幅度调制)。心理声学单位是“Asper”。粗糙度在 70 Hz 调制附近权重最大。 |
| Roughness (Aures) |
≥ 0 Asper(通常为 0 至 ~2) |
根据 W. Aures (1985) 的扩展时频模型:基于 Zwicker 模型,但也考虑了绝对声级(以 dB 为单位),因为粗糙度的感知随着音量的增加而增加。 |
| Roughness (Daniel) |
≥ 0 Asper(通常为 0 至 ~2) |
Daniel & Weber (1997) 的时域模型:调制分析的现代改进。在此模型中,调制度作为二次项包含在计算中。它具有高度精确、与级别相关的加权功能。 |
| Spectral Magnitude (RMS) |
0~1 |
短时间窗口内信号幅度的均方根值。指示音频信号的当前总能量或物理响度的时间变化。 |