SInES Tools: Psychoacoustic Roughness

Audio Feature

Wertebereich

Bedeutung

Roughness (Vassilakis)

≥ 0
(typisch 0 bis ~1)

Frequenzbereichsmodell (MIR-Toolbox-Standard): Berechnet die Rauigkeit aus der Interaktion isolierter Spektralpeaks. Reagiert besonders empfindlich auf relative Amplitudenunterschiede zwischen benachbarten Teiltönen.

Roughness (Sethares)

≥ 0
(typisch 0 bis 500)

Frequenzbereichsmodell nach W. Sethares: Berechnet die Dissonanz komplexer Klänge, indem alle Peak-Paare miteinander verglichen werden. Die Amplituden werden mit einem von der Frequenzdistanz abhängigen Rauigkeitsfaktor multipliziert.

Roughness (Plomp & Levelt)

≥ 0
(typisch 0 bis 500)

Klassisches Frequenzbereichsmodell (1965): Die physikalische Grundlage der sensorischen Konsonanz. Bestimmt die Rauigkeit basierend auf der Frequenzdistanz von Sinuston-Paaren relativ zur kritischen Bandbreite des Gehörs.

Roughness (Zwicker)

≥ 0 Asper
(typisch 0 bis ~2)

Zeitbereichsmodell nach E. Zwicker: Analysiert schnelle zeitliche Schwankungen (Amplitudenmodulationen) innerhalb von 25 Frequenzgruppenbreiten (Bark). Die psychoakustische Einheit ist "Asper". Rauigkeit wird vor allem um 70 Hz Modulation stark gewichtet.

Roughness (Aures)

≥ 0 Asper
(typisch 0 bis ~2)

Erweitertes Zeitbereichsmodell nach W. Aures (1985): Basiert auf dem Zwicker-Modell, bezieht jedoch zusätzlich den absoluten Pegel (in dB) mit ein, da die Rauigkeitswahrnehmung mit der Lautstärke zunimmt.

Roughness (Daniel)

≥ 0 Asper
(typisch 0 bis ~2)

Zeitbereichsmodell nach Daniel & Weber (1997): Moderne Verfeinerung der Modulationsanalyse. Hier geht der Modulationsgrad quadratisch in die Berechnung ein. Besitzt eine sehr präzise, pegelabhängige Gewichtungsfunktion.

Spectral Magnitude (RMS)

0 bis 1

Effektivwert der Signalamplitude im Kurzzeitfenster. Zeigt die momentane Gesamtenergie bzw. den zeitlichen Verlauf der physikalischen Lautheit des Audiosignals an.

Audio Feature

Value Range

Meaning

Roughness (Vassilakis)

≥ 0
(typically 0 to ~1)

Frequency-domain model (MIR Toolbox standard): Calculates roughness based on the interaction of isolated spectral peaks. Is particularly sensitive to relative amplitude differences between adjacent harmonics.

Roughness (Sethares)

≥ 0
(typically 0 to 500)

Frequency-range model according to W. Sethares: Calculates the dissonance of complex sounds by comparing all pairs of peaks with one another. The amplitudes are multiplied by a roughness factor that depends on the frequency distance.

Roughness (Plomp & Levelt)

≥ 0
(typically 0 to 500)

Classical Frequency-Range Model (1965): The physical basis of sensory consonance. It determines roughness based on the frequency interval between pairs of sine tones relative to the critical bandwidth of hearing.

Roughness (Zwicker)

≥ 0 Asper
(typically 0 to ~2)

Time-domain model according to E. Zwicker: Analyzes rapid temporal fluctuations (amplitude modulations) within 25 critical bandwidths (Bark). The psychoacoustic unit is the “Asper.” Roughness is weighted most heavily around 70 Hz modulation.

Roughness (Aures)

≥ 0 Asper
(typically 0 to ~2)

Extended time-frequency model according to W. Aures (1985): Based on the Zwicker model, but also takes into account the absolute level (in dB), since the perception of roughness increases with volume.

Roughness (Daniel)

≥ 0 Asper
(typically 0 to ~2)

Time-domain model according to Daniel & Weber (1997): A modern refinement of modulation analysis. In this model, the degree of modulation is included in the calculation as a quadratic term. It features a highly precise, level-dependent weighting function.

Spectral Magnitude (RMS)

0 to 1

The root mean square value of the signal amplitude over a short time window. Indicates the current total energy or the temporal variation of the physical loudness of the audio signal.

音频特征

数值范围

含义

Roughness (Vassilakis)

≥ 0（通常为 0 至 ~1）

频域模型（MIR Toolbox 标准）：根据孤立谱峰的相互作用计算粗糙度。对相邻谐波之间的相对幅度差异特别敏感。

Roughness (Sethares)

≥ 0 (typically 0~500)

根据 W. Sethares 的频率范围模型：通过比较所有成对的峰值来计算复杂声音的不和谐音。振幅乘以取决于频率距离的粗糙度因子。

Roughness (Plomp & Levelt)

≥ 0 (typically 0~500)

经典频率范围模型（1965）：感觉和谐的物理基础。它根据正弦音对之间相对于听力临界带宽的频率间隔来确定粗糙度。

Roughness (Zwicker)

≥ 0 Asper（通常为 0 至 ~2）

根据 E. Zwicker 的时域模型：分析 25 个关键带宽 (Bark) 内的快速时间波动（幅度调制）。心理声学单位是“Asper”。粗糙度在 70 Hz 调制附近权重最大。

Roughness (Aures)

≥ 0 Asper（通常为 0 至 ~2）

根据 W. Aures (1985) 的扩展时频模型：基于 Zwicker 模型，但也考虑了绝对声级（以 dB 为单位），因为粗糙度的感知随着音量的增加而增加。

Roughness (Daniel)

≥ 0 Asper（通常为 0 至 ~2）

Daniel & Weber (1997) 的时域模型：调制分析的现代改进。在此模型中，调制度作为二次项包含在计算中。它具有高度精确、与级别相关的加权功能。

Spectral Magnitude (RMS)

0~1

短时间窗口内信号幅度的均方根值。指示音频信号的当前总能量或物理响度的时间变化。

Roughness Estimator © 2026 by Christoph Reuter and SInES (last modified: 24.6.2026) is released under MIT License
Translation of the Chinese version of the website: Li Hao
How to cite: Reuter, C. (2026). SInES Tools: Roughness Estimator. Web Application https://sinestools.univie.ac.at/roughness_estimator.htm