Robustness background noise¶

Overall scores¶
	w2v2-L	hubert-L	wavlm	data2vec
Overall Score	50.0% passed tests (12 passed / 12 failed).	54.2% passed tests (13 passed / 11 failed).	62.5% passed tests (15 passed / 9 failed).	54.2% passed tests (13 passed / 11 failed).

Change Ccc Babble Noise¶

Threshold: -0.05¶
Data	Change CCC Babble Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.00	-0.02	-0.02	-0.01
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	-0.01	-0.00	-0.00	-0.00
mean	-0.01	-0.01	-0.01	-0.01

Change Ccc Coughing¶

Threshold: -0.05¶
Data	Change CCC Coughing
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.01	-0.01	0.02	-0.01
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	-0.06	-0.05	-0.07	-0.05
mean	-0.03	-0.03	-0.03	-0.03

Change Ccc Environmental Noise¶

Threshold: -0.05¶
Data	Change CCC Environmental Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.01	-0.03	-0.01	-0.01
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	-0.01	-0.00	0.00	0.00
mean	-0.01	-0.01	-0.01	-0.01

Change Ccc Music¶

Threshold: -0.05¶
Data	Change CCC Music
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.01	-0.03	-0.02	-0.01
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.00	0.00	-0.00	0.01
mean	-0.01	-0.01	-0.01	0.00

Change Ccc Sneezing¶

Threshold: -0.05¶
Data	Change CCC Sneezing
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.02	-0.03	0.01	-0.03
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	-0.08	-0.05	-0.09	-0.06
mean	-0.05	-0.04	-0.04	-0.04

Change Ccc White Noise¶

Threshold: -0.05¶
Data	Change CCC White Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	-0.09	-0.06	0.01	-0.02
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	-0.09	-0.03	0.01	-0.01
mean	-0.09	-0.04	0.01	-0.01

Percentage Unchanged Predictions Babble Noise¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions Babble Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.97	0.94	0.93	0.90
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.95	0.94	0.90	0.92
mean	0.96	0.94	0.92	0.91

Percentage Unchanged Predictions Coughing¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions Coughing
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.77	0.77	0.78	0.77
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.81	0.79	0.64	0.77
mean	0.79	0.78	0.71	0.77

Percentage Unchanged Predictions Environmental Noise¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions Environmental Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.86	0.87	0.95	0.87
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.83	0.89	0.96	0.87
mean	0.84	0.88	0.95	0.87

Percentage Unchanged Predictions Music¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions Music
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.94	0.91	0.94	0.91
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.91	0.92	0.90	0.92
mean	0.93	0.92	0.92	0.92

Percentage Unchanged Predictions Sneezing¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions Sneezing
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.69	0.73	0.69	0.66
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.75	0.80	0.52	0.72
mean	0.72	0.77	0.60	0.69

Percentage Unchanged Predictions White Noise¶

Threshold: 0.9¶
Data	Percentage Unchanged Predictions White Noise
Data	w2v2-L	hubert-L	wavlm	data2vec
iemocap-2.3.0-emotion.dimensions.test.gold_standard	0.14	0.58	0.82	0.58
msppodcast-2.6.1-emotion.dimensions.test-1.gold_standard	0.12	0.50	0.94	0.45
mean	0.13	0.54	0.88	0.52

Visualization Babble Noise¶

Difference of predictions for clean audio and audio with added babble noise. The allowed prediction difference \(\delta < 0.05\) is highlighted in green in the upper plot. The lower plot shows the distributions of the two predictions.

w2v2-L	hubert-L	wavlm	data2vec