Nhưng tại sao hiện tượng này thường xuyên xảy ra khi ta nghe giọng nói của mình trong khi nó hầu như không xảy ra khi nghe giọng nói của người khác?
Lời giải thích phổ biến của các phương tiện truyền thông là vì khi nghe giọng nói của chính mình trong cuộc đối thoại, ta nhận được cả hai âm thanh truyền đến tai thông qua truyền âm trong không khí và truyền âm qua xương.
Sự dẫn truyền âm thanh qua xương mang lại âm thanh với tần số rất thấp. Vì vậy khi thu âm, giọng nói sẽ không có tần số thấp như vậy khiến cho giọng chúng ta trở nên cao hơn và khác đi. Về cơ bản, bởi vì giọng nói sau khi thu âm sẽ không giống với tưởng tượng nên chúng ta cảm thấy không thích giọng của chính mình.
Tiến sĩ Silke Paulmann, nhà tâm lý học tại Đại học Essex nói:"Tôi suy đoán rằng khi nghe giọng của mình cao hơn so với tưởng tượng đã gây nên cảm giác rùng mình. Bởi vì giọng nói đóng vai trò quan trọng trong việc hình thành bản sắc của mỗi người và tôi đoán rằng chẳng ai thích nhận thấy rằng bản thân không thật sự là chính mình".
Thật vậy, nhận thức được rằng giọng mình nghe giống chuột Mickey hơn không khỏi khiến ta thất vọng. Tuy nhiên, một số nghiên cứu đã chỉ ra rằng đây chỉ là một phần giải thích.
Ví dụ, một nghiên cứu năm 2013 yêu cầu những người tham gia đánh giá mức độ hấp dẫn của các mẫu giọng nói ghi âm khác nhau. Khi giọng nói của chính họ cũng được trộn lẫn với những mẫu giọng này, những người tham gia đã xếp hạng giọng nói của họ cao hơn đáng kể mà không nhận ra đó là giọng của mình.
Hơn nữa, lời giải đáp toàn diện có thể được tìm thấy trong một loạt các nghiên cứu được công bố cách đây nhiều năm trước khi có các báo cáo về tần số âm thanh với những lời giải thích triển vọng.
Qua những cuộc thí nghiệm, vào năm 1966, hai nhà tâm lý học Phil Holzemann và Clyde Rousey đã kết luận rằng voice confrontation phát sinh không chỉ từ sự khác biệt về tần số, mà còn từ những phát giác đáng chú ý xảy ra khi cảm nhận các sự truyền âm.
Cụ thể, giọng nói không chỉ khác với mong đợi mà thông qua những gì được gọi là "tín hiệu ngôn ngữ phụ", nó cho thấy các khía cạnh tính cách mà ta chỉ có thể nhận thức đầy đủ khi nghe nó từ một bản ghi âm. Chúng bao gồm các khía cạnh như mức độ lo âu, do dự, buồn bã, tức giận,… của ta.
Theo trích dẫn, "Sự gián đoạn là phản ứng đối với cuộc chạm trán bất ngờ trong biểu cảm giọng nói mà chủ thể không có ý định thể hiện và cho đến thời điểm đó, họ không nhận thức được những gì họ đã bày tỏ".
Sự phức tạp của phối âm là rất lớn và chúng ta chỉ đơn giản là không có sự kiểm soát "trực tuyến" hoàn toàn. Thật vậy, thanh quản chứa tỷ lệ dây thần kinh sợi cơ cao nhất trong cơ thể con người. Hơn nữa, khi nghe một bản ghi âm, chúng ta không kiểm soát được giọng nói của mình như thường làm, tạo cảm giác hỗn loạn.
Marc Pell là nhà thần kinh học tại Đại học McGill, chuyên về truyền thông cảm xúc.
Ông ủng hộ các nghiên cứu của Holzemann và Rousey và nói: "Khi nghe giọng nói riêng biệt của mình, ta có thể tự động đánh giá giọng nói của mình theo cách chúng ta thường xuyên làm với giọng nói của người khác...
Tôi nghĩ việc chúng ta dùng ấn tượng của mình về tiếng nói của người khác để đánh giá xã hội, khiến nhiều người khó chịu hoặc không hài lòng với cách họ nói vì những ấn tượng đó được hình thành không phù hợp với đặc điểm xã hội mà họ mong muốn".
Vì vậy, có khả năng những người khác cũng ngạc nhiên bởi cao độ của giọng nói bạn nhưng họ có thể không đánh giá tương tự về giọng nói của bạn như bản thân bạn làm. Chúng ta có xu hướng không chỉ trích tiếng nói của người khác, nên có thể là bạn là người duy nhất suy nghĩ giọng nói của mình giống với "chuột Mickey".