Qu’est-ce qui vous fait dire ça?

Aujourd’hui j’ai parlé avec la Professeure Molly Babel de l’Université de Colombie Britannique. Notre conversation a porté sur les interactions et sur comment nous tous, nous faisons des prédictions et nous créons des attentes lorsque nous rencontrons des gens. Ces dernières peuvent nous aider à nous mettre sur la même longueur d’ondes que notre interlocuteur, ou bien au contraire, à nous déconnecter avant même de l’avoir entendu parler.

Alors bonne lecture ! Notre entretien contient un peu de tout ce à quoi vous vous attendez : de la recherche, des stéréotypes, des Legos et Le Seigneur des Anneaux !

[Le labo d'UBC où Prof. Babel fait ses études]

[Le labo d’UBC où Prof. Babel fait ses études]

MI : Pour commencer, qu’est-ce que vous étudiez dans le langage ?

MB : Ce que j’étudie, c’est comment nous réagissons face aux variabilités phonétiques dans la langue orale ; à la fois dans la manière dont nous produisons nous-mêmes la langue et nous la montrons, mais plus du côté de nos comportements en tant qu’auditeurs, face à la variation dans la voix des autres gens. Pour faire plus simple : comment faisons-nous face au fait que personne n’émet les mêmes sons ? Comment gérons-nous aussi le fait que certaines de ces différences soient socialement significatives alors que d’autres, dont nous choisissons de nous déconnecter, restent juste en arrière-plan.

MI : Comment est-ce que nous nous identifions à notre société dans notre façon de nous exprimer et dans celle des autres ?

MB : Notre connaissance des gens et de la société se manifeste dans notre discours de deux manières: à travers notre manière de produire nous-mêmes du discours (production de discours) et à travers nos attentes quand nous imaginons les autres produire du discours (perception du discours).

À partir du moment où nous ouvrons la bouche, nous révélons nos caractéristiques sociales et individuelles. Notre voix fournit des signaux plus ou moins subtils quant à notre sexe, notre âge, nos origines, notre état émotionnel, etc.

Nous changeons nos modèles d’expression pour répondre à différents contextes sociaux : nous ne parlons pas de la même manière à notre famille ou à des étrangers, à des enfants ou à des personnes de notre âge, à des amis ou à des figures d’autorité. Ces changements sont les reflets grossiers de ce qu’est la formalité dans certains cas, mais nous faisons aussi des changements de style qui sont plus personnels et qui reflètent nos identités sociales.

En tant qu’auditeurs, nous créons des associations et en arrivons à nous attendre à certains modèles discursifs venant de certains individus ou groupes d’individus. Par exemple nous évaluons nos attentes pour les dimensions acoustiques comme la hauteur de la voix en nous basant sur le sexe de la personne parce que nous avons appris que les hommes ont généralement des voix plus basses que les femmes puisqu’ils ont tendance à être comparativement plus larges en terme de taille. L’apprentissage de ces modèles nous aide à traiter efficacement les voix que nous n’avons jamais entendues auparavant. Mais, ces modèles appris peuvent aussi dévier dangereusement vers le territoire des stéréotypes.

MI : Comment construisons-nous nos attentes quand nous pensons à la façon dont quelqu’un va parler ? Et comment réagissons-nous lorsque nous avons mal jugé le style de notre production et le leur ?

MB : Bon par exemple, vous sauriez des choses à mon sujet avant même d’avoir entendu ma voix. Vous construiriez une supposition grossière du son de ma voix en vous basant sur vos exemples précédents d’entretiens avec des professeurs.

Nous gardons aussi constamment à jour ces attentes. Un de mes étudiants et moi avons récemment publié un article sur ces questions (Babel & Russell, 2015). Nous avons pris 12 résidents nés en Colombie Britannique. 6 étaient des Canadiens blancs et 6 étaient des Sino-Canadiens ; tous sont nés en Colombie Britannique et tous sont des locuteurs natifs anglophones.

Nous avons créé un test d’intelligibilité en faisant lire des phrases à nos 12 locuteurs. Puis nous avons ajouté des bruits de fond à ces enregistrements ; autrement, ce serait trop facile de les comprendre. Nous avons ensuite présenté à des auditeurs des tests où ils pouvaient voir une photo du visage du locuteur et d’autres tests où ils ne pouvaient pas les voir. Nous avons fait faire l’expérience à 40 étudiants de l’Université de Colombie-Britannique.

Lorsqu’ils n’avaient pas la photo de la personne qu’ils étaient en train d’écouter, tout le monde était en gros également intelligible ; il n’y avait aucune différence. Cependant lorsque les gens voyaient la photo des locuteurs, l’intelligibilité des Canadiens chinois chutait.

Bien que ce soit là une triste conclusion, nous pensons qu’il est important d’en discuter dans l’espace publique. Nous avons réalisé beaucoup d’analyses avec ces données et les résultats suggèrent que les gens s’attendent tout simplement à ce que les locuteurs sino-canadiens aient un accent étranger. C’est un exemple d’attente qui est mauvaise. L’attente que vous pouvez avoir avant de me parler, selon laquelle je suis une femme, que j’ai en gros un certain âge, ou que je vais parler dans une certaine rangée de fréquences, c’est bon parce que ça vous aide à me comprendre.

Donc, votre question sur les attentes et sur comment on les tient à jour, est une question importante. L’une des choses que nous allons étudier ensuite est le temps nécessaire que ça prend aux gens pour se dire : « bon d’accord, ces Canadiens chinois n’ont pas d’accent étranger. Je peux y aller et traiter ce discours de la même manière que je le ferais pour n’importe quel autre locuteur du coin. »

MI : Est-ce à dire que le récepteur s’attendrait à avoir des difficultés avant de devoir s’arrêter et de corriger ce mauvais jugement ?

MB : Je ne dirais même pas qu’on s’attendrait à avoir des difficultés mais plutôt qu’on s’attendrait à autre chose et qu’on ne saisit pas vraiment ce à quoi on s’attendait  si bien que c’est cette incompatibilité qui affaiblit temporairement notre compréhension.

Par exemple, si vous entendiez d’abord ma voix et que j’avais un accent australien, vous vous diriez de votre côté « attends une minute » et ensuite, vous auriez à vous arrêter et à réajuster vos attentes.

Il y a une autre étude que j’aimerais réaliser et qui consiste à voir à quel point ces attentes sont basées sur la race et l’ethnicité. Les gens sont-ils mieux aptes à saisir si un locuteur a un accent local ou étranger en se basant sur son apparence ? En d’autres termes, à quel point nos attentes sur un locuteur de l’anglais canadien de Vancouver sont basées sur le fait d’être blanc ?

Pour revenir à votre première question, une manière de décrire ce que je fais serait de dire que j’étudie comment les stéréotypes et les a-prioris nous affectent en temps réel en ce qui concerne le traitement de la langue orale. Ces résultats sont souvent tristes mais ils sont importants parce qu’ils ont un vrai impact sur les gens.

MI : Comment les gens diminuent-ils ou agrandissent-ils la distance qui les sépare des autres dans une conversation grâce à leurs paroles? Et, que dit-on réellement en diminuant ou en agrandissant cette distance ?

MB : Si une personne veut décroître la distance sociale entre elle et un interlocuteur, elle peut augmenter la similarité de ses modèles discursifs à travers un procédé appelé ‘convergence’ : imaginez qu’elle veuille augmenter la distance sociale : elle peut écarter ses modèles de discours en les rendant moins semblables à ceux de son interlocuteur. On fait ce genre de changement dans les conversations pour préparer le terrain social de l’interaction.

On peut tout à fait diminuer ou augmenter l’intervalle entre nous et notre partenaire de conversation. Je me suis déjà retrouvée à des diners où je me plais à parler avec quelqu’un ; nous nous dirigeons complètement vers un terrain d’entente entre nos deux styles de discours et puis, là, d’un coup, cette personne dit une chose avec laquelle je ne suis pas d’accord ou que je peux trouver offensante. Je deviens alors une personne complètement différente en termes de style discursif pour le reste de la conversation.

MI : Avez-vous le sentiment que tout ça se fait automatiquement, ou bien est-ce que une chose qu’on apprend en voyant les autres le faire ?

MB : C’est une question compliquée. Dans une certaine mesure, nous nous engageons automatiquement dans ces modèles d’accommodation. Il est certain que nous ne sommes pas en train de nous dire : « Tiens donc ! Afin d’obtenir ce que je veux de cette conversation, je vais changer la prononciation de mes voyelles pour correspondre à celle de cette personne. » À un certain niveau, il se peut que nous soyons pleinement conscients de l’admiration qu’on porte pour une personne et que nous nous retrouvons en train d’imiter. Il existe des indices selon lesquels les comportements linguistiques imitatifs font partie de l’apprentissage de la langue mais nous apprenons certainement comment utiliser les stratégies d’accommodation dans des manières socialement appropriées. Une convergence excessive vers les modèles discursifs d’une personne est une très bonne manière de s’aliéner cette personne.

Ce que je veux dire par là, c’est que ça pourrait sonner faux ou trop manipulateur. Tous ces différents moyens pour s’accommoder les uns aux autres tandis qu’on parle sont, de plusieurs façons, des moyens de se manipuler les uns les autres. Néanmoins, on peut certainement en faire trop ou bien agir de manière trop flagrante.

MI : Comment les gens perçoivent-ils le discours des autres quand ils ont particulièrement proches, ou au contraire particulièrement distincts de leur propre accent ou dialecte ?

MB : L’appartenance à un groupe est importante pour nous en tant qu’humains et le fait d’identifier les autres comme appartenant à notre endogroupe, c’est-à-dire comme membres de notre groupe social, ou comme appartenant à notre exogroupe, c’est-à-dire étrangers à notre groupe, c’est une chose que nous faisons indéniablement. Lorsque nous entendons des individus parler comme nous, on les évalue positivement en partie parce qu’ils font partie de notre endogroupe. Les accents et les dialectes différents des nôtres viennent souvent, mais pas toujours, avec des étiquettes sociales.

Par exemple, de nombreux locuteurs de l’anglais nord-américain perçoivent les variétés britanniques comme paraissant plus intelligent. C’est basé sur des stéréotypes que nous avons créés et non pas à cause d’une caractéristique inhérente à l’anglais britannique qui le rendrait plus intelligent.

Si vous regardez un film, dans de nombreux cas, le héros ou le personnage le plus attirant physiquement parlent la variété la plus standard de la langue. J’ai récemment re-regardé les films de la saga « Le Seigneur des Anneaux ». Aragorn et Legolas, qui sont tous les deux beaux et héroïques, parlent avec un accent anglais britannique standard. Gimli, un nain, est sans doute moins séduisant mais c’est aussi un personnage moins important. Il parle avec un accent moins standard. Les medias aident aussi à perpétuer et à alimenter les stéréotypes et les associations sur les accents.

MI : Au-delà du parler d’une personne, y a-t-il des éléments qui façonnent la manière dont ils sont perçus lors d’une conversation ?

MB : Le discours et la langue ne sont que deux des nombreux signaux sociaux que nous utilisons pour évaluer les autres. Notre façon de nous habiller, nos odeurs, notre posture, nos expressions faciales : toutes ces choses sont des signaux sociaux que nous présentons et que les autres utilisent pour nous évaluer, pour le meilleur ou pour le pire. Par exemple, si quelqu’un porte beaucoup d’eau de Cologne ou de parfum, ça déclenchera chez nous certains jugements sur cette personne.

MI : Comment recueillez-vous les paroles que vous utilisez pour votre recherche et est-il important que ces paroles soient « naturelles » ou au moins prononcées par un locuteur à l’aise et confortable ?

MB : Nous utilisons différentes méthodes de collecte de langue orale pour différents types de projets. Parfois nous faisons lire à des gens des mots ou des phrases. Parfois nous faisons raconter aux gens des histoires ou dire des répliques de vidéos. Récemment Jen Abel, l’une de mes doctorantes, a recueilli des paroles provenant de binômes qui jouaient ensemble avec des briques Lego. En travaillant ensemble sur une tâche donnée, les deux individus [qui ne se connaissent pas] ont quelque chose à discuter, ce qui évite des pauses et des silences gênants, produisant ainsi un discours plus naturel.

Il est important pour les linguistes d’étudier de nombreux styles de langage car la langue est un système à multi-facettes et varié. Les différents styles nous montrent un éventail de choses que les locuteurs savent à propos de leur langue.

MI : Qu’est-ce que vous aimeriez faire ensuite pour votre recherche?

MB : Certains des projets de mes étudiants les plus récents ainsi que des miens ont consisté à étudier nos attentes et nos prédictions linguistiques. Concernant les évènements linguistiques imminents, ces dernières sont basées sur notre connaissance sociale ou linguistique et nous voulons savoir comment ces attentes interagissent avec notre véritable expérience afin de trouver ce que nous percevons en fin de compte.

MI : Qu’est-ce que vous préférez dans votre travail?

MB : La meilleure partie de mon travail c’est de pouvoir m’impliquer dans le processus de découverte. Nous avons beaucoup à découvrir sur le fonctionnement du discours !

[Forme d'onde de ma grand-mère qui dit,

[Forme d’onde de ma grand-mère qui dit, “That’s like back in the old days”]

 Un sincère merci à Molly Babel. Son travail a produit des résultats inconfortables sur les stéréotypes et les jugements. Ce sont néanmoins des résultats très importants parce qu’ils font partie de notre réalité quotidienne et touchent continuellement les gens.

L’importance de nos perceptions et de nos attentes lorsque nous nous parlons est que les stéréotypes peuvent être utiles : ils peuvent nous aider à identifier des situations et des émotions ; mais ils peuvent aussi être offensants comme l’a montré la recherche de la Professeure Babel.

Tandis que nous ne pensons pas consciemment, quand nous sommes présentés à quelqu’un, à une fréquence attendue de leur voix, notre cerveau fait ce bond. Notre cerveau peut aussi inconsciemment faire des bonds négatifs. Ainsi, si on est plus conscients de notre manière de former nos conceptions sur les autres, cela peut nous aider à réduire le mal que nous pouvons causer sans le vouloir. Ce n’est pas chose facile mais nous pouvons tous être d’accord que réduire les stéréotypes blessants est une bonne chose.

A tantôt,

Michael Iannozzi

Un gros merci à Floriane Letourneux pour son aide avec la traduction

What makes you say that?

Today I spoke with Professor Molly Babel of UBC. Our conversation was about interaction, and how we create predictions and expectations when we meet people. These predictions and expectations can help us to get on the same “wavelength” as our conversation partner, or they can make us “tune-out” before we’ve even heard them speak.

So, please enjoy our interview. It has a little of everything you’d expect: research, stereotypes, LEGOs, and Lord of the Rings.

[Lab at UBC where Professor Babel does her research]

[Lab at UBC where Professor Babel’s research is conducted]

MI : As an introduction, what do you study about language?

MB : What I study is how we deal with phonetic variability in spoken language; both from the way that we, ourselves, perform and produce it, but more from the side of what we as listeners do with the variation in other people’s voices. Or to put it more simply: how do we handle the fact that everyone sounds different? Also, how do we manage the fact that some of those differences in the way other people sound are socially meaningful, but others are just background that we can choose to tune out.

MI : How do we relate to our society through our speech, and that of other people?

MB : Our knowledge of people and society manifests itself in speech in two ways: through how we perform speech ourselves (speech production), and through our expectations of how we think others will perform speech (speech perception).

From the moment we open our mouths, we reveal our social and individual characteristics. Our voices provide subtle and not-so-subtle cues to gender, age, where we are from, our emotional state, etc.

We change our speech patterns to fit different social contexts: we don’t speak the same way to family or strangers, infants or our same-aged peers, friends or authority figures. These changes are gross reflections of formality, in some cases, but we also make style shifts that are more personal and reflect our social identities.

As listeners, we make associations and come to expect certain speech patterns from certain individuals or groups of individuals. For example, we scale our expectations for acoustic dimensions like an individual’s pitch based on whether they are male or female because we have learned that men generally have lower-pitched voices than women, as men tend to be comparatively larger in size. Learning these patterns helps us efficiently process voices we have never heard before. But, these learned patterns can also veer dangerously into the territory of stereotypes.

MI : How do we build our expectations of how we think someone will perform? And how do we react when we’ve judged the style incorrectly of both our production and theirs?

MB : Well, for example, you would know some things about me before you heard my voice. You would build a rough assumption of how I would sound based on your previous examples of speaking with other professors.

We also constantly update those expectations. A student and I recently published a paper about these issues (Babel & Russell, 2015). We took 12 locally-born BC residents. 6 were white Canadians, and 6 were Chinese-Canadians; all were locally-born, and all were native English speakers.

We created an intelligibility test by having all of our 12 speakers read sentences. Then we added background noise to those sentences; otherwise understanding them would be too easy. We then presented listeners with trials where they saw a photo of the face of the speaker, and others where they didn’t see the photos. We had 40 UBC students do this experiment.

When they didn’t the photo of who they were listening to, everyone was roughly equally intelligible—there were no differences. However, when people saw the pictures of the speakers then intelligibility of the Chinese-Canadians went down.

So while this is a sad finding, we think it is important to discuss in a public space. We did many analyses with this data, and the results suggest that people just expect Canadian-Chinese speakers to have a non-native accent. This is an example of a kind of expectation that is bad. The expectation that you might have before speaking to me that I’m female, that I’m roughly a certain age, or going to speak within a certain range of frequencies; that’s good because it helps you understand me.

So your question about expectations, and how we update them, is a huge one. One of the things we’re going to look at next is how long does it take people to say, “OK these Chinese-Canadians do not have non-native accents. I can go ahead and process this speech the same way I would for any other local speaker”.

MI : So is it that the listener would be expecting to have difficulty, and then have to stop and correct that misjudgement?

MB : I wouldn’t even say that you would be expecting to have difficulty, just that you were expecting something else, and you don’t get what you were expecting, and so that mismatch is what gives you a temporary decrease in understanding

So, for example, if you first heard my voice, and I had an Australian accent, there would be a “hey-wait-a-second moment” on your end, and you would have to stop and readjust your expectations.

Another study I’m hoping to do is to look at how much of those expectations are based on race and ethnicity. Are people better able to pick up on whether a speaker has a local or non-local accent based on what they look like. In other words: how much of our expectations of who sounds like a Vancouver-Canadian-English speaker is based on being white.

One of the ways that, to go back to your first question, I would describe what I’m doing is looking at how stereotypes and prejudice affect us in real-time for spoken-language processing. Often, those are sad results, but those are important results; because they actually impact people.

MI : How do people close (or widen) the distance between themselves and others in a conversation through their speech? And what are we “saying” by closing or widening that distance?

MB : If someone wants to decrease the social distance between herself and an interlocutor [The person she is speaking with], she can increase the similarity of their speech patterns through a process called convergence. Say she wants to increase the social distance – she can diverge her speech patterns, making them less similar to those of her interlocutor. We make these kinds of changes in conversation to grease the social wheels of interaction.

We can definitely close or widen the gap between us and our conversation partner. I’ve been at dinner parties where I’m happily talking with someone, we’re definitely moving toward a middle ground between our two speech styles, and then they say something that I disagree with or might find offensive. Then I become a completely different person in terms of my speech style for the rest of that conversation.

MI : Do you feel that this is done automatically, or is it something that is learned from seeing others do it?

MB : This is a complicated question. To some extent, we engage in these patterns of accommodation automatically. We certainly don’t say to ourselves, “a-ha! In order to get what I want in this situation, I’m going to shift my vowels to match this person’s.” On some level, we might consciously be aware of admiring a person who we find ourselves imitating. There is evidence that imitative linguistic behaviours are part of how we learn language, but we certainly learn how to use accommodative strategies in socially appropriate ways. Overly converging with someone’s speech patterns is a great way to alienate someone.

What I mean by that is that it can sound fake, or overly manipulative. In many ways, all of these different types of accommodating one another while speaking are means of manipulating one another. However, you can certainly overdo it, or be too obvious about it.

MI : How do people perceive the speech of others that are particularly similar, or especially distinct from their own accent/dialect?

MB : Group membership is important to us as people, and identifying others as in-group (members of our social groups) and out-group (not-members of our social groups) is something we do. When we hear individuals who sound like us, we positively evaluate them, in part because they are part of our in-group. Accents and dialects that are different from our own often, but not always, come with social labels.

For example, many speakers of North American English perceive many British varieties of English as more intelligent-sounding. This is based on stereotypes we have created, not because of anything inherently intelligent-sounding in British English.

If you a watch a film, in many cases the hero or most attractive looking character will speak the most standard variety of that language. I recently rewatched the Lord of the Rings movies, and Aragorn and Legolas, who are both handsome and heroic, speak with Standard English accents. Gimli, a dwarf, is arguably less attractive and less of a main character – he speaks with a less standard accent. Media helps perpetuate and feed stereotypes and associations about accent.

MI : Are there things beyond the way someone is speaking that shapes how they are perceived in a conversation?

MB : Speech and language is just one of many social signals we use to evaluate others. How we dress, what we smell like, our posture, our facial expressions – these are all social signals we present and that others use to evaluate us, for better or for worse. For example, if someone wears a lot of cologne or perfume that will trigger certain judgements about that person for us.

MI : How do you collect the speech you use for your research, and how important is it that that speech be “natural” or by a speaker who is at-ease and comfortable?

MB : We use different methods of collecting spoken language for different types of projects. Sometimes we have people read words or sentences. Sometimes we have people tell stories along with video prompts. Recently, Jen Abel, one of my PhD students, collected speech from pairs of individuals who were playing with LEGOs together. By working on a given task together, the two individuals [who don’t know one another] have something to keep talking about, which avoids awkward pauses and silences, and produces more natural speech.

It is important for linguists to study many different styles of language, as language is a multi-faceted and diverse system. The different styles show us the range of things speakers know about their language.

MI : What would you like to do next with your research?

MB : Some of my students’ and my more recent projects have been looking into our linguistic expectations and predictions. Our expectations and predictions about upcoming linguistic events are based on linguistic or social knowledge and we want to know how those expectations interact with what we actually experience to give us what we ultimately perceive.

MI : What is your favourite part of your work?

MB : The best part of my job is being able to curiously engage in the process of discovery. We have a lot to learn about how speech works!

[Waveform of my gramma saying, "That's like back in the old days"]

[Waveform of my gramma saying, “That’s like back in the ol’ days”]

A sincere thanks to Molly Babel.

Professor Babel’s work has produced some discomforting results about stereotypes and judgements. However, they are very important findings because they are part of our daily reality, and affect people continuously.

The importance of our perceptions and expectations when speaking with others is that the stereotypes can be useful (they can help us identify situations and emotions), and they can also be hurtful, as her research has shown.

While we don’t consciously think, when we are introduced to someone, of an expected frequency in their voice, our brains are making that leap. Our brain can also subconsciously make negative leaps, so by being more conscious about how we form our conceptions of others can help us reduce the harm we might unintentionally cause. It’s not easy, but we can all agree that reducing hurtful stereotypes is a good thing.

 

Take care eh,

 

Michael Iannozzi