Share

Theoretical Essay

Linguistic prejudice for humanizing machine

Raquel Meister Ko. Freitag

Universidade Federal de Sergipe image/svg+xml

https://orcid.org/0000-0002-4972-4320


Keywords

Artificial Intelligence
Sociolinguistic
Machine learning
Ethics

Abstract

Social competence in machines, with the ability to adapt language to the target audience, is still a demand to be explored in the field of artificial intelligence enabling technologies. How can the linguistic description of Brazilian Portuguese that has been developed by Sociolinguistics in Brazil meet a demand for practical application? In this paper, we propose a path to explore how sociolinguistic traits can attribute a human personality to the machine.

Introdução

No domínio das tecnologias habilitadoras na Inteligência Artificial, apesar de controverso,o Teste de Turing ainda é um conceito aplicado para avaliar a inteligência de máquinas(HAYES; FORD, 1995; SAYGIN; CICEKLI; AKMAN, 2000). Pioneiro no campo da inteligênciaartificial, o teste de Turing consiste em uma tarefa em que um humano-juiz tem umainteração cega com outro humano, e com uma máquina. Em cinco minutos, o humano-juizprecisa, com base na interação, identificar qual é a máquina. Este teste é a base do processamento de linguagem natural como conhecemos hoje.

Danziger (2017) retoma os pressupostos do teste de Turing e problematiza adeterminaçãoda inteligência da máquina a partir de dois critérios: tecnológico esociolinguístico. Enquanto o critério tecnológico requer uma estrutura de máquina quepermita emular o cérebro humano para apresentar um comportamento inteligente, ocritério sociolinguístico requer que a máquina seja percebida pela sociedade como umaentidade potencialmente inteligente. Isso significa que a máquina precisa ter um comportamento linguístico tal como os humanos, envolvendo a relação entre linguagem eidentidade social, e a língua em uso na interaçãosocial.

Tentativas para superar o desafio de Turing são registradas desde a década de 1960;ELIZA (WEIZENBAUM, 1966) é um programa para conversaçãoque simulava ainteração entre um psicólogo (a máquina) e um parciente (humano) que conseguiuresultados que permitiram superar o desafio de Turing. Desde então, diferentes usos deinteligência artificial vêm fazendo parte do nosso cotidiano, da automação paraatendimento automático até assistentes virtuais (ADAMOPOULOU; MOUSSIADES, 2020). Adescriçãolinguística voltada ao processamento de linguagem natural tem possibilitado odesenvolvimento de algoritmos para a identificação do tema da conversa, e manutençãodo fluxo do diálogo cada vez mais precisos e eficientes. Mas, ainda assim, uma demandalatente é identificar as características sociais do chatbot que potencializam as interaçõescom os humanos (HOVY; SPRUIT, 2016; THIES et al., 2017; PARK et al., 2018; WESTERMAN;CROSS; LINDMARK, 2019; PARK et al., 2021; RAPP; CURTI; BOLDI, 2021).

E, especificamente no campo dos estudos linguísticos, apesar dos avanços que ocampo da pesquisa na inteligência artificial que trata da interface linguística já fez noâmbito do processamento do conteúdo linguístico, ainda pouco foi explorado no âmbitoda compreensão da dimensão social da linguagem na inteligência de máquinas, umcampo que tem sido objeto da Sociolinguística Computacional (NGUYEN et al., 2016).Nesta direção, para entender como as escolhas linguísticas de um chatbot podem aderirao papel social esperado para um determinado contexto, um aspecto que é estudado naSociolinguística pode ser explorado para atribuir uma personalidade humana à máquina:o preconceito linguístico.

1. Preconceito e o processamento da variação linguística

Na Psicologia Social, atitude é definida como um constructo psicológico, ou seja, é uma disposição que as pessoas têm que as fazem reagir favoravelmente ou desfavoravelmente, ou ir de contra a um objeto psicológico (ALLPORT, 1935). Uma atitude, por ser um constructo, não pode ser observada diretamente, mas pode ser inferida pela observação de três componentes (EDWARDS, 1999): o cognitivo, atrelado às crenças dos indivíduos; o afetivo, envolve suas emoções e seus sentimentos; e o comportamental, o que faz um indivíduo a interagir de uma determinada forma. As variedades linguísticas podem desencadear crenças sobre um falante e sobre sua participação em um grupo social, muitas vezes influenciadas por ideologias de linguagem, levando a suposições estereotipadas sobre as características comuns dos membros do grupo. É por este motivo que, quando um determinado falante ouve uma variante linguística distinta da sua ou uma variante socialmente mal avaliada, mesmo que inconscientemente, preconceitos ou estereótipos linguísticos sobre aquela variedade são ativados (HIPPEL; SEKAQUAPTEWA; VARGAS, 1997).

A premissa básica do preconceito linguístico é que a variação social também carrega marcas identitárias e se manifesta nas diferentes normas linguísticas: a norma culta é usada pelas pessoas mais diretamente relacionadas com a cultura escrita que é historicamente legitimada (pessoas com alto grau de escolarização), ao passo que as normas ou variedades não padrão são utilizadas por indivíduos distantes deste grupo, como os não escolarizados ou pouco escolarizados, ou os advindos de regiões periféricas/rurais, mas não só: perfil de orientação e identidade de gênero, origem étnicoracial, religiosa ou outra característica social que agrupe falantes pode ser um traço social que se manifesta como diferente em relação ao que é historicamente legitimado como hegemônico.

É consenso na abordagem da Sociolinguística que as variedades usualmente refletem essas diferenças sociais entre os falantes e provocam reações de preconceito linguístico, principalmente naquelas pessoas que se situam nos pontos mais altos na pirâmide social, que pertencem a um nível socioeconômico mais alto e que dominam a variedade culta da língua. O preconceito linguístico se manifesta em comentários do tipo: “Fulano fala errado”, “Fulano não sabe falar direito”, “A fala de fulano é feia”... A isso se chama valor social das formas variantes. A fala (ou escrita) é avaliada ou julgada em função do status social dos indivíduos que a utilizam, e não pelas características linguísticas em si.

O processamento da informação social é, também, ativado por traços linguísticos. De acordo com Srull e Wyer (1989), é possível distinguir quatro fases distintas no processamento da informação social: a codificação, o arquivamento e recuperação da informação, o julgamento e a ação. Na fase de codificação, a informação é interpretada e organizada, a partir da utilização de esquemas mentais previamente disponíveis. Nesta etapa ocorre a transformação das pistas e estímulos externos em elementos internos, as representações mentais. O papel dos processos atencionais é decisivo nesta etapa, pois a atenção irá interferir tanto na seleção dos estímulos a serem atendidos e codificados, como também no esforço despendido para a assimilação do conteúdo e na consolidação dos conteúdos na memória. A fase seguinte do processamento envolve o registro e o posterior armazenamento da informação, que ocorre especialmente nas circunstâncias em que as pressões e as demandas situacionais tornam imperativa a utilização dos conteúdos para o desempenho das atividades conduzidas amiúde na vida cotidiana. Na terceira fase do processamento da informação social, o conteúdo codificado, armazenado e evocado é utilizado nas diferentes tarefas que exigem alguma modalidade de julgamento social. Neste caso, ocorre a compreensão das implicações dos possíveis cursos de ação, bem como a combinação das informações disponíveis com os conteúdos previamente disponíveis nos esquemas mentais armazenados, de forma que as decisões relativas aos elementos em julgamento possam ser tomadas. Finalmente, a conduta social é expressa, e como tal ela deve ser interpretada como uma interação entre o fluxo atual de acontecimentos e o conhecimento codificado e recuperado que foi adotado nas decisões e na formulação de planos de ação.

2. Saliência e processamento da variação linguística

Para o processamento sociolinguístico, os efeitos da saliência cognitiva podem ser medidos na relação entre a saliência estrutural e a diferença na distribuição de variáveis que carregam indexação social e as que não carregam indexação social (FREITAG, 2018; FREITAG, 2020b). O nível da consciência social é uma propriedade importante da mudança linguística que precisa ser determinada diretamente (WEINREICH; LABOV; HERZOG, 1968). A partir do grau de consciência, fenômenos variáveis têm sido categorizados em estereótipos – traços linguísticos socialmente marcados de forma consciente pelos falantes, marcadores – traços linguísticos sociais e estilísticos e que evocam efeitos consistentes sobre o julgamento consciente ou inconsciente do ouvinte sobre o falante; e indicadores – traços socialmente estratificados, que, no entanto, não são sujeitos à variação estilística (LABOV, 1972).

Eckert (2012), retomando Labov (1972), defende que os estereótipos e os marcadores operam como variáveis suscetíveis de percepção avaliativa e, com isso, emergem na variação estilística; os estereótipos seriam mais sensíveis à discussão metapragmática do que os marcadores. Os usos linguísticos conscientemente identificados pelos falantes operam como estereótipos. Os indicadores são variáveis dialetais que diferenciam aspectos sociais ou geográficos, embora não possam ser situados no contínuo da formalidade por não demandarem alguma valoração. Já na perspectiva de Silverstein (2003), os indicadores funcionariam como indexadores de primeira ordem, que definem traços genéricos de identificação, como os falantes de Nova York, de Detroit ou de Martha’s Vineyard; os estereótipos e marcadores operariam como indexadores de segunda ordem, que passam a veicular significados identitários mais específicos.

No entanto, o que faz com que uma variável seja sensível ou não à avaliação em uma comunidade pode ser atrelado ao seu grau de saliência; para isso, apenas a identificação da avaliação social das variáveis e variantes não é suficiente; é preciso adentrar no domínio da sociolinguística da percepção (que tem como objeto o julgamento do ouvinte), que correlaciona fatores sociais a traços sociolinguísticos, a fim de contribuir para o desvelamento de um padrão de consciência social na comunidade (FREITAG, 2018).

A consciência social é frequentemente evocada como uma característica da comunidade de fala, importante para a difusão de uma mudança linguística (LABOV, 1990; GUY, 1990; KRISTIANSEN, 2010; RACZ, 2013). Labov (1990) distingue mudanças no nível da consciência social (from above) das mudanças abaixo da consciência social (from below). O nível de consciência também está presente na escala de avaliação das variantes em indicadores, marcadores e estereótipos (LABOV, 1972). A premissa dos efeitos da consciência social é de que não é necessário ter consciência dos eventos para percebê-los, o que revela a existência de uma cognição implícita (UNDERWOOD; BRIGHT, 1996). Uma variante cognitivamente saliente, ainda que no nível inconsciente, pode vir a carregar indexação social, ou seja, tornar-se um marcador ou um estereótipo. No entanto, por não estar no nível da consciência social, o falante não é capaz de relacionar o juízo de valor ao traço linguístico em si, sendo necessário, para desvelar os seus efeitos, valer-se de técnicas indiretas (FREITAG, 2019; FREITAG, 2020b; FREITAG, 2020a).

Por isso, mensurar os efeitos da saliência sociocognitiva é um parâmetro crucial para estabelecer o escopo e as limitações das habilidades do falante para mudar a sua própria fala (FREITAG, 2021). Falantes-juízes fazem diferentes avaliações conscientes e inconscientes sobre diferentes variedades linguísticas, tanto variedades dialetais quanto variedades com interferência de outra língua e tais diferenças são dirigidas por conta da variação fonética socialmente marcada (CAMPBELL-KIBLER, 2012; CAMPBELLKIBLER, 2013; SCHLEEF, 2013). O nível de consciência atua também nos processos de acomodação linguística (TRUDGILL, 1986; YAEGER-DROR, 1993): a acomodação consciente ocorre com traços cognitivos mais salientes e a acomodação inconsciente ocorre com traços cognitivos menos salientes.

Quais características sociais são atribuídas a uma dada variedade linguística? Quais as variáveis linguísticas afetam a percepção de um dado grupo social? Como a informação social afeta o modo como um dado som ou traço linguístico é percebido? Um falante tem atitudes positivas ou negativas quanto a certa variante ou certo grupo social? Estas são questões relacionadas aos estudos de percepção sociolinguística que podem se valer da saliência sociocognitiva como fator explantatório. Se, por um lado, há o reconhecimento do papel chave da saliência sociocognitiva em fenômenos de mudança linguística (WAGNER; SANKOFF, 2011), por outro, estudos que buscam evidenciar relação entre a cognição implícita e a percepção da fala ainda são relativamente recentes (CAMPBELL-KIBLER, 2012).

O nível de consciência social desempenha um importante papel ao determinar quais variantes fonéticas são sujeitas à correção: por exemplo, falantes que se encontram em busca de acesso às universidades de prestígio nacional [nos Estados Unidos] modulam seu comportamento linguístico em direção a mudanças sonoras que estão acima do nível de consciência social, e por isso, passíveis de moderação; já mudanças sonoras abaixo do nível de consciência social acompanham o nível educacional dos falantes (PRICHARD; TAMMINGA, 2012).

Embora Eckert e Labov (2017) destaquem que variáveis fonológicas são mais facilmente adaptáveis para veicular significados sociais por conta de sua frequência e por estarem desvinculadas de funções referenciais, os resultados do estudo de Buchstaller (2016) apontam que somente as variantes que estão plenamente encaixadas nas estruturas cognitivas-avaliativas dos ouvintes mostram maleabilidade no ciclo de vida de um falante individual, sugerindo, por sua vez, que há consciência da indexação social de recursos linguísticos, mesmo nos níveis gramaticais mais altos. Falantes não só são sensíveis à diferença na distribuição de frequências, como no caso do “monitor sociolinguístico” (LABOV et al., 2006; LABOV et al., 2011; FREITAG, 2020a; STECKER, 2020) e essa sensibilidade é maior ou menor em diferentes fases da vida do falante, como efeito de fatores sociais e culturais aos quais está exposto (escolarização, mercado de trabalho, redes de relacionamento, entre outros). O nível de consciência social de uma forma também é suscetível à circunscrição geográfica, assumindo caráter de distinção dialetal: o que é saliente em uma variedade pode não ser em outra, como mostram os estudos replicados de Levon e colaboradores (LEVON; FOX, 2014; LEVON; BUCHSTALLER, 2015).

3. Máquinas quase humanas

Passar no teste de Turing significa que um chatbot consegue se passar por um humano. Um aspecto que tem sido explorado para atribuir humanidade à máquina é buscar um traço de imperfeição (THIES et al., 2017; RAPP; CURTI; BOLDI, 2021). O grau de humanidade atribuído a chatbots está associado à presença de erros de digitação ou de gramática (PARK et al., 2018; WESTERMAN; CROSS; LINDMARK, 2019). Se, por um lado, erros de digitação poderiam aumentar o nível de percepção da humanidade de máquinas, com base na identificação humana com a imperfeição, Westerman, Cross e Lindmark (2019) encontraram resultados opostos, sugerindo que os erros de digitação podem fazer pessoas desconfiar que estão interagindo com um chabot, e não com um humano.

Mais enfático é o resultado obtido por Park et al. (2021) de que a percepção de semelhança humana aumenta significativamente com o uso de palavras ofensivas pelo chatbot. Assim, para passar no teste de Turing, especificamente no critério sociolinguístico, demonstrar preconceito linguístico seria um preditivo de sucesso.

O efeito da variação linguística no desenvolvimento de modelos preditivos para o processamento de linguagem natural pode levar a vieses, considerando que modelos podem ser estabelecidos a partir de padrões que não se generalizam a outros falantes com características sociodemográficas, ou a confiar em relações indesejáveis entre traços e perfis sociodemográficos (SHAH; SCHWARTZ; HOVY, 2020). O campo do processamento da linguagem natural vem reconhecendo as relações intrínsecas entre linguagem, sociedade e indivíduo e seus impactos nos modelos preditivos, como o não reconhecimento pelo algoritmo do pertencimento a um grupo social, tendo como resultado vieses de raça e gênero (HOVY; SPRUIT, 2016). O reconhecimento da importância das emoções e do ser humano na interação com chatbots evidencia a necessidade de ampliar a noção de contexto para incluir a diversidade demográfica (ou os traços sociolinguísticos) (RAPP; CURTI; BOLDI, 2021).

Seguindo as evidências de que aplicação de traços sociolinguísticos para atribuir uma personalidade humana a chatbots, o avanço da inteligência artificial requer que a máquina ultrapasse a atual fronteira da competência sociolinguística, com a capacidade de adaptar a linguagem ao público-alvo. Para isso, é necessária a implementação de algoritmos para a sensibilidade sociolinguística, emulando o efeito da variação linguística no comportamento do humano na máquina. Esta sensibilidade eleva a percepção do usuário, levando-o a sentir maior proximidade e presença, e a uma avaliação positiva da ferramenta de inteligência artificial.

O campo da pesquisa na inteligência artificial que trata da interface linguística já fez grandes progressos no processamento do conteúdo linguístico, mas ainda tem pouco a contribuir para a compreensão da dimensão social da linguagem na inteligência de máquinas (NGUYEN et al., 2016). Na interação escrita, os avanços são maiores e possibilitam, por exemplo, a aplicação da inteligência conversacional para que chatbots – softwares para simular uma conversa humana em um chat – participem ativamente da interação com humanos. A descrição linguística voltada ao processamento de linguagem natural possibilita o desenvolvimento de algoritmos para a identificação do tema da conversa e manutenção e fluxo do diálogo. Mas, ainda assim, uma demanda latente é identificar as características sociolinguísticas necessárias ao chatbot para potencializar as interações com os humanos.

Em sendo o estudo da relação entre língua e sociedade, a Sociolinguística tem contribuições que podem favorecer e aprimorar os contextos de interação humano - máquina, tal como estudos pilotos de aplicação em campos específicos, como o do turismo (CHAVES et al., 2019; CHAVES; GEROSA, 2021), que demonstra o efeito do registro linguístico (a sensibilidade à variação linguística) no comportamento do humano. Outro estudo consiste no experimento de laboratório com a inserção de traços sociais da linguagem, como marcadores discursivos, em um chatbot (LEE; LEE; SAH, 2020), que demonstrou que, assim como na interação entre humanos (SCHLEEF, 2021), este traço afeta a percepção do usuário, levando-o a sentir maior proximidade e presença, levando a uma avaliação positiva da ferramenta de inteligência artificial. Chaves et al. (2019) ainda destacam a necessidade de investigação do impacto das variedades não padrão da língua na interação com chatbots para o desenvolvimento de técnicas de adaptação às variações de dinâmicas de propósitos nas interações.

A competência social (ou sociolinguística) nas máquinas, com a capacidade de adaptar a linguagem ao público-alvo, ainda é uma demanda a ser explorada para o atendimento ao teste de Turing, e, por conseguinte, no campo das tecnologias habilitadoras da inteligência artificial. Estudos recentes têm se dedicado a analisar a viabilidade de aplicação de traços sociolinguísticos para atribuir uma personalidade humana a chatbots (HORZYK; TADEUSIEWICZ, 2009; WIAK; KOSIOROWSKI, 2010; PARADOWSKI et al., 2012; TARABAN; MARSHALL, 2017; BANCHS, 2017; GASS; SEITER, 2018), nenhum deles em português brasileiro.

Em termos práticos, a identificação de padrões sociolinguísticos poderia levar a ajustes no chatbot para atingir propósitos comunicativos:

• A aderência aos padrões do humano pelo chatbot resultaria em colaboração e proximidade

• A divergência dos padrões linguísticos do humano pelo chatbot levaria à ruptura e ao distanciamento

Por exemplo, em um caso de cancelamento de serviço, um chatbot com perfil linguístico aderente ao humano poderia sensibilizar para a manutenção do serviço; em um caso de contestação de cobrança, o distanciamento por meio de um perfil linguístico divergente do humano poderia manter a hierarquia social requerida. Esta é uma potencialidade que pode mudar o futuro do marketing digital (DAVENPORT et al., 2020). Mas não só isso: em usos psicológicos e pedagógicos, como a plataforma Replika tem sido utilizada (ROMERO; CASADEVANTE; MONTORO, 2020; KIM, 2019), o ajuste ao padrão linguístico do humano poderia levar maior maior acolhimento por meio da proximidade linguística do chatbot, gerando resultados mais otimizados (SHANK et al., 2019).

Entendido como uma reação consciente ou inconsciente a um traço sociolinguístico variável, o preconceito linguístico tem potencialidade de humanizar ainda mais as máquinas. Para implementar o preconceito linguístico em um algoritmo de processamento da linguagem natural, o treinamento não supervisionado seria suficiente. No entanto, o limite ético entre o aceitável e o não aceitável também é fluido entre os humanos, e dependente de grupos. O estudo de Park et al. (2021) mostrou que à medida que os humanos percebiam semelhança humana com os chatbots aumentou sua probabilidade de usar palavras ofensivas visando consenso em temas politicamente incorretos, com ofensas a grupos étnicos-raciais e partidos políticos. Ou seja, a humanidade da máquina fez com que os humanos reagissem ainda mais humanamente. Se os exemplos anteriores se valiam da manipulação inconsciente dos traços linguísticos para atingir propósitos comunicativos, a discriminação linguística consciente (FREITAG et al., 2020) teria resultados semelhantes aos obtidos por Park et al. (2021). Os embargos éticos, no entanto, ainda não nos permitem ultrapassar essa fronteira, já que, muitas vezes, os humanos acreditam que falam com humanos reais enquanto estão falando com chatbots, (ADAMOPOULOU; MOUSSIADES, 2020; SHAH; SCHWARTZ; HOVY, 2020; RAPP; CURTI; BOLDI, 2021).

Ainda é necessário, como tarefa da sociolinguística, sistematizar os padrões da consciência sociolinguística. Esta tarefa é essencial treinar o algoritmo que permite que a máquina seja percebida pela sociedade como uma entidade potencialmente inteligente, de modo a propiciar a aplicação de características sociais a um chatbot para potencializar as interações com os humanos. Na prática, significa ensinar um xibolete para a máquina: um conjunto de padrões linguísticos a serem considerados para identificar origem social ou dialetal de um falante.

4. Matrix

A narrativa distópica em que máquinas interagem com humanos se manifesta na ficção há muito tempo. Projeções de quando isso iria acontecer variam: 2001 (2001 – Uma Odisseia no espaço, 1968), 2026 (Metrópolis, 1927), entre 1995 e 2021 (Exterminador do Futuro, 1984), 2035, (Eu, robô, 2004), ou mesmo uma realidade que já aconteceu, como em Soldado do Futuro (2013), cuja narrativa se desenrola durante a Guerra Fria e tem como tema o desenvolvimento de uma inteligência artificial autoconsciente. Mas ao tornarmos quase humanas as máquinas, podemos estar prevendo uma Matrix (1999), em 2199?

Mesmo não tendo se confirmado o cenário distópico, a narrativa de Blade Runner tem como pano de fundo a questão ética e rege a relação entre humanos e máquinas, lançando luz sobre as consequências da inteligência artificial. A narrativa do universo de Matrix (Bits of Information, spin-off de Matrix) inicia no começo do século XXI, com a criação de máquinas para a função de assistência, com características quase humanas. Após ser maltratada por seu dono, uma máquina se rebela e assassina toda a sua família, estopim do conflito entre homens e máquinas que levou ao cenário de 2199.

Será que devemos ensinar a máquina a ser preconceituosa? Na Bíblia, Livro dos Juízes, capítulo 12, versículos 1-6, é narrado um uso letal da manipulação de um traço sociolinguístico enquanto uma tecnologia de sobrevivência. Pronunciar "sibolete" ou "xibolete", fricativa alveolar ou alveopalatal, colocar a língua um pouco antes ou um pouco depois, poderia custar a vida de um efraita. Esta história bíblica dá origem a um artifício na linguística conhecido como xibolete (shibolleth). Nos tempos atuais, xiboletes continuam sendo destrutivos na relação entre humanos, especialmente em contextos de guerra (MCNAMARA, 2005). Quais seriam as consequências de estender este uso ao contexto das máquinas?

Vivemos um momento em que a ciência se força a ser pensada como utilitarista, em alinhamento a áreas estratégicas, dentre as quais as ciências humanas sempre ficam de fora. Este foi um exercício de pensar a ciência linguística enquanto utilidade imediata, tanto que esta ideia foi contemplada com bolsa de produtividade em desenvolvimento tecnológico. Mas, de minha parte, ficará apenas no exercício distópico.

5. Agradecimentos

Aos avaliadores da submissão procolada no CNPq sob número 0210433146415400, ematendimento à Chamada CNPq Nº 02/2020 - Bolsa de Produtividade em Desenvolvimento Tecnológico e Extensão Inovadora - DT, contemplada, mas não implementada. Àspareceristas Livia Oushiro e Márcia Vieira, pelas sugestões e questionamentosque contribuíram substancialmente para o aprimoramento do texto final.

Referências

ADAMOPOULOU, E.; MOUSSIADES, L. An overview of chatbot technology. In: SPRINGER. IFIP International Conference on Artificial Intelligence Applications and Innovations. [S.l.], 2020. p. 373–383.

ALLPORT, G. Attitudes//A Handbook of Social Psychology/Ed. by Murchison Clark Univ. [S.l.]: Press, 1935.

BANCHS, R. E. On the construction of more human-like chatbots: Affect and emotion analysis of movie dialogue data. In: IEEE. 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC). [S.l.], 2017. p. 1364–1367.

BUCHSTALLER, I. Investigating the effect of socio-cognitive salience and speaker-based factors in morphosyntactic life-span change. Journal of English Linguistics, SAGE Publications Sage CA: Los Angeles, CA, v. 44, n. 3, p. 199–229, 2016.

CAMPBELL-KIBLER, K. The implicit association test and sociolinguistic meaning. Lingua, Elsevier, v. 122, n. 7, p. 753– 763, 2012.

CAMPBELL-KIBLER, K. Connecting attitudes and language behavior via implicit sociolinguistic cognition. Language (de)standardization in Late modern Europe: Experimental Studies, ed. by Tore Kristiansen and Stefan Grondelaers, p. 307–329, 2013.

CHAVES, A. P. et al. It’s how you say it: Identifying appropriate register for chatbot language design. In: Proceedings of the 7th International Conference on Human-Agent Interaction. [S.l.: s.n.], 2019. p. 102–109.

CHAVES, A. P.; GEROSA, M. A. How should my chatbot interact? a survey on social characteristics in human–chatbot interaction design. International Journal of Human–Computer Interaction, Taylor & Francis, v. 37, n. 8, p. 729–758, 2021.

DANZIGER, S. Where intelligence lies: Externalist and sociolinguistic perspectives on the turing test and ai. In: SPRINGER. 3rd Conference on Philosophy and Theory of Artificial Intelligence. [S.l.], 2017. p. 158–174.

DAVENPORT, T. et al. How artificial intelligence will change the future of marketing. Journal of the Academy of Marketing Science, Springer, v. 48, n. 1, p. 24–42, 2020.

ECKERT, P. Three waves of variation study: The emergence of meaning in the study of sociolinguistic variation. Annual review of Anthropology, Annual Reviews, v. 41, p. 87–100, 2012.

ECKERT, P.; LABOV, W. Phonetics, phonology and social meaning. Journal of sociolinguistics, Wiley Online Library, v. 21, n. 4, p. 467–496, 2017.

EDWARDS, J. Refining our understanding of language attitudes. Journal of language and social psychology, Sage Publications Sage CA: Thousand Oaks, CA, v. 18, n. 1, p. 101–110, 1999.

FREITAG, R. M. K. Saliência estrutural, distribucional e sociocognitiva. Acta scientiarum. Language and culture, v. 40, n. 2, p. e41173–e41173, 2018.

FREITAG, R. M. K. Kappa statistic for judgment agreement in sociolinguistics. Revista de Estudos da Linguagem, v. 27, n. 4, p. 1591–1612, 2019.

FREITAG, R. M. K. Effects of the linguistics processing: Palatals in brazilian portuguese and the sociolinguistic monitor. University of Pennsylvania Working Papers in Linguistics, v. 25, n. 2, p. 4, 2020.

FREITAG, R. M. K. Reparos na leitura em voz alta como pistas de consciência sociolinguística. DELTA: Documentação de Estudos em Linguística Teórica e Aplicada, SciELO Brasil, v. 36, 2020.

FREITAG, R. M. K. O desenvolvimento da consciência sociolinguística e o sucesso no desempenho em leitura. ALFA: Revista de Linguística, v. 65, 2021.

FREITAG, R. M. K. et al. O uso da língua para a discriminação. A Cor das Letras, v. 21, n. 1, p. 185–207, 2020. GASS, R. H.; SEITER, J. S. Persuasion: Social influence and compliance gaining. [S.l.]: Routledge, 2018.

GUY, G. R. The sociolinguistic types of language change. Diachronica, John Benjamins, v. 7, n. 1, p. 47–67, 1990.

HAYES, P.; FORD, K. Turing test considered harmful. In: CITESEER. IJCAI (1). [S.l.], 1995. p. 972–977.

HIPPEL, W. V.; SEKAQUAPTEWA, D.; VARGAS, P. The linguistic intergroup bias as an implicit indicator of prejudice. Journal of Experimental Social Psychology, Elsevier, v. 33, n. 5, p. 490–509, 1997.

HORZYK, A.; TADEUSIEWICZ, R. A psycholinguistic model of man-machine interactions based on needs of human personality. In: Man-Machine Interactions [S.l.]: Springer, 2009. p. 55–67.

HOVY, D.; SPRUIT, S. L. The social impact of natural language processing. In: Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). Berlin, Germany: Association for Computational Linguistics, 2016. p. 591–598. Disponível em: hhttps://aclanthology.org/P16-2096i.

KIM, N.-Y. A study on the use of artificial intelligence chatbots for improving english grammar skills. Journal of Digital Convergence, The Society of Digital Policy and Management, v. 17, n. 8, p. 37–46, 2019.

KRISTIANSEN, T. Attitudes, ideology and. The SAGE handbook of sociolinguistics, Sage, v. 120, p. 265, 2010.

LABOV, W. Language in the inner city: Studies in the Black English vernacular. [S.l.]: University of Pennsylvania Press, 1972.

LABOV, W. The intersection of sex and social class in the course of linguistic change. Language variation and change, Cambridge University Press, v. 2, n. 2, p. 205–254, 1990.

LABOV, W. et al. Listeners’ sensitivity to the frequency of sociolinguistic variables. University of Pennsylvania Working Papers in Linguistics, v. 12, n. 2, p. 10, 2006.

LABOV, W. et al. Properties of the sociolinguistic monitor. Journal of Sociolinguistics, Wiley Online Library, v. 15, n. 4, p. 431–463, 2011.

LEE, S.; LEE, N.; SAH, Y. J. Perceiving a mind in a chatbot: effect of mind perception and social cues on co-presence, closeness, and intention to use. International Journal of Human–Computer Interaction, Taylor & Francis, v. 36, n. 10, p. 930–940, 2020.

LEVON, E.; BUCHSTALLER, I. Perception, cognition, and linguistic structure: The effect of linguistic modularity and cognitive style on sociolinguistic processing. Language Variation and Change, Cambridge University Press, v. 27, n. 3, p. 319–348, 2015.

LEVON, E.; FOX, S. Social salience and the sociolinguistic monitor: A case study of ing and th-fronting in britain. Journal of English Linguistics, Sage Publications Sage CA: Los Angeles, CA, v. 42, n. 3, p. 185–217, 2014.

MCNAMARA, T. 21st century shibboleth: Language tests, identity and intergroup conflict. Language Policy, Springer, v. 4, n. 4, p. 351–370, 2005.

NGUYEN, D. et al. Computational sociolinguistics: A survey. Computational linguistics, MIT Press One Rogers Street, Cambridge, MA 02142-1209, USA journals-info . . . , v. 42, n. 3, p. 537–593, 2016.

PARADOWSKI, M. B. et al. From linguistic innovation in blogs to language learning in adults: what do interaction networks tell us? Birmingham: The Society for the Study of Artificial Intelligence and . . . , 2012.

PARK, M. et al. How do humans interact with chatbots?: An analysis of transcripts. International Journal of Management and Information Technology, v. 14, p. 3338–3350, 2018.

PARK, N. et al. Use of offensive language in human-artificial intelligence chatbot interaction: The effects of ethical ideology, social competence, and perceived humanlikeness. Computers in Human Behavior, Elsevier, v. 121, p. 106795, 2021.

PRICHARD, H.; TAMMINGA, M. The impact of higher education on philadelphia vowels. University of Pennsylvania Working Papers in Linguistics, v. 18, n. 2, p. 11, 2012. RACZ, P. ´ Salience in sociolinguistics. [S.l.]: De Gruyter Mouton, 2013.

RAPP, A.; CURTI, L.; BOLDI, A. The human side of human-chatbot interaction: A systematic literature review of ten years of research on text-based chatbots. International Journal of Human-Computer Studies, Elsevier, p. 102630, 2021.

ROMERO, M.; CASADEVANTE, C.; MONTORO, H. Cómo construir un psicólogochatbot. Papeles del Psicólogo, SciELO Espana, v. 41, n. 1, p. 27–34, 2020.

SAYGIN, A. P.; CICEKLI, I.; AKMAN, V. Turing test: 50 years later. Minds and machines, Springer, v. 10, n. 4, p. 463–518, 2000.

SCHLEEF, E. Glottal replacement of/t/in two british capitals: Effects of word frequency and morphological compositionality. Language Variation and Change, Cambridge University Press, v. 25, n. 2, p. 201–223, 2013.

SCHLEEF, E. Mechanisms of meaning making in the co-occurrence of pragmatic markers with silent pauses. Language in Society, Cambridge University Press, p. 1–27, 2021.

SHAH, D. S.; SCHWARTZ, H. A.; HOVY, D. Predictive biases in natural language processing models: A conceptual framework and overview. In: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. [S.l.: s.n.], 2020. p. 5248–5264.

SHANK, D. B. et al. Feeling our way to machine minds: People’s emotions when perceiving mind in artificial intelligence. Computers in Human Behavior, Elsevier, v. 98, p. 256–266, 2019.

SILVERSTEIN, M. Indexical order and the dialectics of sociolinguistic life. Language & communication, Elsevier, v. 23, n. 3-4, p. 193–229, 2003.

SRULL, T. K.; WYER, R. S. Person memory and judgment. Psychological review, American Psychological Association, v. 96, n. 1, p. 58, 1989.

STECKER, A. Investigations of the sociolinguistic monitor and perceived gender identity. University of Pennsylvania Working Papers in Linguistics, v. 26, n. 2, p. 14, 2020.

TARABAN, R.; MARSHALL, P. H. Deep learning and competition in psycholinguistic research. East European Journal of Psycholinguistics, v. 4, n. 2, p. 67–74, 2017.

THIES, I. M. et al. How do you want your chatbot? an exploratory wizard-of-oz study with young, urban indians. In: SPRINGER. IFIP Conference on Human-Computer Interaction. [S.l.], 2017. p. 441–459.

TRUDGILL, P. Dialects in contact. [S.l.]: Blackwell Oxford, 1986.

UNDERWOOD, G.; BRIGHT, J. E. Cognition with and without awareness. 1996.

WAGNER, S. E.; SANKOFF, G. Age grading in the montréal french inflected future. Language ariation and Change, Cambridge University Press, v. 23, n. 3, p. 275–313, 2011.

WEINREICH, U.; LABOV, W.; HERZOG, M. Empirical foundations for a theory of language change. [S.l.]: University of Texas Press Austin, 1968. v. 58.

WEIZENBAUM, J. Eliza—a computer program for the study of natural language communication between man and machine. Communications of the ACM, ACM New York, NY, USA, v. 9, n. 1, p. 36–45, 1966.

WESTERMAN, D.; CROSS, A. C.; LINDMARK, P. G. I believe in a thing called bot: Perceptions of the humanness of “chatbots”. Communication Studies, Taylor & Francis, v. 70, n. 3, p. 295–312, 2019.

WIAK, S.; KOSIOROWSKI, P. The use of psycholinguistics rules in case of creating an intelligent chatterbot. In: SPRINGER. International Conference on Artificial Intelligence and Soft Computing. [S.l.], 2010. p. 689–697.

YAEGER-DROR, M. Linguistic analysis of dialect “correction” and its interaction with cognitive salience. Language Variation and Change, Cambridge University Press, v. 5, n. 2, p. 189–224, 1993.

How to Cite

FREITAG, R. M. K. Linguistic prejudice for humanizing machine. Cadernos de Linguística, [S. l.], v. 2, n. 4, p. e495, 2021. DOI: 10.25189/2675-4916.2021.v2.n4.id495. Disponível em: https://cadernos.abralin.org/index.php/cadernos/article/view/495. Acesso em: 28 mar. 2024.

Statistics

Copyright

© All Rights Reserved to the Authors

Cadernos de Linguística supports the Opens Science movement

Collaborate with the journal.

Submit your paper