<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.2 20190208//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:ali="http://www.niso.org/schemas/ali/1.0">
  <front>
<journal-meta>
<journal-id journal-id-type="nlm-ta">Cadernos de Linguística</journal-id>
<journal-title-group>
<journal-title>Revista da Abralin</journal-title>
</journal-title-group>
<issn pub-type="epub">2675-4916</issn>
<publisher>
<publisher-name> Associação Brasileira de Linguística </publisher-name>
</publisher>
</journal-meta>
    <article-meta>
<article-id pub-id-type="doi">10.25189/2675-4916.2021.V2.N4.ID474</article-id>
      <article-categories>
        <subj-group>
          <subject content-type="Tipo de Contribuição">Ensaio Teórico</subject>
        </subj-group>
      </article-categories>
      <title-group>
        <article-title>
          <bold id="bold-1">ANÁLISE MULTIDIMENSIONAL</bold>
        </article-title>
        <subtitle>OS NÚMEROS NA LINGUÍSTICA</subtitle>
      </title-group>
      <contrib-group content-type="author">
        <contrib id="person-3c3c60556173f8d573eb113c2d6e07bd" contrib-type="person" equal-contrib="no" corresp="yes" deceased="no">
          <name>
            <surname>Delfino</surname>
            <given-names>Maria Claudia Nunes</given-names>
          </name>
          <email>claudia@fatecpg.com.br</email>
          <xref ref-type="aff" rid="affiliation-59e5a1663c487e892bc737b74328acd6" />
        </contrib>
      </contrib-group>
      <contrib-group content-type="editor">
        <contrib id="person-f6e93de22d5a621eea9c13c16a4230ff" contrib-type="person" equal-contrib="no" corresp="no" deceased="no">
          <name>
            <surname>Oliveira, Jr</surname>
            <given-names>Miguel </given-names>
          </name>
          <email>miguel@fale.ufal.br</email>
          <xref ref-type="aff" rid="affiliation-cacaa336e1c0380ea054bce3cbeed908" />
        </contrib>
        <contrib id="person-bbf699a10b319dd73c8522b6a904fa4c" contrib-type="person" equal-contrib="no" corresp="no" deceased="no">
          <name>
            <surname>Almeida</surname>
            <given-names>René Alain</given-names>
          </name>
          <email>renealain@hotmail.com</email>
          <xref ref-type="aff" rid="affiliation-cebc39cbb6f1834bd64f5407ca61b830" />
        </contrib>
      </contrib-group>
      <aff id="affiliation-59e5a1663c487e892bc737b74328acd6">
        <institution content-type="orgname">Pontifícia Universidade Católica de São Paulo (PUC–SP)</institution>
        <institution content-type="orgdiv1">Faculdade de Tecnologia de Praia Grande (FATEC–PG)</institution>
      </aff>
      <aff id="affiliation-cacaa336e1c0380ea054bce3cbeed908">
        <institution content-type="orgname">Universiade Federal de Alagoas</institution>
      </aff>
      <aff id="affiliation-cebc39cbb6f1834bd64f5407ca61b830">
        <institution content-type="orgname">Universidade Federal de Sergipe</institution>
      </aff>
      <pub-date date-type="pub" iso-8601-date="11/09/2021" />
      <volume>2</volume>
      <issue>4</issue>
      <issue-title>Desafios da Linguística na Ciência Aberta</issue-title>
      <elocation-id>e474</elocation-id>
      <history>
        <date date-type="accepted" iso-8601-date="02/09/2021" />
        <date date-type="received" iso-8601-date="08/08/2021" />
      </history>
      <permissions id="permission">
        <license>
          <ali:license_ref>http://creativecommons.org/licenses/by/4.0/</ali:license_ref>
        </license>
      </permissions>
      <abstract>
        <p id="_paragraph-1">A Linguística de Corpus, um dos ramos da Linguística Aplicada, tem como um dos seus construtos metodológicos a análise multidimensional, uma metodologia que leva em consideração a parte quantitativa da linguística, onde grandes quantidades de textos que formam o corpus de análise passam por procedimentos estatísticos. As características linguísticas dos textos são agrupadas em fatores de acordo com sua coocorrência nos textos que, ao serem interpretados linguisticamente, são chamadas de dimensões. Essa abordagem metodológica teve início na década de 80 com o linguista Douglas Biber nos Estados Unidos implementando o que chamamos abordagem americana da Linguística de Corpus. No Brasil, esta abordagem é desenvolvida tanto em textos em língua inglesa, portuguesa, alemã e espanhola e o LAEL na PUC-SP é o polo de desenvolvimento desta metodologia. O presente trabalho é uma revisão de literatura dessa abordagem que a princípio foi desenvolvida para análise gramatical / funcional e, hoje em dia, já aborda trabalhos na área lexical, semântica e colocacional.</p>
      </abstract>
      <abstract abstract-type="executive-summary">
        <title>Abstract</title>
        <p id="paragraph-b1f78b6399ed3e5f204e8c85d5ae9d2c">Corpus Linguistics, a branch of Applied Linguistics, has as one of its methodologic constructs, the multidimensional analysis, a methodology which takes into consideration the quantitative part of Linguistics, where large collection of texts make up the corpus of analysis which go through statistical procedures. The linguistic characteristics of the texts are grouped into factors according to their coocurrence in the texts. When these texts are linguistically interpreted, they are named dimensions. This methodologic approach started in the 80s with the American linguist Douglas Biber in the United States giving start to the American approach of Corpus Linguistics. In Brazil, this approach is developed in texts in English, but also in Portuguese, German and Spanish at LAEL in PUC-SP, which is the main place of development of this methodology. This work is a literary review of this approach that originated as a grammar / functional analysis and, nowadays, there is research in the lexical, semantic and collocational areas.</p>
      </abstract>
      <kwd-group>
        <kwd content-type="">Análise Multidimensional</kwd>
        <kwd content-type="">Linguística de Corpus</kwd>
        <kwd content-type="">Abordagem Metodológica</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body id="body">
    <p id="paragraph-d5f1df7347c9873bf04bb2a75e853d7c" />
    <p id="paragraph-ffdfe177076dc8e4a963df98de203891">
      <italic id="italic-8e69863835c0ef88623c1f6d5a581cd4">A língua parece muito diferente quando você olha para um monte de textos ao mesmo tempo.<xref id="xref-aa05da01ac8a0fb6250e678d4be3a199" ref-type="fn" rid="footnote-f0ecd757fd7fc925aa874771fae4684f">1</xref></italic>
    </p>
    <p id="paragraph-39196ecb5e14fc75b9fc3bbfd85b8165"><italic id="italic_-cb2e815e659e0246c06bc22ba044747a">– </italic>Sinclair (1991)</p>
    <sec id="heading-ac5b9ebaf5848a2aebfab7263fa7a046">
      <title>Análise multidimensional - origem</title>
      <p id="paragraph-1b65e5e9c96204301f82a2519f17aa40">Na década de 80, mais especificamente no ano de 1985, o linguista norte-americano Douglas Biber trouxe-nos uma nova maneira de enxergar a língua, por meio da análise de vários textos ao mesmo tempo, valendo-se de uma abordagem estatística, envolvendo múltiplas variáveis, a Análise Multidimensional (AMD). O grande argumento de Biber foi o fato dele entender que a língua não pode ser caracterizada de maneira adequada a partir de uma única dimensão textual, mas deve ser descrita por meio de uma variedade de dimensões que consigam abarcar a descrição de aspectos diferentes dentro de um mesmo texto. O autor considerava inadequado pensar em uma caracterização linguística como dicotômica e que o correto seria considerar a língua como um <italic id="italic-4bcacd406155527cc0b3c09b7a9cd8b4">continuum</italic>, onde um determinado tipo de texto seria descrito como contendo <italic id="italic-2187f9af7e3a1d4ff582ade60a1e8262">mais </italic>ou <italic id="italic-7a9cdbc9304d3ebdc83d8d8002a90ae0">menos</italic> de uma determinada característica (por exemplo, mais ou menos formal/informal) (Biber, 1988: p.9). </p>
      <p id="paragraph-7c1b02761577c72bd3f5293c068d9a7b">Biber também propôs uma abordagem bottom-up<xref id="xref-0fac4e3ade4dcf79b1f7ab2a33fdcd54" ref-type="fn" rid="footnote-a58c83c1952763a6493e241f251f5281">2</xref> para se estudar a língua, pois as características estudadas seriam selecionadas por padrões de co-ocorrência que se revelariam através de uma análise fatorial exploratória, possibilitando a descrição de grandes quantidades de dados linguísticos em diferentes registros<xref id="xref-400a4d0b829528773f7f0b5aceb6e5f8" ref-type="fn" rid="footnote-75e9e6d51f17f9bc326df5db2582f40b">3</xref>. A prevalência da ocorrência de grupos de características identificadas na análise fatorial foi usada para identificar uma função comunicativa que essas características compartilham quando aparecem juntas e, quando interpretadas, recebem o nome de ‘dimensão’. Biber descreve essas dimensões como sendo parâmetros subjacentes de variação linguística (Biber, 1985, p.338). </p>
      <p id="paragraph-d7b9c64122ab1df1996fa4cabbc740f0">O autor, em 1988, trabalhou com um <italic id="italic-ed9c9c39e58da5880bba0f21ecaea787">corpus </italic>de textos que representasse a variedade de registros do inglês na época e, para atingir tal objetivo, os <italic id="italic-2f2beace18291f4d1224bda3ae78b6f8">corpora</italic> escolhidos foram o LOB <italic id="italic-6d344eb447433984ea337c292cdc887b">corpus</italic> (<italic id="italic-1a05190386ce23527456cfa9e967f1b3">Lancaster-Oslo-Bergen<xref id="xref-36c96bd5dbaf0378740d5974d1098168" ref-type="fn" rid="footnote-72d9ac82f8053afbde053ad8f81e037a">4</xref> Corpus</italic>), de textos escritos em inglês britânico e o London-Lud, de transcrições de eventos falados, também do inglês britânico. Além desses dois <italic id="italic-5">corpora,</italic> foram adicionados mais dois registros, cartas pessoais e cartas profissionais, o que totalizou 481 textos e 960 mil palavras. O próximo passo foi selecionar características linguísticas que, segundo a literatura da época, seriam relevantes para a descrição da língua. Para tanto, 67 características de cunho lexical e estrutural foram reunidas e chamadas de variáveis. Com o <italic id="italic-6">corpus </italic>e as variáveis em mãos, o passo seguinte foi etiquetar<xref id="xref-5c141f0b5b7c3616c6f426bd22c6116e" ref-type="fn" rid="footnote-bdfffd91606ff9af46f91413a0e93d50">5</xref> esses textos com as variáveis selecionadas através de um etiquetador que o próprio autor desenvolveu especificamente para este estudo, o Biber Tagger. Então, as etiquetas foram contadas com outro programa desenvolvido especificamente para o estudo, o Biber Tag Count, que gerou uma planilha em Excel que foi então introduzida no pacote estatístico<xref id="xref-f34af378def5bf64f281547533b3218f" ref-type="fn" rid="footnote-4e75c9e43d1b10448429e90628554332">6</xref> para rodar a análise fatorial. </p>
      <p id="paragraph-8182f3825aef10c30a144e0f10587118">A primeira análise fatorial (chamada de não rotacionada) possibilitou a verificação do número de fatores a serem analisados. No caso do estudo de Biber (1988), 7 fatores foram extraídos, depois o próprio autor considerou os dois últimos fatores não representativos o suficiente e manteve 5 fatores como a solução ideal. Esse número de fatores é definido através do gráfico de escarpa que é o resultado dessa análise não rotacionada em conjunto com a tabela de quantidade de variação compartilhada, conforme mostram as figuras 1 e 2. A partir dessas duas figuras, podemos fazer duas observações importantes: o primeiro fator possui um número altíssimo, maior que o triplo do segundo, ou seja, a maior parte da variação do <italic id="italic-4b1c2052b288ec80cb6dd1a611696c09">corpus</italic> está nele, consequentemente, um número maior de variáveis aloca-se nele.</p>
      <fig id="figure-panel-ef93e30ecf495df512c2ebb6eb9c615c">
        <label>Figure 1</label>
        <caption>
          <title><bold id="bold-d8fdd9f28033aa3e4eb6a08dabc42182">Figura 1.</bold> Gráfico de escarpa contendo <italic id="italic-2a718cc9ceb81504e56746df0185c42d">eigenvalues<xref id="xref-850021bdb1a8a608c5b00426dd6e409b" ref-type="fn" rid="footnote-49bfd716c270dee0a8b42dcde9331dc8">7</xref> </italic>e o número de fatores</title>
          <p id="paragraph-082a5c24c49fffc0c53ba6e90834fc1e"><bold id="bold-b0553c4fde98cc5df28ff9442d8749ca">Fonte: </bold>Adaptado de Biber (1988: p.83)</p>
        </caption>
        <graphic id="graphic-bb6e509e8258889779674023d6722446" mimetype="image" mime-subtype="png" xlink:href="f1.png" />
      </fig>
      <p id="paragraph-8a6c26364accef98917fbf0568e25ae3">Essa situação é muito comum em análise fatorial; podemos dizer que neste tipo de análise o primeiro fator é sempre o ‘mais importante’. A segunda observação é que há uma estabilidade no valor dos <italic id="italic-98465811ef2e8717f027cfe51a2312a3">eigenvalues</italic> a partir do fator 5, mas em estudos exploratórios como uma análise fatorial, recomenda-se testar a segunda rotação com mais de uma quantidade de número de fatores. Neste trabalho, Biber testou com 07 fatores e acabou ficando com 5 em que, onde realmente pode-se ver uma estabilidade com 5 fatores, como pode ser visto nas figuras 1 e 2, que também mostram a alta porcentagem da variação captada pelo fator 1 e uma pequena diferença de variação a partir do fator 5. A primeira análise (não rotacionada) também é necessária para fornecer informações importantes para a análise, tais como a adequação das variáveis para uma análise fatorial, que é feita através do teste KMO<xref id="xref-5dd2060948eb73e0eaceec8fbccf88a8" ref-type="fn" rid="footnote-feedfeef27d4abd69c1ab48e50f3f397">8</xref> e a correlação das variáveis através do teste de esferecidade de Barlett<xref id="xref-ecd67b8a64489bdf90daa94ea1666253" ref-type="fn" rid="footnote-f5df9f0e0e78f2a5c178df14a215df2a">9</xref>.</p>
      <fig id="figure-panel-1c4f5ee1cfb563d26912edb1f8f311ff">
        <label>Figure 2</label>
        <caption>
          <title><bold id="bold-e70a58b38ddd82965e8e331a81f8ae72">Figura 2. </bold><italic id="italic-a13fbc139578feaca75fa2efe6e9960a">Eigenvalues</italic> da análise fatorial não rotacionada</title>
          <p id="paragraph-3a34add8a95dd92aa5ce5c797aab301c"><bold id="bold-d3a42664a2a1500baabfaaea0f848043">Fonte: </bold>Adaptado de Biber (1988, p.83)</p>
        </caption>
        <graphic id="graphic-55f989ff5056244a7d1088242db8fd17" mimetype="image" mime-subtype="png" xlink:href="f2.png" />
      </fig>
      <p id="paragraph-53e24a92428f07a576807ae06609ec9d">Com o número de fatores em mãos, uma segunda análise fatorial foi realizada, agora rotacionada. Na segunda análise, as variáveis foram distribuídas nos 07 fatores (no caso da pesquisa de Biber (1988)) de acordo com o peso de cada variável. A figura 3 ilustra os passos de uma análise fatorial completa (não rotacionada e rotacionada), onde podemos notar que essa análise se divide em 03 etapas:</p>
      <fig id="figure-panel-937363417771c6eeaf74a9e2b878f306">
        <label>Figure 3</label>
        <caption>
          <title><bold id="bold-94b33a07970bf2f38af1e120bee6dcfa">Figura 3. </bold>Passos de uma análise fatorial</title>
          <p id="paragraph-37f783f0f37d1d77c3f900e31797ad77"><bold id="bold-dc3f1f52c33ca0ed879936064f7e270a">Fonte: </bold>Adaptado de<bold id="bold-2"> </bold>Berber Sardinha (2017) </p>
        </caption>
        <graphic id="graphic-bdc23b8e1fd0c559704abd61f1f0e166" mimetype="image" mime-subtype="png" xlink:href="f3.png" />
      </fig>
      <p id="paragraph-5cd8310ee825f9e94b8121deff9a0ffd">1- Pré-processamento do <italic id="italic-bfe6718be1dfd4129e63cab4e3c69aed">corpus</italic>: </p>
      <p id="paragraph-05d270bcfa38b46ca5fab149f245b9f5">· o primeiro passo é a etiquetagem dos textos (POS tagging);</p>
      <p id="paragraph-374bae0d3dc59750b493a26db67963b8">· a seguir, esses textos devem ser normalizados por 1000<xref id="xref-627d4dc0b4cfa841831e0cd1693221ee" ref-type="fn" rid="footnote-21fb9ad1e725cd912dd11b6775b4eaa7">10</xref>, para que textos de tamanhos diferentes consigam ser comparados sem que um texto com muitas palavras sobressaia em relação a um texto com menos palavras; </p>
      <p id="paragraph-51768cf79a39cd2950b52a4e70e5853f">· a seguir a seleção das variáveis é realizada a partir do valor das comunalidades<xref id="xref-e2620b9a02857b5c910973d85c34e58f" ref-type="fn" rid="footnote-2336975aba60e946df00fa933379136a">11</xref> das variáveis;</p>
      <p id="paragraph-1fa4ccce0ff97d058134b4dd0f3be93b">2- Primeira análise fatorial (não rotacionada):</p>
      <p id="paragraph-935fb12a5be06ecdae95fffed783c66b">· roda-se a primeira análise fatorial e o número de fatores é então determinado (figuras 1 e 2);</p>
      <p id="paragraph-81844b9219533729d1a304dcf85f0ca1">3- Segunda análise fatorial (rotacionada):</p>
      <p id="paragraph-67c3de4e2375cd1e9d4a1e43063553a6">· roda-se então a segunda análise fatorial, retirando-se variáveis cujo peso é muito baixo;</p>
      <p id="paragraph-7aa7ade36a74a97a3416ec2dab161069">· calculam-se os escores dos textos e determina-se os escores dos fatores (figura 4);</p>
      <p id="paragraph-794de99ec5923aa3764a7af759f35d94">· a partir de uma análise qualitativa dos textos, juntamente com os resultados dos escores de cada variável em cada fator, as dimensões são nomeadas.</p>
      <p id="paragraph-91b332f68b5f9c9f550a080871d738bc" />
      <p id="paragraph-80d99735a35e1686bf7684be0c02a437">A figura 4 contém a distribuição de algumas variáveis nos 07 fatores extraídos no trabalho de Biber (1988) e é interessante analisar alguns dados. O primeiro deles é que todas as variáveis carregam em todos os fatores. O primeiro passo a ser tomado quando o pesquisador se depara com uma tabela dessas é alocar cada variável em um único fator, o fator onde ela possui maior peso absoluto. Por exemplo, as variáveis <italic id="italic-b0185de0a69e34136e3b4cb261e59531">PRO1</italic> e <italic id="italic-f84811baa721f6409bba3b39ebf3c578">PRO2 </italic>(pronomes de primeira e segunda pessoa, respectivamente) possuem maior peso absoluto no fator 1 (F1)<xref id="xref-607a0500bf9dc2891df5785cac2d694d" ref-type="fn" rid="footnote-f5c68a6fee848fa88bd227885ef3f443">12</xref>. Elas podem ser consideradas nos outros fatores para a análise qualitativa, mas seu ‘lugar principal’ é no fator 1. Ao olharmos a variável <italic id="italic-e261b18ee6ada5160e47fe8837d83af0">N </italic>(substantivo), notamos que ela possui um peso negativo, mas o seu maior valor absoluto também é no fator 1.</p>
      <fig id="figure-panel-132b1a3ae961eca089dcd1ac0a885a67">
        <label>Figure 4</label>
        <caption>
          <title><bold id="bold-2c483f4fd63e013099637c4d30a4d618">Figura 4. </bold>Variáveis distribuídas nos 07 fatores da análise original de Biber</title>
          <p id="paragraph-823c7b01008fadfda8cc00b771846d53"><bold id="bold-2a32916909892c0488aa329bc9ef5889">Fonte</bold>: Adaptado de Biber (1988, p.86)</p>
        </caption>
        <graphic id="graphic-3727437e674915abefb6caca65dc7a84" mimetype="image" mime-subtype="png" xlink:href="f4.png" />
      </fig>
      <p id="paragraph-02ce24d166e2d415c620456b7457a843">Isso ocorre porque em estudos de análise multidimensional levamos em consideração o valor numérico, o sinal positivo ou negativo é levado em consideração para definirmos o polo da dimensão, não possuindo peso de valor ou carga semântica, ou seja, não é dizer que uma variável que está no polo positivo possui conotação positiva, essa marcação positiva e negativa é dada pelo programa estatístico e não pela significado da variável. Após as variáveis serem computadas nos fatores estabelecidos, os textos que fazem parte do <italic id="italic-756ad60bcceb311561f14ad39ba4e1cc">corpus </italic>analisado possuem seus escores computados. Os escores consistem em somas relativas às quantidades das variáveis existentes em cada fator. Cada texto é computado em cada dimensão. A partir desta tabela completa (a figura 4 mostra apenas algumas variáveis), Biber interpretou o conjunto de características funcional e discursivamente, o que levou ao estabelecimento das dimensões. </p>
      <p id="paragraph-1613995de4a3876a2793f7393261a070">Cada dimensão, nada mais é do que uma escala onde são dispostos todos os registros incluídos na análise, de acordo com seus escores de dimensão e que pode conter dois polos opostos, de tal modo que as dimensões são geralmente descritas como ‘polo A <italic id="italic-0fab9117166a8d30a4ca6950fdf77ca5">versus</italic> polo B’. Quanto mais distantes os registros encontram-se na escala, mais diferentes esses registros são. Na terminologia da AMD, os termos ‘positivo’ e ‘negativo’ são empregados para se referir a esses polos, sendo que o polo A recebe o nome de ‘positivo’ e o polo B de ‘negativo’. Entretanto, tal denominação não significa dizer que um polo é mais importante do que o outro, pois na verdade eles se complementam. Os termos ‘positivo’ e ‘negativo’ apenas refletem a análise fatorial que traz resultados positivos e negativos, significando que em um mesmo texto quando uma variável positiva ocorre, uma negativa tende a não ocorrer ou ocorrer em menor número e vice-versa. A figura 5 traz a estrutura fatorial dos 03 primeiros fatores da pesquisa de Biber (1988), demonstrando como variáveis presentes no polo positivo não estão presentes no negativo e vice-versa. Como exemplo, observemos o fator 1, que possui variáveis com peso positivo (<italic id="italic-5000b3effb76398ade454e9e64c9418f">private verbs, that deletion, contractions, present tense verbs, 2nd person pronouns</italic><xref id="xref-a8632aa6a04f51f6678227e8df8de8ef" ref-type="fn" rid="footnote-8ecf59dd62c38e3f52a80bf3559c172f">13</xref>, entre outras) e variáveis com peso negativo (<italic id="italic-b8dd977e9e590f7c6467f7cdc70e1a47">nouns, word length, prepositions, type/token ratio, attributive adjs., place adverbials</italic><xref id="xref-25b11924360a207835aa0cf46fcb071b" ref-type="fn" rid="footnote-df410c51a94ef0e809b2a36781cddd6e">14</xref>, entre outras). Isso significa dizer que em textos que contêm grande quantidade de <italic id="italic-94d468f79f5a2a291da46da28dade501">verbos privados</italic><xref id="xref-843bcccbad2f222824a0a38631d97fa4" ref-type="fn" rid="footnote-ea407858968e34960a8bc21a42263e91">15</xref> e<italic id="italic-fe51493a1075cf03bb74829e6c053911"> apagamento do that, </italic>há uma tendência de aparecimento também de <italic id="italic-56f54740827530de88d39faae1560762">contrações </italic>e<italic id="italic-7"> verbos no presente. </italic></p>
      <p id="paragraph-f1e78ae22490b317e1aa3773c1fc0430">Por outro lado, nos textos em que existem <italic id="italic-3ad3eb5bc14f40e360f55e53cde191bc">verbos privados, apagamento do that, contrações e verbos no presente</italic> há uma tendência a escassez ou ausência de <italic id="italic-bababbafab389be98a772b608e9aebf0">substantivos </italic>e <italic id="italic-7374808cf593dbb87f93bd1a837a6799">palavras longas</italic>. Também pode-se notar que algumas das variáveis apresentam-se distribuídas nos fatores entre parênteses. O pesquisador se utiliza disso para demonstrar que elas estão presentes no polo apenas para efeito de interpretação qualitativa, mas seu valor absoluto é maior em outro fator. Exemplo disso é a variável <italic id="italic-4">present tense verbs</italic>, que está alocada nos fatores 1 positivo, com peso .86 e no fator 2 negativo, com peso -.47. Como seu valor absoluto é maior no fator 1 positivo, ela faz parte desse fator neste polo, mas pode ser levada em consideração na hora de interpretar a função comunicativa que o polo 2 negativo possui<xref id="xref-7166b49edfa6fea38250225f40c95f35" ref-type="fn" rid="footnote-cbe4151d38afa477d7d33015b628caca">16</xref>. </p>
      <p id="paragraph-b3cb288b118be73abc6ae49b993341d1">A partir da análise dessas variáveis em cada fator e, voltando aos textos para inspecionar como essas variáveis ocorriam em termos de função compartilhada, foi observado no fator 1 que as variáveis com peso positivo tinham como parâmetro subjacente o que se convencionou chamar de ‘produção interativa’. No outro lado do <italic id="italic-04538ff374d9ba95e328f0594fbf8c3e">continuum</italic>, o conjunto de características com peso negativo revelavam um parâmetro que se convencionou chamar ‘produção informacional’. Assim, o rótulo para a dimensão 1 da língua inglesa foi ‘produção interativa <italic id="italic-84075fe864c9950e05ebc5980b34e46d">versus </italic>produção informacional’.</p>
      <fig id="figure-panel-68530465a96890f5dea08b5ad2bf067e">
        <label>Figure 5</label>
        <caption>
          <title><bold id="bold-018f6c117db2ecb164d0b34204e0d8fb">Figura 5. </bold>Estrutura fatorial dos 03 primeiros fatores do estudo de Biber (1988)</title>
          <p id="paragraph-6d396811d58b02bb27e188b01bf96e8b"><bold id="bold-28f6f38c1a6367b87aabaf18ada03f9e">Fonte</bold>: Adaptado de Biber (1988, p.89)</p>
        </caption>
        <graphic id="graphic-71f904f9b738562081aaa369cfacfdce" mimetype="image" mime-subtype="png" xlink:href="f5.png" />
      </fig>
      <p id="paragraph-ead878da2b3038ea8061638b74ec613a">A figura 6 traz como os registros foram distribuídos na dimensão 1. Lembrando que os números que vemos na escala da dimensão 1 representam a média dos escores dos textos que compõem cada registro do <italic id="italic-404e9b621dda0bf4c13b460a719d1fcf">corpus</italic> em estudo. Como se percebe na figura 6 os registros mais fortemente associados com interação (na parte superior da escala), são as conversas, tanto por telefone como face a face; já os registros mais diretamente ligados à informação (na parte inferior) são documentos oficiais (como relatórios) e a escrita acadêmica e jornalista.</p>
      <fig id="figure-panel-07a4d057d35b892edbb98c57ececefbb">
        <label>Figure 6</label>
        <caption>
          <title><bold id="bold-ed545010e423fbf5988e25146ace496b">Figura 6. </bold>Dimensão 1 de Biber (1988)</title>
          <p id="paragraph-15052f61601d4d8e6885edbd298f30bd"><bold id="bold-65fdf5f1343f0e72aac66cc28de7e6e0">Fonte</bold>: Biber (1988, p.128)</p>
        </caption>
        <graphic id="graphic-0771a9d61712f6283abacc17a4f3c3e0" mimetype="image" mime-subtype="png" xlink:href="f6.png" />
      </fig>
      <p id="paragraph-2e10e20041284a30af573e395b63eac2">Biber valeu-se do mesmo procedimento para a descrição e nomeação das outras dimensões, que receberam os seguintes nomes e possuíram os seguintes registros mais tipicamente presentes em cada uma:<xref id="xref-a0bf36ac753155502a24de421ae1af32" ref-type="fn" rid="footnote-416e686a2e4012b5027a076f32b261ca">17</xref></p>
      <p id="paragraph-e87aeba391798bed54bbc49bd98cf85a" />
      <p id="paragraph-4fe689e0e49be41c84fbb329430d9f00">· Dimensão 1 – Produção interativa <italic id="italic-f74b0febcd0da5354a4d437f22dd1c67">versus </italic>produção informacional – polo interativo (positivo): conversas telefônicas e face a face; polo informacional (negativo): documentos oficiais, reportagem jornalística e prosa acadêmica.</p>
      <p id="paragraph-a04a53e916ef0605ba7c72ef86c591cf">· Dimensão 2 – Preocupações narrativas <italic id="italic-a54688ffaca0c63e297e5b35ee19ba35">versus</italic> não narrativas – polo narrativo (positivo): ficção; polo não narrativo (negativo): rádio e TV, passatempos e documentos oficiais.</p>
      <p id="paragraph-837195c64497a6516de458f049d1edde">· Dimensão 3 – Referências explícitas <italic id="italic-4f7e267b59d26512d2325dbc9a3b127d">versus</italic> referências dependente do contexto – polo referências explícitas (positivo):<italic id="italic-3e530343d4a0c2130cdd41beb63d17a0"> </italic>documentos oficiais<italic id="italic-50dc74fb14d0b0e635a113e7649d7ac0">,</italic> cartas profissionais, resenhas jornalísticas e prosa acadêmica; referências dependentes do contexto (negativo): rádio e TV, conversas telefônicas e face a face e ficção romântica.</p>
      <p id="paragraph-397cba87d486066854d0fe74918366a9">· Dimensão 4 – expressão explícita de persuasão <italic id="italic-22b409ec72aca61d7ed0f785d98ad1c8">versus </italic>não explícita – polo persuasivo (positivo): cartas profissionais, editoriais e ficção romântica; polo não persuasivo (negativo): rádio e TV, resenhas jornalísticas e ficção de aventura.</p>
      <p id="paragraph-a010514e312fb7597f59027bb5e20356">· Dimensão 5- informação abstrata <italic id="italic-cba39e87cd76e3dc86b87ad57a305483">versus </italic>não-abstrata – polo abstrato (positivo): acadêmico, documentos oficiais e religiosos; polo não-abstrato (negativo): conversas telefônicas e face a face e ficção romântica.</p>
      <p id="paragraph-70e145ad12cf43fe9b3b96ee663f1482" />
      <p id="paragraph-9c56192758ad56cfdaac5a4bdc08b30e">Este estudo proporcionou o mapeamento da língua inglesa nestas 05 dimensões e, portanto, um registro pode ser caracterizado funcionalmente/gramaticalmente, a partir da sua distribuição nestas 05 dimensões. Peguemos, por exemplo, o registro <italic id="italic-5d46102ef2161e6817a2f20ad8039f55">conversas face a face.</italic> Ao observarmos este registro nas 05 dimensões da língua inglesa, ele é caracterizado como: interativo (Dim. 1), não narrativo (Dim. 2), dependente do contexto (Dim. 3), não persuasivo (Dim. 4) e não-abstrato (Dim. 5).</p>
    </sec>
    <sec id="heading-579a1d9877536e69576f1103867e9b9f">
      <title>1. Análise multidimensional aditiva</title>
      <p id="paragraph-94995a40d44f82105723364e766f9d7f">Nem todos os registros foram estudados por Biber (1988), então trabalhos como o de Delfino (2016), que estudou um <italic id="italic-bddb1e496483bc9e27cc592cf98bbf97">corpus</italic> de letras de música pop, um registro não estudado por Biber em 1988, precisam ter seu escore descoberto para que possa haver a adição desse registro aos registros que Biber trabalhou. Nesta modalidade da análise não é necessário proceder-se à extração fatorial (análise rotacionada), que é típica de uma AMD completa. O <italic id="italic-6c50bc796e6036135d0a91e53c558e1b">corpus</italic> precisa estar etiquetado com as mesmas etiquetas do estudo base, ou seja, aquele ao qual será ‘adicionado’, além de ter as frequências das variáveis do <italic id="italic-19f2175f7ddfe762bbd064769b8e2e04">corpus</italic> a ser adicionado padronizadas segundo a média e desvio padrão do estudo base. </p>
      <p id="paragraph-7a8e990191594a3475ac5cccfa31b7e7">Após a etiquetagem com o Biber Tagger e contagem das etiquetas com o programa Biber Tag Count<xref id="xref-fa1c0c928bc1b9a8a30a59ddd08114e5" ref-type="fn" rid="footnote-c418120d8c5eb67bb3ab1c1cd4228ccf">18</xref> (exatamente como no trabalho de Biber (1988)), tem-se os escores dos textos e, por conseguinte do novo registro a ser adicionado. O <italic id="italic-ff6e5cc2f04f5fdd093c18856eeec400">corpus</italic> do referido trabalho citado como exemplo (DELFINO, 2016) foi desmembrado em 04 subcorpora<xref id="xref-aa6d8211809cdd26e3c092da6f62d8dc" ref-type="fn" rid="footnote-7387cd77dca53947d7c9c7adc5430644">19</xref> (cada banda ou artista foi considerado um subcorpus) e, tanto o <italic id="italic-b9e838fa69c89f7c6a9673259d3915de">corpus</italic> como um todo como cada uma das bandas e do artista foram alocados nos registros de Biber (1988). A figura 7 mostra como esses registros foram inseridos na Dimensão 1 de Biber (1988). Como pode ser observado o <italic id="italic-fb1488b0ec159f873f0500ed07ec8475">corpus </italic>CoEL e cada um de seus subcorpora estão posicionados entre cartas pessoais (a banda Bon Jovi é a que mais se aproxima deste registro) e conversas face a face (as bandas Beatles e Maroon 5 são as que mais simulam uma conversa com o público). </p>
      <p id="paragraph-e39cbd8e9960c20c8853bfd82ecbe2af">A autora mapeou o <italic id="italic-cd7ed596da1d2da9ab063163bd41c26e">corpus</italic> CoEL como um registro adicionado às cinco dimensões da língua inglesa (BIBER, 1988), da seguinte maneira: envolvido (Dim. 1), não narrativo (Dim. 2), dependente do contexto (Dim. 3), persuasivo (Dim. 4) e não abstrato (Dim. 5).</p>
      <fig id="figure-panel-f81e726f215709c13183d85c531258b3">
        <label>Figure 7</label>
        <caption>
          <title><bold id="bold-dda522ae9affaa86c009d4249339ff0d">Figura 7. </bold>Inserção do <italic id="italic-2f428adfbbebb0d7a30c4cea6c78969b">corpus</italic> CoEL na Dimensão de Biber (1988)</title>
          <p id="paragraph-84f776e0135b85881eaabe8a637f2536"><bold id="bold-b4445729f18aa7b2dbc8f850266fbe4c">Fonte: </bold>adaptado de Delfino (2016, p.72)</p>
        </caption>
        <graphic id="graphic-50eadaffd85f16d1155650dce2d30976" mimetype="image" mime-subtype="png" xlink:href="f7.png" />
      </fig>
    </sec>
    <sec id="heading-0d387d6ab324c33c5c15297eeb1e83f3">
      <title>2. Análise multidimensional lexical </title>
      <p id="paragraph-0c28074038960e5eaa95929dcce9dc56"><bold id="bold-772c7bf851a29dfc3381d31aaff351ab"> </bold>Berber Sardinha, em 2014, propôs um novo modelo para a Análise Multidimensional apresentada por Biber em 1988 que se baseia não na interpretação funcional, mas na interpretação lexical dos fatores, com o intuito de encontrar dimensões de variação lexical, identificadas por meio da interpretação dos campos temáticos subjacentes à coocorrência do léxico mais saliente. Para tanto, o autor investigou o uso dos adjetivos <italic id="italic-ee5a9e0d3ad5bb8256fd9eae1d98bb84">American</italic> e <italic id="italic-94e8fcbad0e49888f3f63302c3170d4b">Brazilian</italic>, bem como seus colocados – palavras que ocorrem perto do nódulo – para identificar os parâmetros de representação de identidade nacional e cultural por meio do qual os EUA e o Brasil são representados nas produções textuais em inglês a partir do século XIX disponibilizados pelo <italic id="italic-ac3d787c8e649c074a53c08edc364d6f">Google Books</italic>.</p>
      <p id="paragraph-296fb130847398e81c92ae3697972b6f">Na perspectiva lexical, a AMD empregada no referido estudo considerou como variáveis (unidade de análise) apenas as palavras de conteúdo<xref id="xref-3572c2f89787084c193e81600bbf1e47" ref-type="fn" rid="footnote-701f5e25f872a47b729d50fe68aa9dc3">20</xref> ou multipalavras para a identificação das dimensões de variação, ou seja, a diferença fundamental entre a análise multidimensional funcional/gramatical (proposta por Biber em 1988) e a lexical/temática (proposta por Berber Sardinha em 2014) recai justamente sobre as variáveis selecionadas e o etiquetador utilizado. No estudo de Biber (1988) e naqueles que se seguiram (BIBER, 2006; BIBER e TRACY-VENTURA, 2007; BERBER SARDINHA, KAUFFMANN e ACUNZO 2014, entre outros) o objetivo é a análise da variação gramatical/funcional; para tanto, o etiquetador Biber Tagger é utilizado e as variáveis são palavras de cunho léxico-gramatical (pronomes, substantivos, verbos, preposições, adjetivos, advérbios,...). </p>
      <p id="paragraph-249bc9b23f446f33012b223ae8d09e0e">Já para estudos lexicais/temáticos, o etiquetador recomendado é o Tree Tagger que etiqueta por lema, ou seja, pela forma da palavra conforme ela está grafada no dicionário. A figura 8 ilustra os aspectos similares e distintos entre a AMD funcional/gramatical e lexical/temática. No estudo de Berber Sardinha (2014), o autor fez os mesmos passos de uma análise multidimensional, mudando apenas as variáveis e o etiquetador (ou seja, a mudança ocorre no pré-processamento do <italic id="italic-ac409caaf76d800277aaff1e37a8f66c">corpus</italic>, mantendo o objetivo da análise em si (vide figura 3). O autor realizou duas análises multidimensionais, uma onde a palavra <italic id="italic-1ae8fd1f96e99c3e885abe90208dfb16">American</italic> era destacada e os colocados mais frequentes dela eram utilizados como variáveis e outra análise onde a palavra <italic id="italic-0a47b2b8f5f74bbf0f12dfba2c722c92">Brazilian </italic>foi destacada e seus colocados mais frequentes foram utilizados como variáveis. As dimensões encontradas por Berber Sardinha (2014) foram:</p>
      <fig id="figure-panel-01a92b929508c3f882a4b65ff837a762">
        <label>Figure 8</label>
        <caption>
          <title><bold id="bold-57d03af75af5c1652d9dd1832d958117">Figura 8. </bold>Aspectos da AMD funcional/gramatical e lexical/temática </title>
          <p id="paragraph-4a8ac7b72a7ab9e3489a8c7aca659c98"><bold id="bold-b28e35483c2d8a77e17827a8f01ebd11">Fonte: </bold>Adaptado de<bold id="bold-6c79600d56d957bc928f595f3ebccace"> </bold>Berber Sardinha (2017)</p>
        </caption>
        <graphic id="graphic-0c6cf1134422c7716db3319bf4cc0ec6" mimetype="image" mime-subtype="png" xlink:href="f8.png" />
      </fig>
      <p id="paragraph-62ab1d2a875b0fc026aa3f5fedfe48f8">Para <italic id="italic-928e6a0772e4beee64f43df08b68a98a">American: </italic>Dimensão 1 – <italic id="italic-11a5383f456802b47cd4afa40b1114a6">Superpower versus regional status; </italic>Dimensão 2 – <italic id="italic-6e7cd695c6d27141b3dd438e9424dad9">The people, the flag and the institutions; </italic>Dimensão 3 – <italic id="italic-465181c90b9753def7e3c1ea47a48cf1">Individuals, community and culture; </italic>Dimensão 4 – <italic id="italic-996d57e39f0e8d7788467442ba6ce4bc">The military, slavery and ideals; </italic>Dimensão 5 – <italic id="italic-7efef81a641dc91f7de11f0393f1479b">Literate expression versus revolution and the new nation.</italic><xref id="xref-5dd0a0ca33d60e5713ca65a194e833a3" ref-type="fn" rid="footnote-28aeef15c3899e4e4cef44d684f95b5a">21</xref> Para <italic id="italic-9">Brazilian: </italic>Dimensão 1 - <italic id="italic-10">The economy and politics; </italic>Dimensão 2 – <italic id="italic-11">Traditional art, sciences, the people and the land; </italic>Dimensão 3 – <italic id="italic-12">Raw materials and the landscape; </italic>Dimensão 4 – <italic id="italic-13">New artistic forms, women and men, religion and the environment; </italic>Dimensão 5 – <italic id="italic-3ae0b80306f52bf27ef6400b8c34d43a">The monarchy, steam transportation, and the wilderness.<xref id="xref-52c906ae6bd1918b51c7db89c8645bf1" ref-type="fn" rid="footnote-1ae8c982d91aa868d661b3719dcae133">22</xref></italic></p>
    </sec>
    <sec id="heading-f8a3ffde3da9d572df30561215e2c238">
      <title>3. Análise multidimensional colocacional<italic id="italic-76d3c64b3366ab41bff30c7fc18880e3"/></title>
      <p id="paragraph-e890758f1965667702850f0a2b1bf556"><bold id="bold-f9fdd66d67f97fb5751e1a917954f10a"> </bold>Em 2017, Berber Sardinha revelou a análise multidimensional colocacional sob uma perspectiva de registro, usando o <italic id="italic-afb06fce45df4555505637ec38e20220">Corpus of Contemporary American English</italic> (COCA), com 450 milhões de palavras (Davies, 2012). A metodologia também seguiu os passos de Biber em seu estudo seminal de 1988, com o mesmo objetivo de determinar as dimensões ou os parâmetros de variação subjacente presentes no <italic id="italic-1636e1473a9d712bde3a66ea8c24a974">corpus </italic>estudado. Sabendo que a análise fatorial, a base da análise multidimensional, tem como premissa a correlação de variáveis que ‘andam juntas’, faz muito sentido uma AMD colocacional, já que a colocação nada mais é do que palavras que ‘andam juntas’. O relacionamento entre o nódulo e seus colocados já havia sido apresentado por autores como Williams (1998), Mollet et al. (2011) e Brezina et al. (2015), mas o relacionamento entre os colocados e uma série de nódulos não era levado em consideração até estudos multidimensionais como o de Berber Sardinha (2017) e de Zuppardi (2020). </p>
      <p id="paragraph-28a591a1a6cc6ee18ed4488c72ca205d">As diferenças entre a AMD funcional/gramatical e a colocacional são as seguintes:</p>
      <p id="paragraph-319d59eb5d757972c241be38d72409e0" />
      <p id="paragraph-a27d22706c1303f6b8d96a2256ca731c">· as unidades de análise não foram os textos e sim pares de palavras, sendo uma o nódulo e outra o colocado (selecionados entre as palavras mais frequentes em cada registro do COCA);<bold id="bold-0e883acd6267c3d7c8c110d4261df45c"/></p>
      <p id="paragraph-92119fee9dc2628a0fd6c80107e76938">· as medidas utilizadas não foram as contagens dos textos (na AMD funcional essas contagens são fornecidas pelo programa Biber Count em uma planilha de Excel que é inserida no programa estatístico). Aqui as medidas são o log-dice, a força de atração que duas palavras possuem entre si (RYCHLY, 2008);<bold id="bold-662da6fcf779a26bd3b129008ab91975"/></p>
      <p id="paragraph-3bb0772dc0d2b8ff1640edd077ceb26f">· os escores de fator foram calculados para os colocados de cada palavra nódulo no <italic id="italic-eca85588fa65a28da12fa97a6a696b41">corpus</italic> ao invés de cada texto (como nos estudos funcionais/gramaticais);<bold id="bold-67c5e0ec46e5f8b43e762252edc436c0"/></p>
      <p id="paragraph-475a9b47ae36e9c33d2fb57cc33f81bc">· a base para interpretação dos fatores neste tipo de AMD foram as características lexicais reveladas pela sua preferência semântica, pacotes lexicais, campos de palavras, ‘aboutness’<xref id="xref-2019dc9c79997cfe2cdbbbf89526386e" ref-type="fn" rid="footnote-b44056d72f9e54c8d0f4dd5a18833992">23</xref>, tópicos e assuntos e não na base funcional/comunicativa, como na AMD funcional/gramatical.<bold id="bold-ea3b1c66e1da2c123daeb38fbdbfcf36"/></p>
      <p id="paragraph-db2fa42b6afe139c51550bde77d2d748" />
      <p id="paragraph-a800ae6be098eb516b6c783c7889c025">Berber Sardinha identificou 09 dimensões de colocação da língua inglesa: Dimensão1 – <italic id="italic-f9d7deb4435bd38f83478f00e944b709">Literate discourse</italic>, com os seguintes exemplos: <italic id="italic-49be466394e6eba7afa786540ddf0bdd">issue </italic>+ <italic id="italic-299145aa82bf8b9a6c0052d54275fc2f">relate, fator </italic>+ <italic id="italic-2c41e7bfa90d089d5fe01c99662781ae">relate, seem </italic>+ <italic id="italic-2e81887a18ec8a01e1fc9ff49a2f379e">appropriate<xref id="xref-b3d96a34b60e737b48623ba59ad1ffe5" ref-type="fn" rid="footnote-8f9d1065f34cf011b352697923cdbe22">24</xref></italic>; Dimensão 2 – <italic id="italic-4bdbdc8ba4cd649efc19093350b02ebd">Oral discourse</italic>, com os seguintes exemplos: <italic id="italic-2c758a1f19288b09fec9cf432ae15f34">want </italic>+ <italic id="italic-8">know, people </italic>+ <italic id="italic-91aa35a228d2f112e27233562fc7e769">know, want </italic>+ <italic id="italic-0572aca117695aff49d7fafcb9d06bae">say<xref id="xref-fc4742c97e84924bb051b23b42c4cc7b" ref-type="fn" rid="footnote-27e4dac9169ec2c6e7b4353bdfe476fe">25</xref></italic>; Dimensão 3 - <italic id="italic-6c745662afd73c6fa5bfd06f25441557">Objects, people, and actions</italic>, com os seguintes exemplos: <italic id="italic-27920022e8e7da18e177909ff101695a">stare </italic>+ <italic id="italic-0a024a65429322515672845d97c13b17">window, stare </italic>+ <italic id="italic-14">ceiling, slide </italic>+ <italic id="italic-4657eeacf2de9671c8f397ffc8e97c29">open<xref id="xref-1bda05fc2fc28bc5a6847c395fb2dc14" ref-type="fn" rid="footnote-88485b9fe8a3f8169b56b77601649c6c">26</xref></italic>; Dimensão 4 – <italic id="italic-16">Colloquial and informal language use</italic>, com os seguintes exemplos: <italic id="italic-17">afraid </italic>+ <italic id="italic-18">lose, mama</italic> + <italic id="italic-19">papa, mama</italic> + <italic id="italic-9ad1740f9a20288b6969724b258dd707">daddy<xref id="xref-31504877a1aea6f3c456b740946507d7" ref-type="fn" rid="footnote-d3026d185cd42dcb452479bd8d5c099c">27</xref></italic>; Dimensão 5 – <italic id="italic-21">Organizations and the government</italic>, com os seguintes exemplos: <italic id="italic-22">protection </italic>+ <italic id="italic-23">agency, oficial </italic>+ <italic id="italic-24">say, international </italic>+ <italic id="italic-758233e19d9a73fb4908866316a2a63c">monetary<xref id="xref-60d6848abbe1f27b106a2bbb801755b7" ref-type="fn" rid="footnote-5561ac844973e57890cde1c3c262fe3a">28</xref></italic>; Dimensão 6 – <italic id="italic-26">Politics and current affairs</italic>, com os seguintes exemplos: <italic id="italic-27">other </italic>+ <italic id="italic-28">politician, decline </italic>+ <italic id="italic-29">interview, police </italic>+ interview<xref id="xref-f79f991b3e4eb60bc58e2a857a5af5a2" ref-type="fn" rid="footnote-e55b09a3f52f0284929e2c98294cddef">29</xref>; Dimensão 7 – <italic id="italic-30">Feelings and emoticons</italic>, com os seguintes exemplos: <italic id="italic-31">feel </italic>+ <italic id="italic-32">shame, feel </italic>+ <italic id="italic-33">guilt, feel </italic>+ <italic id="italic-ce8ce9197043cc305ae704b48fd381c6">rage<xref id="xref-c1cc3834ff3d132e09bd06d9d94c757d" ref-type="fn" rid="footnote-2df75596969d127de263d58f5a782c2f">30</xref></italic>; Dimensão 8 – <italic id="italic-35">Cooking</italic>, com os seguintes exemplos: <italic id="italic-36">mix </italic>+ <italic id="italic-37">bowl, mix </italic>+ <italic id="italic-38">ingredient, cup </italic>+ <italic id="italic-26175aa6614cadf1710dbc1855bac843">sugar<xref id="xref-67cfc1ff2cc21480ab85ad4a86320306" ref-type="fn" rid="footnote-7ea2dc5655f3266b6e7d8653fcff8e03">31</xref></italic>; Dimensão 9 – <italic id="italic-40">Education</italic>, com os seguintes exemplos: <italic id="italic-41">student </italic>+ <italic id="italic-42">benefit, rate </italic>+ <italic id="italic-43">scale, expose </italic>+ <italic id="italic-44">student</italic>.<xref id="xref-fdb82ad5193d87d503d98fea75e4a7d8" ref-type="fn" rid="footnote-a2384642f219abd988cdd649ed63ecab">32</xref></p>
    </sec>
    <sec id="heading-c0012d1046cc548570d4eae2f7c89ea9">
      <title>4. Análise multidimensional semântica</title>
      <p id="paragraph-19b91e77ab2dd2228c8a9e78e98ffcd1"><bold id="bold-4d33debdd716a8f74b6e17d6511a0318"> </bold>Em 2021, Delfino e Berber Sardinha trouxeram um quarto modelo de análise multidimensional, em que o objetivo era entender a variação semântica que ocorria em um <italic id="italic-0f22a40a885ed4c7412b91bf7c6c8bc4">corpus</italic> de letras de música pop. A metodologia também seguiu aquela introduzida por Biber em 1988, com o mesmo objetivo de determinar as dimensões ou os parâmetros de variação subjacente presentes no <italic id="italic-42c3fd46491847d896274716c1c4e05c">corpus </italic>estudado. As diferenças entre a AMD funcional/gramatical e a semântica são as seguintes: </p>
      <p id="paragraph-505b00df83a938f2622022382b5c83e7" />
      <p id="paragraph-2a3d04e3758c065a640359115dbdf5a1">· as variáveis são os campos semânticos (anatomia, roupas) e não características de cunho estrutural (pronomes, verbos) como nos estudos funcionais/gramaticais;<italic id="italic-647694995f2a590920f4e580736dbbbc"/></p>
      <p id="paragraph-aee3877014b84b8697b51d408ef0d84c">· o etiquetador utilizado é o UCREL, o etiquetador de análise semântica desenvolvido pela universidade de Lancaster<xref id="xref-fb5950604d9d5a5abd146d446dd1b12d" ref-type="fn" rid="footnote-58ba131b2306051a64a7f9f3c6c449d9">33</xref> e que possui como etiquetas principais os seguintes campos semânticos que, em alguns casos, possuem subdivisões: <italic id="italic-0d3a2ab2a874cab1afb4b5f2bba1b6cf">General &amp; Abstract Terms; The Body &amp; The Individual; Arts &amp; Crafts; Emotional Actions, States &amp; Processes; Food &amp; Farming; Goverment &amp; The Public Domain; Architecture, Buildings, Houses &amp; The Home; Money &amp; Commerce; Entertainment, Sports &amp; Games; Life &amp; Living Things; Movement, Location, Travel &amp; Transport; Numbers &amp; Measurement; Substances, Materials, Object and Equipment; Education; Language and Communication; Social Actions, States &amp; Processes; Time; The World &amp; Environment; Psychological Actions, States &amp; Processes; Science &amp; Technology; Names &amp; Grammatical Words.<xref id="xref-0cb0156aefb5897d6957a8d5048f393f" ref-type="fn" rid="footnote-0b5735d863fa0c215ae8ca08e84cd5dd">34</xref></italic></p>
      <p id="paragraph-737d2148039ed3ceca3705d55ec1b60f" />
      <p id="paragraph-114afdb539ef6b7c741f72572339cca6">Os autores (DELFINO e BERBER SARDINHA, 2021) identificaram as 05 dimensões semânticas do corpus CoLiE (<italic id="italic-1276d0c03f47dbb7b820fefe9725c68e">Corpus of Lyrics in English</italic>): Dimensão 1 – <italic id="italic-aa0d802bf7071647e000c3d13c5d6d3e">Society, emotions, and actions</italic>; Dimensão 2 – <italic id="italic-76af3f766daf41ea0ef8f5e78c285a4a">Evaluation of people in different places;</italic> Dimensão 3 – <italic id="italic-129f3a8d173757ea58c9308f8bca2654">Necessities among people</italic>; Dimensão 4 – <italic id="italic-4bc4463293c81f2f495b8895a5bd8862">Age and sanity</italic>; Dimensão 5 – <italic id="italic-a83c9f45a55f1abaf9eec057538127b3">Planning and making decisions in in life and love</italic>.</p>
    </sec>
    <sec id="heading-40d90aec7888d303a6ecdd0bb86af944">
      <title>5<bold id="bold-33a8801ec8f25196175005da2d3ee168">. </bold>Considerações Finais</title>
      <p id="paragraph-7e5aefd5f453071a71a8518f9556bae8"> A Análise Multidimensional é uma metodologia cujo objetivo é revelar a variação textual em <italic id="italic-19f64f972a6bff3198ca95709e96f83e">corpora</italic> eletrônicos por meio de procedimentos estatísticos, mais especificamente a análise fatorial. Variação essa dada em forma de escala, auxiliando no entendimento das variantes linguísticas estudadas, por meio de suas propriedades comunicativas, funcionais e discursivas compartilhadas por determinados registros e que estão subjacentes aos textos. Biber em 1988 trouxe ao mundo essa técnica que possibilitou revelar as dimensões funcionais/gramaticais da língua inglesa, porém a língua é formada não apenas por características estruturais. Faltava uma abordagem de variação da língua do ponto de vista lexical/temático para podermos chegar na lexicogramática, que vem a ser um dos pilares da linguística sistêmico-funcional (BERBER SARDINHA, 2020) e, que atribui à semântica, juntamente com o léxico e a gramática uma visão holística da língua, que é vista como um <italic id="italic-a22868d37300863086102098b447cf4a">continuum</italic>, com a gramática numa ponta e o léxico em outra, conforme podemos ver na figura 9. </p>
      <p id="paragraph-bae26558c1c29b76bdadb938bc47072b">Ao enxergarmos a língua pelo pólo da gramática, a consideraremos um sistema estrutural, fechado, enquanto se nos movermos para o lado lexical, estaremos vendo a língua em função de seu significado, como um sistema aberto. A Linguística de <italic id="italic-54de83962efa5b7a73fa7bbfb99ef0c7">Corpus </italic>também trabalha com a lexicogramática, já que se dedica ao estudo do léxico e da gramática e do relacionamento entre os dois a partir da análise de dados presentes em um <italic id="italic-b009e1d52da1f224e24ec87b1e75934f">corpus</italic>, dados esses que muitas vezes chamamos de colocação, coligação, fraseologia, padrão lexical, <italic id="italic-c9071931dbcb76c9c6b1c392a8509ba1">chunk, lexical bundle</italic>, linguagem formulaica, <italic id="italic-5feff72eedba1e7e002dfe2cf92ffb23">lexical frame, </italic>multi-palavras, entre outros. Sinclair, ao falar do termo lexicogramática, afirma que ela ‘não integra os dois tipos de padrão, como o nome pode sugerir – ela basicamente vem a ser o estudo da gramática com um olhar atento aos padrões lexicais dentro dos parâmetros gramaticais’<xref id="xref-a4b5cabf5e7e7f29ff69720c8c7e0795" ref-type="fn" rid="footnote-169c9ed0564b5f8b2631c3dbb4c8545d">35</xref> (SINCLAIR, 1970/2004, p.164).</p>
      <fig id="figure-panel-3b5ddc54d9b7324ad8504a39e25a6a88">
        <label>Figure 9</label>
        <caption>
          <title><bold id="bold-942c43d95baa6a9ec35666d219a1fece">Fonte – </bold>Adaptado de Halliday e Mathiessen (2004, p. 43)</title>
          <p id="paragraph-9cd4d5c91dccfdfdfa58f0dda21fe9c1" />
        </caption>
        <graphic id="graphic-7b91cb8290b119dd149bf575df5b2668" mimetype="image" mime-subtype="png" xlink:href="f9.png" />
      </fig>
      <p id="paragraph-1d4808bb4487ae03e76898336fc8b64b"> Biber tem trabalhado com uma grande variedade de unidades lexicogramaticais e, para tanto, define o termo lexicogramática em Biber, Conrad e Reppen (1998, p.84) como ‘associações entre palavras e estruturas gramaticais’<xref id="xref-0efb354eab7f1155dca99744e94c7b3c" ref-type="fn" rid="footnote-27651e8cd2c7b760c8cca2a4081eccbb">36</xref> e tais padrões podem ser usados para diferenciar palavras que são aparentemente sinônimos. Na verdade, a pesquisa de Biber, ao longo de sua carreira, tem mostrado sistematicamente que o ‘registro sempre importa’<xref id="xref-9ebe43cf37d6eaf9029a91c221cb9111" ref-type="fn" rid="footnote-1b59a042c49007af7bcd8a4c8754b3d1">37</xref> (GRAY, 2013) e que o léxico e a gramática estão juntos nas ‘dimensões de variação de registro’, que nada mais são do que agrupamentos de características lexicogramaticais correlacionadas que co-ocorrem frequentemente nos textos e que possuem uma função compartilhada (BIBER, 1988). Porém, os trabalhos de Biber e os de autores que o seguiram, priorizaram as características funcionais/gramaticais dos textos. Se fôssemos colocar os estudos de análise multidimensional funcional/gramatical na escala da figura 9, eles estariam mais próximos do polo gramatical. </p>
      <p id="paragraph-4123e7f600f128538743680f794db089">Berber Sardinha, a partir de 2014, se valeu dos pressupostos da AMD para investigar o polo do léxico na dada escala. Podemos dizer que as AMDs lexical/temática, colocacional e semântica estão intrinsicamente relacionadas ao léxico, mas cada uma com uma especificidade. O pesquisador deve ter em mente qual é o objetivo da sua pesquisa enfocando o léxico para saber qual das 03 análises faz mais sentido para a sua pesquisa: tanto a lexical/temática como a colocacional são recomendadas para estudos temáticos, de representações ou identidades, com a diferença de que na lexical/temática as palavras mais frequentes no <italic id="italic-f7a10136c0116f428fcc290029873855">corpus</italic> que darão origem a uma lista de palavras que serão analisadas, enquanto que na colocacional, apesar da lista de palavras nódulo + colocados serem geradas a partir das palavras mais frequentes, o que vai ser levado em consideração é a força de atração entre as palavras, ou seja, na AMD colocacional as variáveis serão pares de palavras que ocorrem juntas com uma alta frequência. </p>
      <p id="paragraph-659c8bb894b067a61251dbecf386462e">Já a AMD semântica lida com campos semânticos pré-definidos pelo etiquetador. Assim como a AMD funcional/grammatical, qualquer estudo realizado valendo-se da AMD semântica, as variáveis serão as mesmas, enquanto nas AMDs lexical/temática e colocacional, as variáveis diferirão de <italic id="italic-f03d76593fa36d594fb9279c576f862c">corpus</italic> para <italic id="italic-e44ca78e453586c189cb205b3e47ab7e">corpus</italic>. Gostaria de terminar este capítulo com duas figuras esquemáticas (figuras 10 e 11), demonstrando como os 04 tipos de estudos multidimensionais podem ser entendidos. A figura 10 traz os 04 tipos de análises multidimensionais completas que conhecemos até o momento<xref id="xref-e0678716b94a1365bd3778c6ff34da22" ref-type="fn" rid="footnote-23f9ea4f35663ec28c3fbbe9347c6b48">38</xref> e, podemos notar que não importa qual o estudo de AMD que o pesquisador realizará, tal estudo tem como base a análise fatorial. </p>
      <p id="paragraph-d12b69b17d7f8a6192bca0f746ea0c3c">A partir do pré-processamento do <italic id="italic-50e306183af28c41d89ad5a85d153018">corpus,</italic> o pesquisador deve decidir se irá trabalhar com variáveis lexicais ou gramaticais, de acordo com os objetivos da sua pesquisa. Se o objetivo do estudo for entender a variação funcional/gramatical que ocorre no seu <italic id="italic-f58e492f4f15b9e39fbb0e02a7403a9d">corpus</italic>, as variáveis selecionadas devem ser as gramaticais e, a partir daí seguir os passos de uma AMD, conforme relatamos no capítulo. Por outro lado, se o objetivo do pesquisador for entender a variação do léxico no seu <italic id="italic-fba9fc425dfd2b3d3bd43f45ca75d5f8">corpus</italic>, as variáveis selecionadas devem ser lexicais, que podem ser as palavras de conteúdo mais frequentes do <italic id="italic-476550096ec95ca403d438dd2084b24a">corpus</italic>, que originará a AMD lexical/temática, os nódulos + colocados mais frequentes do <italic id="italic-184977c5996c9f774dc8749d8871a36a">corpus</italic>, que originará a AMD colocacional ou os campos semânticos, que originará a AMD semântica.</p>
      <fig id="figure-panel-962366a82e8e3a7f2603e6d0d6a9a1ab">
        <label>Figure 10</label>
        <caption>
          <title><bold id="bold-c7c7d7897cd9f398df1e453aadda9ef0">Figura 10. </bold>Tipos de Análises Multidimensionais</title>
          <p id="paragraph-1e8c0f535c6953c0c4f8a3e7e7a9e417"><bold id="bold-f5c45ed23f8f1326fb1905b7b7470fd9">Fonte: </bold>Delfino (2021) para esta pesquisa</p>
        </caption>
        <graphic id="graphic-9e38fb2976f6999f468a6be9987094ea" mimetype="image" mime-subtype="png" xlink:href="f10.png" />
      </fig>
      <p id="paragraph-4a77be9f47d6f711e4c302e11871f8ef">Portanto, o pré-processamento do <italic id="italic-24fae29f567756936ab96db72d069aa6">corpus</italic> deve estar intimamente ligado com o objetivo da pesquisa em estudos envolvendo análises multidimensionais. Em relação à replicabilidade das análises, todo estudo de AMD pode ser replicado, mas o pesquisador precisa ter em mente que análises funcionais/gramaticais e semânticas possuem um número limitado de variáveis que se repetem independentemente do <italic id="italic-43451401b3dbf1b54c0604c1f8b88324">corpus</italic> que está sendo analisado. Por outro lado, análises lexicais/temáticas e colocacionais terão suas variáveis escolhidas de acordo com a frequência que elas aparecem no <italic id="italic-70c18dbae80c00e1cc9ac4e05b6c8bac">corpus</italic> e tais variáveis não serão as mesmas em todos os estudos, conforme podemos ver na figura 11.</p>
      <fig id="figure-panel-b3d609b9b87cdf7f9329e12db66526be">
        <label>Figure 11</label>
        <caption>
          <title><bold id="bold-1d2b17d9a40971e9b651fce1e84d2124">Figura 11. </bold>Tipos de variáveis</title>
          <p id="paragraph-e917adf063a015dca1d1113d6e86c48e"><bold id="bold-75027b49507497943e60c59d827273b8">Fonte: </bold>Delfino (2021) para esta pesquisa</p>
        </caption>
        <graphic id="graphic-f256980d8bf83690502256be06bba2b4" mimetype="image" mime-subtype="png" xlink:href="f11.png" />
      </fig>
      <p id="paragraph-a1e1edb52dcc31cdbd0360846736bfb5">As línguas são vistas como sistemas probabilísticos e as escolhas de palavras que os falantes de uma língua fazem, mesmo que inconscientemente, podem não ocorrer ao acaso (BERBER SARDINHA, 2004). Antes do advento da AMD, a Linguística de <italic id="italic-1b96028adbad388af48f383fac47d50f">Corpus</italic> valia-se dos padrões presentes nas colocações, coligações e preferência semântica. A AMD vem a ser um passo além, na medida em que se vale da variação presente nesses padrões, mas numa quantidade de textos muito maior e, mostrando padrões de co-ocorrência em diferentes registros, ou seja, o que é comum em um registro como <italic id="italic-99f89ad864408d90de8a683b908cd600">horóscopo </italic>pode estar presente em um <italic id="italic-629cb52ebe7c5ef0f6d1aec86eebb260">artigo científico </italic>(BERBER SARDINHA, KAUFFMAN, ACUNZO, 2014). O que à primeira vista pode parecer estranho pode ser comprovado através da co-ocorrência de características presentes em vários textos, mostrando funções compartilhadas em diferentes tipos de registros.</p>
      <p id="paragraph-55779d7b95bd95641ddafe512c754bb3">A partir da análise multidimensional foi possível a descrição de registros muito parecidos e de registros diferentes, mostrando funções comunicativas que os une e que os separa. Biber trouxe ao mundo as dimensões funcionais/gramaticais da língua inglesa e os trabalhos que se seguiram focaram nessa perspectiva. A partir de 2014, Berber Sardinha apropriou-se do outro lado da escala da figura 9, o léxico que, por ser um sistema aberto, é confuso e necessita de um olhar por várias perspectivas, daí a necessidade de 03 tipos de MDA para identificar padrões de variações lexicais, seja temático, colocacional ou semântico. Hoje em dia, para poder se fazer uma descrição de uma língua, variedade linguística ou mesmo de um registro, faz-se necessário cada vez mais trabalhos que unam o quantitativo e o qualitativo, levando o estudo linguístico para além do texto, afinal Sinclair já dizia na década de 90 que ‘a língua parece muito diferente quando você olha para um monte de textos ao mesmo tempo’.</p>
    </sec>
    <sec id="heading-882cbfe53ae764373290bf4beb2894b5">
      <title>Referências</title>
      <p id="paragraph-9a7bbb178294826f0c70c7d607af1754">BERBER SARDINHA, T. <bold id="bold-8a4276c1ba5607b36552ea6703574d60">Linguística de <italic id="italic-c05eb7de9450e3813baa88780bdbabd0">Corpus</italic></bold>. Barueri, Manole, 2004.</p>
      <p id="paragraph-2">____. On being American and Brazilian, 2014 (não publicado).</p>
      <p id="paragraph-3">BERBER SARDINHA, T.; KAUFFMANN, C.H.; ACUNZO, C. A multidimensional analysis of register variation in Brazilian Portuguese. <bold id="bold-7461c07c822b3e580a3742d8eede0944">Corpora</bold>, v.9, n.2, p. 239-271, 2014.</p>
      <p id="paragraph-4">BERBER SARDINHA, T. <bold id="bold-3">A corpus-based history of Applied Linguistics</bold>. Apresentação de Trabalho. Associação Internacional de Linguística Aplicada (AILA), Rio de Janeiro, 2017.</p>
      <p id="paragraph-5">____. Lexicogrammar. In: CHAPELLE, C.A. (org). <bold id="bold-4">The concise encyclopedia of Applied Linguistics</bold>. Wiley Blackwell, pp. 701-706, 2020.</p>
      <p id="paragraph-6">BERBER SARDINHA, T. A historical characterization of American and Brazilian cultures based on lexical representations. In: <bold id="bold-5">Corpora</bold>, v.14, n.2, pp. 183-212, 2020(b).</p>
      <p id="paragraph-7">BERBER SARDINHA, T. e VEIRANO PINTO, M. (org.) <bold id="bold-6">Multidimensional Analysis</bold>. Bloomsburry Academic, 2019.</p>
      <p id="paragraph-8">BIBER, D. Investigating macroscopic textual variation through multifeature/multidimensional analyses. <bold id="bold-7">Linguistics</bold> 23, pp. 337-360, 1985.</p>
      <p id="paragraph-9">BIBER, D. <bold id="bold-8">Variation across speech and writing</bold>. Cambridge: Cambridge University Press, 1988.</p>
      <p id="paragraph-10">BIBER, D.; CONRAD, S.; REPPEN, R. <bold id="bold-9">Corpus Linguistics</bold>: investigating language structure and use. New York: Cambridge University Press, 1998.</p>
      <p id="paragraph-11">BIBER, D. <bold id="bold-10">University language</bold>: A corpus-based study of spoken and written registers. Amsterdam/Philadelphia: John Benjamins, 2006</p>
      <p id="paragraph-12">BIBER, D.; TRACY-VENTURA, N. Dimensions of register in Spanish. In: PARODI, G. (Org.) <bold id="bold-11">Working with Spanish corpora</bold>. London: Continuum, 2007.</p>
      <p id="paragraph-13">BREZINA, V., MCENERY, T., &amp; WATTAM, S. Collocations in context: A new perspective on collocation networks. <bold id="bold-12">International Journal of Corpus Linguistics</bold>, 20(2), 139-173, 2015.</p>
      <p id="paragraph-14">DAVIES, M. <bold id="bold-13">Corpus of Contemporary American English</bold>. Available at corpus.byu.edu/full-text., 2012.</p>
      <p id="paragraph-15">DELFINO, M. C. N. <bold id="bold-14">Uso de música para o ensino de inglês como língua estrangeira em um ambiente baseado em <italic id="italic-a3f0603f22e8cfab4c1ca08c8e12efd6">corpus</italic></bold>. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São Paulo. São Paulo, 2016.</p>
      <p id="paragraph-16">DELFINO, M.C.N. e BERBER SARDINHA, T. <bold id="bold-15">A multi-dimensional view of pop music</bold>: a metadata-rich semantic analysis. Apresentação de Trabalho. American Association of Applied Linguistics (AAAL). Online conference, 2021.</p>
      <p id="paragraph-17">GRAY, B. Interview with Douglas Biber. In: Journal of English Linguistics, 41(4), pp. 359-379, 2013.</p>
      <p id="paragraph-18">HALLIDAY, M. A. K., e MATTHIESSEN, C. M. I. M. <bold id="bold-16">An introduction to functional grammar</bold> (3rd ed.). London, England: Edward Arnold., 2004.</p>
      <p id="paragraph-19">KAUFFMANN, C. H. <bold id="bold-17">O corpus do jornal</bold>: variação linguística, gênero e dimensões da imprensa diária escrita. Dissertação (Mestrado em Linguística Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São Paulo. São Paulo, 2005.</p>
      <p id="paragraph-20">MOLLET, E., WRAY, A., e FITZPATRICK, T. Accessing second-order collocation through lexical co-occurrence networks. In: T. Herbst, S. Faulhaber &amp; P. Uhrig (Eds.), <bold id="bold-18">Phraseological View of Language: A Tribute to John Sinclair</bold>. Berlin: Mouton de Gruyter, pp. 87-122, 2011.</p>
      <p id="paragraph-21">RYCHLY, P. A lexicographer-friendly association score. In P. Sojka &amp; A. Horák (Eds.), <bold id="bold-19">Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN</bold> (pp. 6-9). Brno: Masaryk University, 2008.</p>
      <p id="paragraph-22">SINCLAIR, J. <bold id="bold-20">Corpus, concordance and collocation</bold>. Oxford University Press, 1991.</p>
      <p id="paragraph-23">SINCLAIR, J. M., JONES, S., e DALEY, R. English lexical studies: Report to OSTI on project C/LP/08. In R. Krishnamurthy (Ed.), <bold id="bold-21">English collocation studies</bold>: The OSTI report (pp. 2–138). London, England: Continuum., 1970/2004.</p>
      <p id="paragraph-24">WILLIAMS, G. Collocational networks: Interlocking patterns of lexis in a corpus of plant biology research articles. <bold id="bold-22">International Journal of Corpus Linguistics</bold>, 3(1), 151–171. <ext-link id="external-link-1" xlink:href="https://doi.org/10.1075/ijcl.3.1.07wil">https://doi.org/10.1075/ijcl.3.1.07wil</ext-link>, 1998.</p>
      <p id="paragraph-25">ZUPPARDI, M.C. <bold id="bold-23">Collocation dimensions in academic English. </bold>Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem), Pontifícia Universidade Católica de São Paulo. São Paulo, 2020.</p>
      <sec id="heading-de1109a11f9235a05dce0fbc161927e5">
        <title>Leitura Recomendada</title>
        <p id="paragraph-30">Para um maior aprofundamento da análise multidimensional, a autora sugere a leitura do livro <italic id="italic-de4d7bbca30f331ab6129506de4ea2ab">Multidimensional Analysis</italic>, de Berber Sardinha e Veirano Pinto (org.), de 2019, que engloba em mais detalhes todos os passos de uma análise multidimensional além de pesquisas recentes na área.</p>
      </sec>
    </sec>
  </body>
  <back>
    <fn-group>
      <fn id="footnote-f0ecd757fd7fc925aa874771fae4684f">
        <label>1</label>
        <p id="paragraph-06f6f820d598643591d92fdf66ddfbdc">The language looks rather different when you look at a lot of it at once. (Essa e todas as traduções neste capítulo são minhas)</p>
      </fn>
      <fn id="footnote-a58c83c1952763a6493e241f251f5281">
        <label>2</label>
        <p id="paragraph-6f1ed27c0ce474930328ec0c75c97483">Abordagem <italic id="italic-1">bottom up</italic> sugere que o estudo da língua deve surgir a partir do <italic id="italic-2">corpus</italic>, ou seja, o estudo será direcionado pelos resultados da pesquisa feita no <italic id="italic-3">corpus</italic> e não a partir de características definidas a partir da intuição do pesquisador.</p>
      </fn>
      <fn id="footnote-75e9e6d51f17f9bc326df5db2582f40b">
        <label>3</label>
        <p id="paragraph-ac0808087bac014911f8fb893aa71d44">Registro aqui é definido como uma ‘variedade linguística definida por aspectos situacionais, incluindo o propósito do falante, a relação entre falante e ouvinte, e o contexto de produção.’ (Biber, 2009: p. 823).</p>
      </fn>
      <fn id="footnote-72d9ac82f8053afbde053ad8f81e037a">
        <label>4</label>
        <p id="paragraph-cf8b16e87b2fc2242591f3101784e9f3">Lancaster, Oslo e Bergen são as três universidades que colaboraram para produzir o <italic id="italic-6c466de50b0fcb4031d83893f3863701">corpus</italic>. A universidade de Lancaster localiza-se na Inglaterra e as outras duas na Noruega.</p>
      </fn>
      <fn id="footnote-bdfffd91606ff9af46f91413a0e93d50">
        <label>5</label>
        <p id="paragraph-1fb93ee060678a479eefe15df4f7779d">Etiquetamento é uma técnica que consiste em inserir em cada palavra do <italic id="italic-abf6b2dc89c4e35cb5f6657316c19628">corpus</italic> uma etiqueta (um código). No caso do Biber Tagger cada etiqueta representa uma característica morfossintática. Exemplo disso é a etiqueta PRO1 que significa pronome de primeira pessoa.</p>
      </fn>
      <fn id="footnote-4e75c9e43d1b10448429e90628554332">
        <label>6</label>
        <p id="paragraph-f6721e09ccb3489dcc871c5f7ca41c34">Para a realização de uma análise fatorial faz-se necessário a utilização de pacotes estatísticos. A autora sugere SPSS (pago), SAS ou R (ambos gratuitos). O resultado obtido nos três pacotes é muito bom e confiável, a escolha fica a critério da familiaridade com o pacote estatístico e escolha pessoal do pesquisador.</p>
      </fn>
      <fn id="footnote-49bfd716c270dee0a8b42dcde9331dc8">
        <label>7</label>
        <p id="paragraph-07cc8106f464ec818d0d3124aa3425c2"><italic id="italic-04ca58741f2b04e99b0935d4d459dfc6">Eigenvalues</italic> ou autovalores possuem o objetivo de explicar o máximo de variabilidade dos dados.</p>
      </fn>
      <fn id="footnote-feedfeef27d4abd69c1ab48e50f3f397">
        <label>8</label>
        <p id="paragraph-10b458c81b682e62f99573bac584e3e9">KMO – medida de adequacidade da amostra de Kayser-Meyer-Olkin: medida que varia de 0 a 1, onde valores aceitáveis encontram-se entre 0,5 e 1. (KAUFFMAN, 2005)</p>
      </fn>
      <fn id="footnote-f5df9f0e0e78f2a5c178df14a215df2a">
        <label>9</label>
        <p id="paragraph-c3fb0cfb0c433882fd77a4a99ec5059e">Teste de Barlett – confirma se há correlação entre as variáveis, sendo que o nível de significância (Sig) deve ser inferior a 0,05. (KAUFFMAN, 2005).</p>
      </fn>
      <fn id="footnote-21fb9ad1e725cd912dd11b6775b4eaa7">
        <label>10</label>
        <p id="paragraph-75a05ce067d362cd13234e235b1eec5b">Textos pequenos, como letras de música, tweets, postagens de redes sociais em geral podem ter sua normalização feita por 100 ao invés de 1000.</p>
      </fn>
      <fn id="footnote-2336975aba60e946df00fa933379136a">
        <label>11</label>
        <p id="paragraph-29ceee0a0f626a49a43ffc162d5d5918">Comunalidade é a proporção de variabilidade de cada variável que é explicada pelo fator. Quanto maior a comunalidade, maior será o poder de explicação daquela variável pelo fator. Em estudos de AMD considera-se retirar variáveis cuja comunalidade esteja abaixo de 0,15.</p>
      </fn>
      <fn id="footnote-f5c68a6fee848fa88bd227885ef3f443">
        <label>12</label>
        <p id="paragraph-60c3300552421cfd6b968e4aaaf5a3a0">Fator vem a ser o grupo de variáveis que co-ocorrem significativamente do ponto de vista estatístico. (BERBER SARDINHA, 2004). </p>
      </fn>
      <fn id="footnote-8ecf59dd62c38e3f52a80bf3559c172f">
        <label>13</label>
        <p id="paragraph-77fa03bf234d19114effa7cee644bf17"><italic id="italic-fdde129e3560e2f0fd22fafed30f2976">Private verbs, that deletion, contractions, present tense verbs, 2nd person pronouns – </italic>Verbos privados, apagamento do that, contrações, verbos no presente, pronomes de segunda pessoa (respectivamente).</p>
      </fn>
      <fn id="footnote-df410c51a94ef0e809b2a36781cddd6e">
        <label>14</label>
        <p id="paragraph-80145465ed0ff55aa9a8e164c83e2a60"><italic id="italic-bd9a10527ff029980a6bc513bdd9a85a">Nouns, word length, prepositions, type/token ratio, attributive adjs., place adverbials – </italic>Substantivos, tamanho da palavra, preposições, relação entre o número total de palavras e o número único de palavras, adjetivos atributivos, advérbio de lugar</p>
      </fn>
      <fn id="footnote-ea407858968e34960a8bc21a42263e91">
        <label>15</label>
        <p id="paragraph-9ef4f4371a6cc01eb23f95ba0d8c33d0">Verbos privados são verbos que expressam estados intelectuais. Os verbos privados mais comuns são <italic id="italic-8294c72bed452c1f6d5ded91d1381013">assume, believe, calculate, conclude, consider, deduce, think (</italic>assumir, acreditar, calcular, concluir, considerar, deduzir pensar).</p>
      </fn>
      <fn id="footnote-cbe4151d38afa477d7d33015b628caca">
        <label>16</label>
        <p id="paragraph-3035164e280e51e66ec2e4adb5d090bc">Observação da autora: O polo de um fator que, ao ser interpretado qualitativamente se tornará o polo de uma dimensão, deve preferencialmente conter no mínimo de 3 a 5 variáveis que carreguem prioritariamente nele. Levando-se em consideração o princípio de que uma dimensão mostra a função compartilhada por várias características linguísticas que co-ocorrem em vários textos, não faz sentido um polo de dimensão com pouquíssimas características. Elas podem co-ocorrer nos mesmos textos mas não são suficientes para compartilhar uma função linguística. </p>
      </fn>
      <fn id="footnote-416e686a2e4012b5027a076f32b261ca">
        <label>17</label>
        <p id="paragraph-76223400cdbcc005505426934e1f9cc2">A autora escolheu listar apenas as 05 primeiras dimensões do trabalho seminal de Biber (1988), que foram as que ele determinou posteriormente como as dimensões da língua inglesa.</p>
      </fn>
      <fn id="footnote-c418120d8c5eb67bb3ab1c1cd4228ccf">
        <label>18</label>
        <p id="paragraph-cf4fc282d055aa24130b7b33f8dfbcfe">Vale salientar que o programa Biber Tagger Count já normaliza os valores absolutos por 1.000</p>
      </fn>
      <fn id="footnote-7387cd77dca53947d7c9c7adc5430644">
        <label>19</label>
        <p id="paragraph-6c73e1325cfa7e6cddfa06cc720c0cfd">O <italic id="italic-f0f227c1e715c52e32b208fc11f2a226">corpus </italic>CoEL (Corpus of English Lyrics) era formado pelas letras de música de 03 bandas: Beatles, Bon Jovi e Maroon 5 e do cantor Bruno Mars.</p>
      </fn>
      <fn id="footnote-701f5e25f872a47b729d50fe68aa9dc3">
        <label>20</label>
        <p id="paragraph-aa140ff9fc3180e1cd65d6653ca4f82e">Palavras de conteúdo são substantivos, verbos, advérbios e adjetivos.</p>
      </fn>
      <fn id="footnote-28aeef15c3899e4e4cef44d684f95b5a">
        <label>21</label>
        <p id="paragraph-2c45a3920ee3dbc4c3f795ead06a37bf">Dim. 1 – Super poder <italic id="italic-56d272f5f2cdba4782d0d43c348ff78b">versus </italic>status regional; Dim. 2 – As pessoas, a bandeira e as instituições; Dim. 3 – Indivíduos, comunidade e cultura; Dim. 4 – As forças armadas, escravidão e ideais; Dim. 5 – Expressão literária <italic id="italic-e32bf07c1bf82eea78e874efaba22b85">versus </italic>revolução e a nação.</p>
      </fn>
      <fn id="footnote-1ae8c982d91aa868d661b3719dcae133">
        <label>22</label>
        <p id="paragraph-bec7e09228964c681e5688751e0c73bd">Dim. 1 – Economia e política; Dim. 2 – Arte tradicional, ciências, as pessoas e a terra; Dim. 3 – Matéria-prima e a paisagem; Dim. 4 – Novas formas artísticas, mulheres e homens, religião e meio ambiente; Dim. 5 – A monarquia, transporte a vapor, e região selvagem.</p>
      </fn>
      <fn id="footnote-b44056d72f9e54c8d0f4dd5a18833992">
        <label>23</label>
        <p id="paragraph-a3dbd6c9d91a0759f3b5d8ed0d304690">O termo ‘aboutness’ abrange, além do tópico dos textos, a representação construída através das características lexicais. Nesse sentido, pode-se determinar o posicionamento do(s) autor(es) do(s) texto(s) a partir de sua análise lexical.</p>
      </fn>
      <fn id="footnote-8f9d1065f34cf011b352697923cdbe22">
        <label>24</label>
        <p id="paragraph-3e6992fcdcf8badfa41b8ce6da2ae0a6">Dim. 1 – Discurso letrado, com os seguintes exemplos: assunto + relacionar, fator + relacionar, parecer + apropriado.</p>
      </fn>
      <fn id="footnote-27e4dac9169ec2c6e7b4353bdfe476fe">
        <label>25</label>
        <p id="paragraph-183a29d824dc517102ee50913ebb6c9a">Dim. 2 – Discurso oralizado, com os seguintes exemplos: querer + saber, pessoas + saber, querer + dizer.</p>
      </fn>
      <fn id="footnote-88485b9fe8a3f8169b56b77601649c6c">
        <label>26</label>
        <p id="paragraph-ed1830ef0d19917b00c49b04287d3a15">Dim. 3 - Objetos, pessoas e ações, com os seguintes exemplos: encarar + janela, encarar + teto, deslizar + abrir.</p>
      </fn>
      <fn id="footnote-d3026d185cd42dcb452479bd8d5c099c">
        <label>27</label>
        <p id="paragraph-c384df87207d33574241cbafe10e26d6">Dim. 4 – Uso coloquial e informal da língua, com os seguintes exemplos: medo + perder, mamãe + papai, mamãe + paizinho.</p>
      </fn>
      <fn id="footnote-5561ac844973e57890cde1c3c262fe3a">
        <label>28</label>
        <p id="paragraph-6f5cab45e2af5308dcf674ccaf22db59">Dim. 5 – Organizações e o governo, com os seguintes exemplos: proteção + agência, oficial + dizer, internacional + monetário.</p>
      </fn>
      <fn id="footnote-e55b09a3f52f0284929e2c98294cddef">
        <label>29</label>
        <p id="paragraph-20d5e1058cae02a0b757df61f83df022">Dim. 6 – Política e assuntos atuais, com os seguintes exemplos: outro + político, recusar + entrevista, polícia + entrevista.</p>
      </fn>
      <fn id="footnote-2df75596969d127de263d58f5a782c2f">
        <label>30</label>
        <p id="paragraph-72fe2ee94a401658dfb4cb89b87acbb7">Dim. 7 – Sentimentos e emoções, com os seguintes exemplos: sentir + vergonha, sentir + culpa, sentir + fúria.</p>
      </fn>
      <fn id="footnote-7ea2dc5655f3266b6e7d8653fcff8e03">
        <label>31</label>
        <p id="paragraph-ef362bf98b85f4ce8066cb2086e17fbf">Dim. 8 – Culinária, com os seguintes exemplos: misturar + tigela, misturar + ingrediente, xícara + açúcar.</p>
      </fn>
      <fn id="footnote-a2384642f219abd988cdd649ed63ecab">
        <label>32</label>
        <p id="paragraph-71272ec79da5a26164f1994a407dea3c">Dim. 9 – Educação, com os seguintes exemplos: aluno + benefício, avaliar + escala, expor + aluno.</p>
      </fn>
      <fn id="footnote-58ba131b2306051a64a7f9f3c6c449d9">
        <label>33</label>
        <p id="paragraph-4448351de5d2791de0598c026154f59f">Etiquetador disponível no site: http://ucrel-api.lancaster.ac.uk/usas/tagger.html</p>
      </fn>
      <fn id="footnote-0b5735d863fa0c215ae8ca08e84cd5dd">
        <label>34</label>
        <p id="paragraph-93e455ba436de1a2c246945ef5149e6f">Termos Gerais e Abstratos; O Corpo e O Indivíduo; Artes e Ofícios; Ações Emocionais, Estados e Processos; Comida e Agricultura; Governo e o Domínio Público; Arquitetura, Prédios, Casas e Lar; Dinheiro e Comércio; Entretenimento, Esportes e Jogos; Vida e Coisas Vivas; Movimento, Localização, Viagem e Transporte; Números e Medidas; Substâncias, Materiais, Objeto e Equipamento; Educação; Línguas e Comunicação; Ações Sociais, Estados e Processos; Tempo; O Mundo e o Meio Ambiente; Ações Psicológicas, Estados e Processos; Ciência e Tecnologia; Nomes e Palavras Gramaticais.</p>
      </fn>
      <fn id="footnote-169c9ed0564b5f8b2631c3dbb4c8545d">
        <label>35</label>
        <p id="paragraph-f03fdedd432afd45ae9e46d7b7f62707">…does not integrate the two types of patter as its name might suggest – it is fundamentally grammar with a certain amount of attention to lexical patterns within the grammatical frameworks.</p>
      </fn>
      <fn id="footnote-27651e8cd2c7b760c8cca2a4081eccbb">
        <label>36</label>
        <p id="paragraph-406b9ce74bce222d9e725c3984374909">…associations between words and grammatical structures.</p>
      </fn>
      <fn id="footnote-1b59a042c49007af7bcd8a4c8754b3d1">
        <label>37</label>
        <p id="paragraph-7cdb9cbc2690cb1cd90741bcd67aef88">Register always matters!</p>
      </fn>
      <fn id="footnote-23f9ea4f35663ec28c3fbbe9347c6b48">
        <label>38</label>
        <p id="paragraph-9abf9e76f56f137d131f300b2473529c">A autora não incluiu a análise multidimensional aditiva por não conter todos os passos de uma AMD completa como as outras 04 AMDs presentes nas figuras 10 e 11.</p>
      </fn>
    </fn-group>
  </back>
</article>