Share

Research Report

Linguistic annotation visualization of audio and/or video files: ELAN, FLEX and LINGVIEW

Antônia Fernanda de Souza Nogueira

Federal University of Para image/svg+xml

https://orcid.org/0000-0002-3105-6520

Rayanne Corrêa Sarraf Silva

Federal University of Para image/svg+xml

https://orcid.org/0000-0003-1924-6732


Keywords

Wayoro (Tupi) indigenous language
Primary linguistic data
Linguistic annotator tools

Abstract

This paper is motivated by the following question: how to make endangered language media files and their respective annotations usable and accessible (in terms of handling and understanding) to ethnic groups and general audiences? This paper falls within the scope of language documentation (GIPPERT; HIMMELMANN; MOSEL, 2006), understood as the compilation and preservation of primary linguistic data. We will present a preliminary methodology for making the annotations prepared in ELAN and FLEx available as well as their corresponding media. A relatively simple procedure is presented for visualization through LingView (PRIDE; TOMLIN; ANDERBOIS, 2020), a practical and user-friendly web interface for simultaneous visualization of linguistic primary data and their annotations. The proposed methodology is applied to Wayoro primary linguistic data (ISO code wyr; Glottocode wayo1238) (Tupi family, Tupari subfamily) published in a paper (NOGUEIRA; MACURAP; WAJURU, 2019) and in the doctoral dissertation (NOGUEIRA, 2019), as an example, but intends to be replicable to data from any language.

Introdução

O presente artigo é motivado pelo seguinte questionamento: como tornar as mídias de línguas ameaçadas e suas respectivas anotações úteis e acessíveis (em termos de manuseio e compreensão) à etnia e ao público geral? Organizamos o trabalho como segue. Inicialmente, iremos situar a pesquisa no âmbito da documentação linguística, detalhando conceitos importantes para o desenvolvimento do texto, a saber, as noções de dados linguísticos primários e de anotação linguística. Em seguida, citaremos dois softwares que permitem realizar anotação linguística digital (ELAN e FLEx). Mencionaremos, na sequência, exemplos de disponibilização de mídias e anotações linguísticas em acervos de línguas amplamente reconhecidos. Finalmente, apresentaremos um software online de visualização amigável das anotações e suas respectivas mídias simultaneamente, o LingView, exemplificando o uso do mesmo com dados da língua Wayoro.

1. Documentação Linguística: dados linguísticos primários, verificabilidade e entrega de produtos úteis

Segundo Himmelmman (2006, p. 15-16, tradução nossa) o campo da documentação linguística se dedica a “compilar e preservar dados linguísticos primários e criar interfaces entre esses dados primários e vários tipos de análise baseados neles. [...] [Trata-se de] um registro duradouro e multifuncional de uma língua”. Além disso, deve-se permitir o acesso, a qualquer lugar e tempo, por indivíduos do público em geral ou por outros pesquisadores. O autor define dados linguísticos primários como gravações em áudio e/ou vídeo de um evento comunicativo (uma narrativa, uma conversa, uma música, entre outros) em uma determinada língua.

Segundo esse autor, estabelecer arquivos abertos para dados primários pode tornar análises já publicadas mais explicáveis. Muitas análises para as quais não há qualquer documentação disponível:

[...] permanecem inverificáveis uma vez que partes substanciais dos dados linguísticos primários sobre os quais as análises são baseadas permanecem inacessíveis a um exame mais minucioso. (HIMMELMANN, 2006, p. 6, tradução nossa)

Nathan (2006, p. 364-365) observa que, em geral, a documentação linguística está restrita à inclusão, à gestão e à navegação de dados, construindo catálogos e arquivos digitais. O autor enfatiza a importância desse trabalho para preservar e fornecer acesso aos dados. No entanto, Nathan alerta que “a documentação linguística oferece benefício limitado a diversos públicos, em particular, às comunidades linguísticas” (NATHAN, 2006, p. 364, tradução nossa). A denominada mobilization se refere à devolução oportuna de materiais linguísticos efetivos que tenham o objetivo de incentivar e apoiar o fortalecimento da língua, elaborados a partir da documentação linguística e do diálogo com a comunidade e com outros especialistas.

Com base nesses autores, podemos observar dois desafios para os pesquisadores que trabalham com línguas pouco documentadas: (i) a verificabilidade de dados e análises publicados; (ii) a devolução de materiais efetivamente úteis à comunidade linguística, elaborados a partir dos dados linguísticos primários e suas anotações.

Assim, a pergunta que permeia o presente artigo é: como tornar as mídias de línguas ameaçadas e suas respectivas anotações úteis e acessíveis (em termos de manuseio e compreensão) à comunidade étnica e ao público geral?

É comum que as anotações de uma pesquisa de campo sejam feitas em cadernos de campo (físicos), caso no qual nossa pesquisa se enquadra majoritariamente. Dessa forma, a disponibilização dos dados primários e suas anotações passam, necessariamente, por uma etapa de digitalização das mesmas. Vejamos, a seguir, dois softwares (ELAN e FLEx) que permitem realizar anotação linguística digital e um software de visualização das anotações e suas respectivas mídias simultaneamente (LingView).

2. Softwares de anotação linguística

Uma anotação linguística consiste em, minimamente, uma transcrição e uma tradução de um arquivo de áudio e/ou vídeo, mas pode ser muito mais elaborada. Nas palavras de Himmelmann (2006, p. 13, tradução nossa),

É comum distinguir entre anotação mínima e anotação elaborada. Um esquema de anotação mínima amplamente adotado consiste apenas de uma transcrição e de uma tradução livre que deve acompanhar todos ou pelo menos um número significativo de dados primários. Esquemas de anotação elaborados incluem vários níveis de glosas interlineares, comentários gramaticais e etnográficos e possibilidade de referência cruzada entre as variadas seções e as fontes compiladas em uma dada documentação.

Entre diversos programas disponíveis como ferramenta de anotação digital de dados primários, destaca-se o ELAN (Eudico Linguistic Annotator)1. Segundo Santos (2018, p. 18)

Este programa conecta unidades de som a unidades ‘textuais’, permitindo assim sua anotação, ou seja, transcrição (fonética ou ortográfica), tradução, segmentação morfológica, notas e comentários. O programa ELAN é uma das diferentes ferramentas utilizadas para análise de línguas em seus diferentes usos e faz parte da metodologia adotada por alguns pesquisadores na construção de projetos de documentação linguística.

Veja, na Figura 1, um exemplo de uma anotação elaborada no ELAN para o arquivo de vídeo sobre festas tradicionais, na língua Wayoro.

Figure 1. Figura 1: Visualização em Modo de anotação no ELAN (Eudico Linguistic Annotator)

As anotações no ELAN são feitas nas linhas previamente definidas (denominadas trilhas), após a seleção do trecho do vídeo que se pretende anotar. Para a nomeação das trilhas, estamos seguindo o modelo (template) de Gaved e Salffner (2014). No exemplo acima, existe uma primeira trilha para os metadados da sentença, em padrão IMDI (NOGUEIRA, 2019, p. 8), depois, uma trilha de transcrição ortográfica da sentença na língua Wayoro, em seguida, uma linha de segmentação de palavras da sentença (obtida pelo submenu tokenizar a trilha), após isso, uma trilha de divisão morfológica, uma linha de glosas para os morfemas lexicais e gramaticais e, por fim, uma linha de tradução em português.

Outra ferramenta que permite a anotação de textos, bem como a criação de dicionário, é o FLEx (Fieldworks Language Explorer)2. O FLEx, porém, não alinha o texto a um arquivo de áudio ou vídeo. Confira, na Figura 2, um exemplo de narrativa anotada na área de anotação de textos do FLEx.

Figure 2. Figura 2: área de Textos e Palavras (Texts & Words), aba Analisar, no Fieldworks Language Explorer (FLEx)

As anotações, no exemplo acima, contam com uma linha de transcrição ortográfica, uma linha de divisão morfológica, uma linha de glosas e uma linha de tradução livre para a língua portuguesa.

Vale mencionar que há diversas possibilidades de exportação de um texto anotado no ELAN e no FLEx, entre elas a exportação como HTML e a impressão em formato PDF. Os produtos dessas exportações e impressões são muito interessantes, de fácil visualização e compreensão. Um desafio, no entanto, é que o manuseio de textos no ELAN e no FLEx pode se tornar difícil a um público não treinado, devido aos detalhes técnicos, demandando instalação do programa, navegação e o conhecimento dos botões, das áreas de edição de cada software, dos campos, dos menus e submenus. Além disso, os produtos gerados são apresentados off-line.

3. Disponibilização das anotações linguísticas e das mídias correspondentes

Em projetos de documentação de línguas ameaçadas, os dados primários e suas anotações, bem como os metadados relacionados, são armazenados em acervos institucionais que se dedicam, em resumo, à preservação desses dados a longo prazo, organizando a consulta aos mesmos, conforme os direitos de uso e as restrições impostas pelas comunidades pesquisadas. A seguir, citamos um exemplo de Acervo e de disponibilização de dados primários e anotações.

3.1. Endangered Languages Archive (ELAR)

Observe, na Figura 3, a apresentação online no ELAR3 de informações (metadados), na área superior, e de mídias e anotações, na área inferior com ícones de arquivo, de uma língua da Etiópia, Komo.

Figure 3. Figura 3: Exemplo de Ficha Técnica de uma seção da língua Komo, Etiópia (África), com acesso para usuários no Catálogo do Acervo ELAR. Disponível em: <https://www.elararchive.org/uncategorized/SO_8240e11c-9d04-4044-b9af-fbd0776ea168/>. Acesso em: 20/05/2021

O ELAR é o acervo linguístico da SOAS University of London, disponível para acesso e download de forma online e gratuita. Exige-se inscrição no site e assinatura dos Termos e Condições, bem como da Declaração de Proteção aos Dados. Segundo a descrição disponível no site da referida universidade, o ELAR é um repositório digital de preservação e publicação de coleções de multimídia de idiomas ameaçados. Atualmente, pode-se encontrar registros de mais de quatrocentas e cinquenta línguas diferentes no catálogo do acervo, registradas através de gravações de áudio ou vídeo.

O ELAR tem três formas de acesso para todas as pastas: Open (abertos que podem ser acessados por qualquer pessoa que navegue no acervo); Users (disponíveis aos usuários registrados); e Subscriber (acesso restrito a materiais que exigem uma permissão). A seção da Figura 3, por exemplo, está disponível para Users, ou seja, é preciso ter um registro cadastrado para visualizar os arquivos.

Observe, na Figura 3, que após a ficha catalográfica estão os arquivos .WAV, MPEG-vídeo e XML. Os arquivos de mídia podem ser visualizados clicando-se sobre os mesmos (podem, também, ser baixados). Ao clicar sobre o arquivo XML, um arquivo .EAF é baixado. A extensão .EAF (Eudico annotation format) é a extensão de arquivos do ELAN. Para visualizar as anotações do vídeo, portanto, é necessário saber manusear o ELAN. Ao abrir o arquivo .EAF no ELAN, observa-se uma trilha de transcrição da língua Komo, uma trilha de segmentação morfológica, seguida por uma trilha das glosas correspondentes, uma trilha de tradução livre para o inglês, e, por fim, uma trilha de notas linguísticas e outra de notas etnográficas.

3.2. Visualização online

Vimos, acima, que é ainda uma lacuna na área de documentação linguística a disponibilização de uma forma mais simplificada de visualização simultânea da mídia e da anotação correspondente. Para sanar essa dificuldade, Pride, Tomlin e AnderBois (2020) elaboraram o LingView, uma interface na internet prática e amigável para visualização simultânea de dados linguísticos primários e suas anotações elaboradas em ELAN e em FLEx. Assim, os textos transcritos e anotados em ELAN ou FLEx podem, no LingView, ser visualizados com um clique, conforme exemplo na Figura 4.

Figure 4. Figura 4: Visualização simultânea de vídeo e suas anotações (elaboradas em ELAN) da língua A’ingae (Equador e Colômbia) no LingView. Disponível em:<https://brownclps.github.io/LingView/#/story/1ed3d641-acd9-4466-811d-17c8ed59844c>. Acesso em: 31/03/2021.

Na página do LingView, ao selecionar um item da lista de textos, imediatamente é aberta a página acima com a mídia e as anotações visíveis da língua A’ingae, localizada no Equador e na Colômbia. As linhas de anotação podem ser escolhidas nas caixas de seleção da área inferior esquerda, disponíveis conforme as trilhas predefinidas no ELAN. Na área direita, apresenta-se: uma linha de transcrição na língua indígena, uma língua de tradução para o inglês e uma linha de tradução para o espanhol.

Em nossa experiência, o maior desafio relacionado à utilização do LingView é a instalação. O processo de download e de instalação está descrito em Pride, Tomlin e AnderBois (2020), no entanto, pode ser necessário conhecimento extra em programação para o manuseio do software. É importante, assim, o diálogo constante com a área de computação. Nosso projeto tem como parceira a Faculdade de Engenharia e Ciência da Computação da Universidade Federal do Pará, campus de Tucuruí.

3.3. Visualização simultânea de anotação e arquivo de áudio de uma narrativa da Língua Wayoro

A Terra Indígena Rio Guaporé (Guajará-Mirim, Rondônia) é habitada por 10 (dez) etnias diferentes, a saber, Aikanã, Aruá, Arikapú, Djeoromitxi, Tupari, Kujubim, Kanoê, Makurap, Wari’ e Wajuru, somando cerca de 1.000 pessoas (cf. vídeo online Potkap Xako “Festa do Peixe”4 para saber mais) (INSTITUTO SOCIOAMBIENTAL, 2020; SOARES-PINTO, 2009; NOGUEIRA, 2011; NOGUEIRA, 2019). Dessa população, aproximadamente 100 pessoas são da etnia Wajuru. A língua Wayoro tem, atualmente, duas mulheres acima de 70 anos como falantes fluentes. Não há transmissão para as novas gerações, que falam português como primeira língua. Trata-se, portanto, de uma língua em risco iminente de desaparecimento (MOSELEY, 2010).

Há pouca documentação textual publicada na língua Wayoro. Excertos de textos foram analisados em Nogueira (2019) e um texto, bem como sua análise, foi publicado integralmente por Nogueira, Macurap e Wajuru (2019). O texto publicado integralmente, intitulado Tuero nderap eriat ‘A dona do preparo da chicha’5 faz parte de um total de aproximadamente de 60 horas, gravadas em cerca de 11 meses de trabalho de campo na Terra Indígena Rio Guaporé, entre os anos de 2008 e 2017. O corpus da língua Wayoro está parcialmente armazenado no Acervo de Línguas Indígenas do MPEG-Museu Paraense Emílio Goeldi.

A narrativa publicada, a qual versa sobre a origem do preparo da bebida fermentada chicha, foi registrada no dia 26 de março de 2010, na Casa da Cultura da Aldeia Ricardo Franco. A narradora é a falante fluente Paulina Macurap. O texto foi transcrito e traduzido com a semifalante Julieta Wajuru, utilizando o auxílio do software Transcriber6 (NOGUEIRA; MACURAP; WAJURU, 2019). Posteriormente, a transcrição foi exportada para o ELAN e para o FLEx.

Em Nogueira, Macurap e Wajuru (2019), apresenta-se, em inglês e em português, uma explicação sobre o povo, a língua e a narrativa, com uma linha de transcrição ortográfica, uma linha de divisão morfema por morfema, uma linha de glosas, seguidas das traduções em português e em inglês. Não há, contudo, na publicação, link para acesso à mídia correspondente.

Apresentaremos, aqui, a aplicação da metodologia proposta por Pride, Tomlin e Anderbois (2020) para a visualização simultânea das anotações da narrativa Tuero nderap eriat ‘A dona do preparo da chicha’ e de seu arquivo de áudio, no LingView. Utilizou-se o arquivo do ELAN com as seguintes trilhas principais: título, usado para indicar os metadados de cada sentença; transcrição ortográfica na língua Wayoro; e tradução para a língua portuguesa.

O resultado do procedimento mostra o texto de uma maneira bastante simples e amigável ao leitor, como podemos constatar na Figura 5. Seguindo as trilhas previamente definidas e preenchidas no ELAN, a primeira linha, no LingView, corresponde ao código de metadados de cada sentença, a segunda linha corresponde à sentença na língua Wayoro e a terceira linha à sentença em língua portuguesa. A narrativa pode ser escutada clicando-se no ícone play na parte inferior da página ou na linha que desejar ouvir. Cada linha de anotação pode ser selecionada ou omitida, marcando-se ou desmarcando-se nas caixas de seleção na área esquerda da tela, no item Show/hide tiers.

Figure 5. Figura 5: Visualização simultânea de áudio e anotações (elaboradas em ELAN) da narrativa Tuero nderap eriat ‘A dona do preparo da chicha’ (NOGUEIRA; MACURAP; WAJURU, 2019), no LingView.

A visualização da narrativa foi inicialmente testada off-line e, posteriormente, disponibilizada online na página do LingView criada para a língua Wayoro, no site Github7.

Vale notar que a inclusão dos metadados das sentenças na primeira linha é importante, pois informa a data da coleta, as siglas das iniciais dos pesquisadores e colaboradores, por exemplo. Além disso, os metadados correspondem aos metadados de sentenças usadas em outras publicações, como a tese de doutorado de Nogueira (2019, p. 109), permitindo que esses dados possam ser verificados pelo público interessado.

4. Dificuldades e desafios futuros

É possível dizer que o LingView auxilia no enfrentamento dos desafios mencionados no início do artigo: a verificabilidade dos dados primários e de suas anotações e a entrega de materiais úteis e acessíveis à comunidade linguística. A visualização da mídia da narrativa Tuero nderap eriat ‘A dona do preparo da chicha’ e de suas anotações pode ser útil a diferentes públicos: aos professores da língua Wayoro e à etnia como um todo; a outros pesquisadores que desejem verificar os dados publicados em Nogueira (2019) e Nogueira, Macurap e Wajuru (2019); a qualquer pessoa interessada em conhecer mais sobre a língua e/ou sobre cosmovisão da etnia Wajuru.

Dwyer (2006, p. 56) cita a elaboração e entrega de materiais em áudio e vídeo como a melhor forma de dar um retorno do trabalho de pesquisa para a comunidade, ou para um colaborador. Isso tem sido feito na Terra Indígena Rio Guaporé através da entrega de CDs e DVDs, bem como pen-drives com as gravações. No ano de 2020, a escola da aldeia Ricardo Franco (Escola E.E.I.F 5 de Julho) recebeu de agentes públicos um ponto de internet de banda larga gratuita8. A presença de internet e a aquisição de celulares, especialmente pelos professores indígenas, torna útil para a comunidade a disponibilização de recursos digitais online.

5. Agradecimentos

À comunidade da Terra Indígena Rio Guaporé, em especial à etnia Wajuru e às falantes fluentes da língua Wayoro; à FUNAI pelas autorizações 56/CGEP/08, 119/AAEP/10, 84/AAEP/PRES/2017; ao professor Dr. Marcos Amaris da Universidade Federal do Pará (Faculdade de Engenharia de Computação-campus de Tucuruí) pela colaboração com os detalhes técnicos para a disponibilização da versão online do material Wayoro.

Referências

DWYER, A. Ethics and practicalities of cooperative fieldwork and analysis. In: GIPPERT, J; HIMMELMANN, N; MOSEL, U. (Orgs.) Essentials of language documentation. Berlin: Mouton de Gruyter, 2006

GAVED, Tim; SALFFNER, Sophie. Working with ELAN and FLEx together: an ELAN-FLEx-ELAN teaching set, 2014. Disponível em: https://archive.mpi.nl/tla/elan/thirdparty, Acesso em: 19/03/2020

HIMMELMANN, N. Language documentation: what is it and what is it good for? In: GIPPERT, J; HIMMELMANN, N; MOSEL, U. (Orgs.) Essentials of language documentation. Berlin: Mouton de Gruyter, 2006.

INSTITUTO SOCIOAMBIENTAL. Wajuru. 2020. Disponível em: <https://pib.socioambiental.org/pt/Povo:Wajuru>. Acesso em: 18 de abril de 2020.

MOSELEY, C. (ed.). Atlas of the World’s Languages in Danger. Paris: UNESCO Publishing, 2010. Disponível em:http://www.unesco.org/languages-atlas/index.php>. Acesso em: 26/02/2021.

NATHAN, D. Thick interfaces: mobilizing language documentation with multimedia. In: GIPPERT, J; HIMMELMANN, N; MOSEL, U. (Orgs.) Essentials of language documentation. Berlin: Mouton de Gruyter, 2006.

NOGUEIRA, Antônia F. S.; MACURAP, Paulina; WAJURU, Julieta. Wayoro (Wajuru) - Tuero Nderap Eriat - A Dona do Preparo da Chicha. Revista LinguiStica, Rio de Janeiro, v. 15, n. 1, p. 336-356, jan./abr. 2019. Edição intitulada Línguas Indígenas: artes da palavra, organizada por Kristine Stenzel e Bruna Franchetto, doi: http://dx.doi.org/10.31513/linguistica.2019.v15n1a25574

NOGUEIRA, Antônia Fernanda de Souza. Predicação na língua Wayoro (Tupi): propriedades de finitude. 2019. 189 f. Tese de Doutorado em Semiótica e Linguística Geral – Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo, São Paulo, 2019.

PRIDE, Kalinda; TOMLIN, Nicholas; ANDERBOIS, Scott. LingView: A Web Interface for Viewing FLEx and ELAN Files. Language Documentation & Conservation, v. 14, p. 87-107, 2020.

SANTOS, Mara. Metodologia de documentação linguística como subsídio para o ensino de língua. Revista Brasileira de Línguas Indígenas, Macapá, v. 1, n. 1, p.117-130, jan./jul. 2018.

SOARES-PINTO, Nicole. Do poder do sangue e da chicha: os Wajuru do Guaporé (Rondônia). 2009. Dissertação (Mestrado em Antropologia Social) – Universidade Federal do Paraná, Curitiba, 2009.

How to Cite

NOGUEIRA, A. F. de S.; SILVA, R. C. S. Linguistic annotation visualization of audio and/or video files: ELAN, FLEX and LINGVIEW. Cadernos de Linguística, [S. l.], v. 2, n. 2, p. e369, 2021. DOI: 10.25189/2675-4916.2021.v2.n2.id369. Disponível em: https://cadernos.abralin.org/index.php/cadernos/article/view/369. Acesso em: 30 apr. 2024.

Statistics

Copyright

© All Rights Reserved to the Authors

Cadernos de Linguística supports the Opens Science movement

Collaborate with the journal.

Submit your paper