O que é Reprodutibilidade?
Reprodutibilidade é a capacidade de obter resultados consistentes quando estudos científicos são repetidos ou suas análises são revisitadas por outros pesquisadores. Em termos simples, um achado é considerado reprodutível se, ao seguir os mesmos métodos e condições — ou ao analisar os mesmos dados com o mesmo código — outros cientistas conseguem chegar a conclusões equivalentes.
Esse conceito está no cerne da confiabilidade científica: resultados robustos devem persistir além do estudo original. Nos últimos anos, diversas meta-pesquisas revelaram uma “crise de reprodutibilidade” em várias áreas do conhecimento. Um número significativo de estudos publicados apresentou resultados que não puderam ser confirmados por tentativas independentes de repetição.
Na psicologia e em outras ciências sociais, por exemplo, multiplicaram-se os casos de falhas ao replicar efeitos anteriormente considerados sólidos. Isso acendeu um alerta sobre a confiabilidade e a generalização das evidências científicas. Como resposta, surgiram diversas iniciativas para reformular práticas científicas, no âmbito mais amplo do movimento da Ciência Aberta, com o objetivo de aumentar a transparência e o rigor metodológico, e assim superar a crise de confiança e aprimorar a reprodutibilidade dos estudos.
Nesse contexto, a reprodutibilidade pode ser entendida em diferentes dimensões, todas baseadas no princípio fundamental de que as mesmas conclusões “seriam” ou “foram” alcançadas em um experimento reprodutível. Simkus et al. (2025) propõem uma classificação em cinco tipos:
É importante destacar que os termos reprodutibilidade e replicabilidade são, por vezes, usados com significados distintos. Alguns autores reservam o termo reprodutibilidade para descrever a repetição das análises com os mesmos dados (por exemplo, reproduzir os resultados de um artigo a partir dos dados e código originais), enquanto replicabilidade se refere à repetição do estudo com novos dados, para verificar se o fenômeno se mantém.
Neste texto, adotamos uma definição abrangente: reprodutibilidade inclui tanto a reprodução das análises (mesmos dados, mesmos métodos) quanto a replicação do estudo (novos dados sob o mesmo delineamento). Ambas as práticas são essenciais para validar descobertas científicas. Em todos os casos, o objetivo central é verificar se os resultados se sustentam sob escrutínio independente.
Por que a Reprodutibilidade é Importante?
A reprodutibilidade é um pilar do método científico. Resultados reprodutíveis aumentam a confiança de que os fenômenos observados são válidos e não frutos de acaso, viés ou erros metodológicos. Quando estudos falham em reproduzir achados anteriores, isso não é necessariamente algo negativo – na verdade, identificar inconsistências faz parte do auto-corrigir da ciência.
No entanto, altas taxas de falhas de replicação podem indicar problemas sistêmicos nas práticas de pesquisa, como delineamentos pouco rigorosos, tamanhos amostrais insuficientes, viés de publicação (publicam-se preferencialmente resultados “positivos”) e flexibilidades analíticas excessivas (p-hacking, HARKing, etc.).
Na área de Linguística, historicamente menos habituada a experimentos quantitativos, a discussão sobre reprodutibilidade também vem ganhando força. Estudos recentes mostraram que a adoção de práticas de transparência em linguística ainda é lenta – por exemplo, em uma amostra de 600 artigos na área, menos de 10% disponibilizavam materiais, dados ou protocolos abertamente; nenhum relatou pré-registro; e apenas 1% indicou ter conduzido um estudo de replicação (Grieve, 2021). Esses números sugerem que há amplas oportunidades de melhoria.
Assim como em outras disciplinas, a linguística enfrenta o desafio de garantir que seus resultados sejam confiáveis e cumulativos. Diversos especialistas e organizações científicas propõem soluções para melhorar a reprodutibilidade na pesquisa, incluindo melhorias metodológicas e mudanças culturais.
Dentre as recomendações mais citadas estão: empregar análises estatísticas mais rigorosas (e apropriadas), utilizar tamanhos amostrais maiores (aumentando o poder estatístico dos testes), e adotar uma postura de maior abertura em todas as etapas da pesquisa – desde o registro de hipóteses e desenho experimental, até o compartilhamento público de dados, códigos e materiais, bem como divulgação transparente dos resultados (sejam eles positivos ou nulos).
A seguir, apresentamos recomendações práticas para autores que desejam desenvolver um trabalho de reprodutibilidade em linguística. As orientações estão estruturadas em etapas, desde o planejamento inicial (com pré-registro) até a execução e divulgação dos resultados. Segui-las pode ajudar a alinhar seu trabalho às melhores práticas atuais, aumentando tanto a qualidade intrínseca do estudo quanto suas chances de contribuir de forma significativa para a literatura.
Recomendações Práticas para Autores
1. Planejamento do Estudo e Pré-registro Inicial
Escolha do estudo-alvo: O primeiro passo é selecionar um resultado ou estudo publicado que seja relevante e meritório de verificação. Essa escolha pode recair sobre um achado influente cuja robustez se deseja testar, uma evidência com implicações teóricas importantes ou até um resultado contraditório na literatura.
Tenha em mente que replicar um estudo não significa caçar erros alheios, mas sim esclarecer a validade e a generalidade de um fenômeno — faz parte do progresso cumulativo da ciência. Aborde a replicação com espírito colaborativo, não como uma “investigação criminal” contra o estudo original.
Revisão e delineamento: Estude minuciosamente o artigo original, seus métodos, dados e análises. Busque compreender todos os detalhes necessários para repetir o procedimento. Em seguida, elabore um plano de replicação completo, definindo a priori as perguntas de pesquisa ou hipóteses a serem testadas, o delineamento experimental, o tamanho da amostra e os critérios de coleta (incluindo um cálculo de poder para assegurar adequação estatística), as variáveis dependentes e independentes, e o plano de análise estatística.
Quanto mais fiel o plano for ao estudo original (no caso de uma replicação direta), maior será a capacidade de comparar os resultados de forma significativa. É recomendável também prever, desde o início, possíveis adaptações necessárias, como ajustes linguísticos ou adequações às características da nova amostra, documentando todas essas decisões.
Pré-registro e Relato Registrado: Uma vez definido o protocolo do estudo, registre-o publicamente antes da coleta de dados. O pré-registro consiste em enviar esse plano a uma plataforma aberta (como o Open Science Framework, AsPredicted ou similares), tornando públicas as hipóteses e os métodos planejados. Essa prática ajuda a prevenir mudanças pós-fato nos objetivos (HARKing) e reforça a credibilidade dos resultados confirmatórios.
Além disso, considere submeter o protocolo como um Relato Registrado (Registered Report) a um periódico científico. Nesse formato, o manuscrito é avaliado antes da coleta de dados. Se aprovado, o estudo recebe um compromisso de publicação independentemente dos resultados encontrados, desde que siga fielmente o plano registrado.
A revista Cadernos de Linguística aceita submissões nesse formato. Recomenda-se que os autores submetam, em um primeiro momento, um relato registrado contendo a introdução, metodologia e plano de análise. Somente após a aprovação editorial dessa primeira etapa é que a coleta de dados deve ser iniciada. Isso garante que a avaliação do estudo seja pautada pelo rigor metodológico, não pelos resultados.
Importante: No pré-registro, detalhe o máximo possível. Inclua os critérios de inclusão e exclusão de dados, como serão tratados os outliers, que comparações estatísticas estão previstas e quais variáveis serão coletadas — mesmo aquelas que não fazem parte da hipótese principal. Isso evita suspeitas de seleção ad hoc de variáveis ou condições e fortalece a transparência do estudo.
Um pré-registro detalhado demonstra o compromisso com um plano delineado previamente, contribuindo para a confiabilidade das análises confirmatórias.
Métodos: A seção de métodos deve trazer uma descrição exaustiva dos procedimentos planejados, com informações suficientes para permitir que outros pesquisadores reproduzam exatamente o estudo. Isso inclui:
2. Relato de Reprodutibilidade (Execução e Relato dos Resultados)
Com o plano registrado e aprovado, prossiga para a execução da replicação seguindo estritamente o protocolo delineado. O princípio fundamental aqui é a fidelidade metodológica: toda decisão deve respeitar o delineamento previamente estabelecido. Sempre que possível, conduza uma replicação direta, reproduzindo as condições do estudo original — isso inclui o uso dos mesmos estímulos, procedimentos, ambiente experimental, tempo de exposição e instruções aos participantes.
Reconhece-se que pequenas divergências podem ser inevitáveis — especialmente em pesquisas linguísticas, nas quais contextos socioculturais e perfis amostrais variam naturalmente. Ainda assim, o objetivo é minimizar variações não planejadas. Qualquer desvio em relação ao plano registrado deve ser criteriosamente documentado. Isso inclui desde problemas técnicos imprevistos até ajustes no perfil da amostra ou no material experimental. Tais anotações devem ser posteriormente incorporadas ao Relato de Pesquisa, de forma transparente.
Além de seguir fielmente o plano original, busque adotar práticas de rigor metodológico que aprimorem a qualidade do experimento, inclusive quando ausentes no estudo original. Entre essas práticas, destacam-se:
Essas medidas reduzem o risco de que fatores periféricos distorçam os resultados. Quando o estudo original não as adotou, sua inclusão pode inclusive ser uma forma de testar a robustez do fenômeno em condições mais controladas, contribuindo para a Reprodutibilidade Tipo E.
Outro aspecto muito importante é o poder estatístico. Uma das causas mais apontadas na literatura sobre a crise de reprodutibilidade é o uso de amostras subdimensionadas, que geram resultados instáveis e aumentam o risco de falsos negativos. Por isso, a replicação deve ser planejada com tamanho amostral igual ou superior ao do estudo original, com base em power analysis conduzida a priori. Replicações convincentes costumam envolver amostras mais amplas, pois isso aumenta a precisão estimativa e a confiabilidade inferencial.
Por exemplo, se o estudo original relatou um efeito com N = 30 por grupo, planejar a réplica com N = 60 ou N = 100 por grupo pode dobrar ou triplicar o poder estatístico, tornando mais provável detectar (ou refutar) o mesmo efeito de forma robusta. Em estudos de reprodutibilidade, é preferível pecar por excesso de dados do que repetir o erro de um desenho estatisticamente frágil.
Observação: Em certos casos, limitações práticas, como dificuldades logísticas ou populações pequenas, podem impedir o uso de grandes amostras. Nesses casos, essas limitações devem ser discutidas já no pré-registro, explicitando o poder pretendido e as consequências interpretativas dessa restrição. Resultados obtidos em amostras pequenas exigem cautela na generalização.
A execução experimental deve ser conduzida com atenção aos detalhes e profissionalismo. Isso inclui a verificação rigorosa do funcionamento de instrumentos (questionários, equipamentos, softwares, scripts), o treinamento da equipe em todas as etapas do protocolo e a garantia de que os participantes passem exatamente pelas condições planejadas.
É fundamental manter a distinção entre estudo confirmatório e estudo exploratório. Não devem ser realizadas novas coletas, exclusões ou análises não previstas sem registro e justificativa formal. Tais alterações, se inevitáveis, devem ser rotuladas como desvios (deviations) e descritas no Relato Registrado, sem impactar as conclusões principais. Improvisações comprometeriam o caráter confirmatório do estudo.
Se surgirem imprevistos durante a aplicação — como falha de um estímulo, abandono de um participante ou interrupções externas — siga os critérios de manejo previamente definidos no relato registrado ou protocolo pré-registrado (por exemplo, exclusão de dados, substituição de participantes ou sessões de reaplicação). Nunca decida ad hoc. Toda ocorrência emergencial deve ser anotada, com data, descrição e justificativa.
Mantenha um registro laboratorial detalhado de todo o processo, incluindo datas de coleta, condições do ambiente experimental, observações técnicas, dificuldades enfrentadas e comentários espontâneos de participantes (quando pertinentes). Embora nem tudo isso seja publicado, esses registros são essenciais para garantir rastreabilidade, detectar fontes de variação e fortalecer a confiabilidade do estudo.
3. Transparência, Documentação e Compartilhamento
A etapa pós-coleta é tão decisiva quanto o planejamento e a execução para garantir a reprodutibilidade de um estudo. Nesse momento, é fundamental adotar práticas de transparência, documentação rigorosa e abertura de dados, de modo que outros pesquisadores possam verificar, reproduzir e se beneficiar da sua replicação.
Organização dos dados e análise: Após a coleta, execute todas as análises conforme descrito no plano pré-registrado. Não ajuste modelos, não exclua dados sem justificativa e jamais altere hipóteses ou critérios com base nos resultados obtidos — isso comprometeria o caráter confirmatório do estudo. Se houver necessidade de realizar análises adicionais não previstas, elas devem ser claramente rotuladas como exploratórias e alocadas em uma seção separada do manuscrito.
Todas as análises previstas no protocolo devem ser apresentadas no manuscrito, salvo se for logicamente demonstrado que uma delas é inválida ou infundada — neste caso, a decisão precisa ser justificada de forma transparente. Relate sempre os valores exatos de p, os tamanhos de efeito e os intervalos de confiança para todas as análises inferenciais. Isso evita dependência excessiva de p-valores e contribui para uma interpretação mais adequada dos achados.
Documente todo o processo analítico com scripts completos e comentados (em R, Python, SPSS, etc.), explicando passo a passo o que foi feito. Uma boa prática é realizar uma reprodução interna: peça a um colega que não participou do estudo para rodar seus scripts com os dados brutos, verificando se obtém os mesmos resultados (compute and compare). Essa verificação ajuda a detectar inconsistências e garante maior confiabilidade ao estudo.
Ferramentas como o R Markdown, o pacote knitr (para R), ou o Jupyter Notebook (para Python) são fortemente recomendadas, pois integram código, documentação e resultados em um único documento reprodutível. Esses formatos promovem rastreabilidade e transparência, facilitando a revisão por pares e a replicação por terceiros.
Compartilhamento de dados, códigos e materiais: A disponibilização pública dos dados, materiais e scripts é uma das formas mais eficazes de promover a reprodutibilidade. Salvo impedimentos éticos ou legais, os dados brutos anonimizados devem ser depositados em repositórios de acesso aberto, como OSF, Zenodo, Figshare, ou repositórios especializados em linguística, como TROLLing, IRIS ou CLARIN ERIC. O mesmo vale para os scripts analíticos e materiais utilizados no experimento (listas de estímulos, instruções, vídeos, questionários etc.).
Ao compartilhar, inclua um arquivo README explicando o conteúdo de cada pasta ou arquivo, bem como instruções para reproduzir as análises. Muitos repositórios atribuem um DOI (Identificador de Objeto Digital), permitindo que esses materiais sejam formalmente citados e recuperáveis. A adesão aos princípios FAIR — Findable, Accessible, Interoperable, Reusable — é altamente recomendada e vem sendo adotada por agências científicas, periódicos e plataformas de dados como critério de qualidade e de reprodutibilidade.
Limitações ao compartilhamento: Caso os dados não possam ser abertos integralmente — por exemplo, gravações de fala com potencial de identificação, ou informações protegidas por contratos institucionais —, declare isso de forma transparente. Alternativas possíveis incluem: disponibilização de metadados, criação de dados sintéticos com as mesmas propriedades estatísticas dos dados reais, ou publicação apenas de estatísticas agregadas. Quando possível, indique que os dados podem ser acessados sob solicitação mediante termo de compromisso ético. O importante é demonstrar disposição para a abertura, dentro dos limites legais e éticos.
Documentação do experimento: A transparência se estende também aos detalhes do experimento. Considere incluir como material suplementar o formulário de consentimento, as instruções apresentadas aos participantes, especificações do ambiente experimental, cronogramas, planos de coleta e qualquer outra informação relevante para que o estudo possa ser replicado com precisão. Documente todas as deviations em relação ao plano original, mesmo as aparentemente triviais — por exemplo: “no pré-registro, previmos excluir tempos de reação < 300 ms, mas após a coleta revisamos o critério para 200 ms por motivo X”.
A revista Cadernos de Linguística incentiva fortemente práticas de ciência aberta e concede badges específicos a artigos que disponibilizam dados, materiais e protocolos. Esses selos — como Open Data, Open Materials e Preregistration — tornam visível ao leitor que o artigo segue padrões atuais de transparência e reprodutibilidade. Ao submeter seu trabalho, solicite os badges correspondentes se atender aos critérios.
A transparência vale inclusive (e especialmente) para resultados nulos ou negativos. Publicar replicações que não reproduzem os efeitos originais é essencial para evitar viés de publicação e para consolidar o conhecimento acumulado. Ao relatar tais resultados com clareza metodológica, você contribui para uma literatura mais honesta, robusta e cientificamente útil. Replicações falhas bem conduzidas são tão informativas quanto replicações bem-sucedidas.
4. Análise Crítica e Disseminação dos Resultados
Interpretação dos achados: Após a conclusão da replicação, a análise crítica dos resultados deve ser feita com base nos objetivos estabelecidos no protocolo pré-registrado. Evite julgamentos apressados ou interpretações baseadas em expectativas de confirmação. O foco deve estar na consistência metodológica e no que os dados efetivamente mostram em comparação com o estudo original. De modo geral, três cenários podem emergir:
Redação do artigo: No momento de redigir o manuscrito, mantenha a estrutura lógica e transparente do relato científico. A introdução deve ser, essencialmente, a mesma da versão aprovada no protocolo, com eventuais ajustes estilísticos e mudança do tempo verbal para o passado. As hipóteses não devem ser alteradas nem ampliadas. Trabalhos publicados após o pré-registro podem ser discutidos na seção de Discussão, desde que claramente identificados como desenvolvimentos posteriores.
A seção de resultados deve apresentar todas as análises confirmatórias previstas no protocolo, com valores exatos de p, tamanhos de efeito e intervalos de confiança. Caso alguma análise registrada tenha se revelado logicamente falha ou inaplicável, explique o motivo com clareza. Se houver análises exploratórias adicionais, inclua-as apenas em seção própria, com justificativa metodológica e distinção explícita em relação às análises pré-planejadas. As conclusões do artigo devem estar ancoradas exclusivamente nas análises confirmatórias.
Não omita variáveis ou resultados inesperados. A exclusão seletiva de dados que “não confirmaram o esperado” distorce a interpretação científica. Pelo contrário: relatar resultados nulos ou divergentes reforça a credibilidade do estudo. Informe, caso a caso, se cada hipótese registrada foi confirmada ou não. Adote uma linguagem descritiva e objetiva — evite termos valorativos como “a replicação falhou” ou “foi um sucesso”. Prefira descrições como: “não observamos o efeito X (p=0,45), enquanto o estudo original reportou p<0,01”. Isso ajuda a manter o foco nos dados e evita atribuições indevidas de culpa ou julgamento.
Quando possível, considere contatar os autores do estudo original. Algumas revistas. Cadernos de Linguística oferece espaço para que os autores originais comentem replicações de seus trabalhos, promovendo diálogo construtivo e transparência científica.
Submissão e publicação: Com o manuscrito completo, submeta-o à revista de sua escolha, assegurando que todos os materiais abertos (dados, scripts, protocolos) estejam acessíveis via repositórios confiáveis. No caso de Cadernos de Linguística, o processo de avaliação é aberto e transparente: os pareceres são assinados e, se o artigo for aceito, as revisões e as respostas dos autores são publicadas como material suplementar. Isso promove responsabilidade editorial, rastreabilidade e incentivo à revisão crítica construtiva.
Ao seguir todas as etapas metodológicas com rigor — incluindo pré-registro, execução fiel ao plano, transparência na documentação e compartilhamento aberto —, sua replicação tem grande chance de ser avaliada positivamente, mesmo que os resultados não confirmem o estudo original. Cadernos de Linguística e outros periódicos comprometidos com a ciência aberta não rejeitam artigos com base na “novidade” dos achados, mas sim na qualidade metodológica e na contribuição para o corpo cumulativo de conhecimento.
Disseminação: Após a publicação, divulgue o estudo em redes acadêmicas, seminários e congressos. Compartilhe sua experiência com colegas e estudantes, e incentive a realização de novas replicações. A prática da reprodutibilidade, além de aprimorar o conhecimento acumulado, fortalece a cultura de abertura e o rigor metodológico na linguística — contribuindo para uma ciência mais transparente, confiável e autocrítica.
Leituras Recomendadas