Quando se trata de plágio, muitos acadêmicos parecem acreditar em números mágicos. No mês passado, uma empresa que oferecia software de detecção de plágio anunciou que seria adquirida por US $ 1,7 bilhão ainda este ano. É uma das várias empresas que oferecem sistemas de software que aplicam algoritmos de ‘caixa preta’ para produzir uma pontuação que mostra como um texto combina com outros. Como esses sistemas encontram alguns casos de plágio, há uma crença errônea de que eles documentam devidamente todos os casos.
Pena, minha avó teria dito. Eu tenho testado o software de detecção de plágio nos últimos 15 anos. Os resultados costumam ser difíceis de interpretar, difíceis de navegar e, às vezes, apenas errados. Muitos sistemas relatam falsos positivos para frases comuns, nomes longos de instituições ou até mesmo informações de referência. O software também produz falsos negativos. Um sistema pode não encontrar plágio se a fonte do texto plagiado não tiver sido digitalizada, contiver erros de ortografia ou não estiver disponível para o sistema de software. Muitos casos de plágio não são detectados quando o material é traduzido ou extraído de várias fontes. As avaliações dependem dos algoritmos utilizados e do corpus de trabalho disponível para comparação. Para sistemas que verificam amostras aleatórias, repetir o teste do documento minutos depois pode produzir resultados diferentes. Eu também vi sistemas diferentes classificando um texto como plagiado completamente ou parcialmente, ou livre de plágio.
No entanto, o número que esses sistemas produzem – conhecido como “pontuação de originalidade”, “conteúdo não exclusivo” ou “PlagLevel” – geralmente é considerado pelo valor nominal. Uma segunda opinião é raramente procurada, embora existam dezenas de sistemas disponíveis. Na verdade, a leitura dos relatórios produzidos pelo software pode revelar material corretamente citado, como uma seção de métodos referenciados corretamente, marcada como plágio. Leia mais. Fonte: SIBiUSP - 13/5/2019