Skip to content

Instantly share code, notes, and snippets.

@gustavofonseca
Created May 19, 2015 11:10
Show Gist options
  • Save gustavofonseca/704dccdb7332285ed324 to your computer and use it in GitHub Desktop.
Save gustavofonseca/704dccdb7332285ed324 to your computer and use it in GitHub Desktop.
Anotações sobre a questão das referências bibliográficas caóticas que lidamos no SciELO
Para a má-formação das referências bibliográficas, o céu é o limite. Além de
não seguirem as normas à risca, os autores ainda muitas vezes produzem
referências que carecem dos elementos fundamentais, como por exemplo a URL
em uma referência à página de internet.
Na SciELO, documentos individuais não podem ser impedidos de ingressar por
problemas de má-formação ou falta de metadados essenciais. Suspensões ou
outras medidas punitivas se dão no nível do periódico, por meio de processos
formais, e não individualmente no nível do documento.
O SciELO PS prevê a identificação da referência bibliográfica em duas partes:
1) a parte literal, por meio do elemento *mixed-citation* e 2) os componentes
individuais, por meio do elemento *element-citation*.
De maneira pragmática, a presença do conteúdo literal da referência no elemento
*mixed-citation* é suficiente para a publicação do documento na coleção SciELO.
A identificação detalhada dos elementos de *element-citation* é necessária para
que o documento integre as diversas métricas e serviços disponibilizados pela
SciELO e seus parceiros, que pode ser considerada um adicional.
Então, deveríamos esperar que o elemento *element-citation* seja acompanhado
por um conjunto mínimo de dados, dependendo do seu tipo de publicação? Não sei
ao certo... me parece ser o mesmo que negar a natureza má-formada e
desnormalizada dos dados.
E quando há o dado no conteúdo literal de *mixed-citation* e ele apenas
não foi identificado para compor os metadados de *element-citation*? Trata-se
claramente de um erro no processo de produção do XML SciELO PS, e alguém vai
pagar por isso... seja a equipe de ingestão da SciELO, a equipe de produção do
XML, o editor ou o autor. A graça é que o autor "contratou" o editor, que por
sua vez contratou a equipe de produção do XML para que o documento seja
publicado e dele seja gerado valor por parte da coleção SciELO. Me parece
sensato que a SciELO proporcione meios para que tanto o autor quanto o editor
tenham clareza da capacidade de geração de valor que cada documento apresenta
no momento da ingestão, e permita que ambos sejam responsáveis e conscientes
acerca da qualidade do conteúdo que produzem.
Mas, e o uso do atributo *@specific-use="display-only"* em *element-citation*
quando seu conjunto de metadados é considerado insuficiente e inútil para algo
além da exibição? Bom, a idéia de suficiência e utilidade depende única e
exclusivamente do consumidor do metadado. No momento da produção do XML,
é impossível afirmar com certeza que determinada referência apresenta um
conjunto incompleto de metadados ou serve apenas para exibição. Diferentes
métricas dependem de diferentes metadados, e a responsabilidade de racionalizar
sobre a suficiência e utilidade é, novamente, do consumidor.
Na minha opinião, o único mecanismo regulatório que temos à mão - nós,
envolvidos com o fluxo de ingestão - é a geração de relatórios sobre a
qualidade dos documentos, que poderão ser utilizados tanto no processo de
avaliação de permanência do periódico na coleção quanto como resposta imediata
aos editores e autores sobre o que o seus conteúdos valem enquanto metadado.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment