Mesmo período do ano que vem: análise de dados do PubMed

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon Rstats – quantixed, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)


Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.

Vou dar uma palestra na próxima semana e queria atualizar alguns gráficos a partir de uma análise antiga que era apresentada anteriormente em quantix.

A questão é: quanto tempo leva para um artigo ser publicado?

A resposta é complexa (como discutido anteriormente no quantix), mas podemos pelo menos descobrir, usando dados do PubMed, o que os periódicos declaram como o tempo desde o recebimento de um artigo até a publicação do mesmo.

O código está abaixo e pode ser encontrado aqui. Recuperei todos os registros do PubMed para artigos publicados em 2019. Isso pode ser feito baixando blocos do tamanho de mês de dados XML usando uma consulta como:

(journal article[pt] NOT review[pt]) AND ("2019/1/1"[pdat] : "2019/1/31"[pdat])

O script R abaixo carrega todos esses arquivos, extrai os dados de que precisamos e os salva para que possam ser carregados novamente como um grande quadro de dados para análise. Essa abordagem foi necessária porque o conjunto de dados completo é de 24 GB e difícil de trabalhar.

Alguns números rápidos:

  • 1.060.195 artigos em 4.673 revistas
  • 3.847 periódicos tinham> 9 artigos)
  • O tempo médio recebido até a publicação é de 146 dias (IQR = 94 – 216)
  • O tempo médio por diário é 165 dias (IQR = 125 – 219)

Segundo o PubMed, o tempo necessário para que um artigo seja recebido por um periódico e depois publicado é pouco menos de seis meses. As advertências usuais se aplicam:

Leia Também  Batalha da Fintech entre titulares e recém-chegados gera acordos gigantescos de fusões e aquisições e captações de fundos, diz o relatório da Hampleton Partners
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
  • Os periódicos podem “reiniciar o relógio” nas submissões, rejeitando o artigo e permitindo o reenvio
  • Essa análise mostra apenas o tempo que cada artigo passou na revista que o publicou. Os manuscritos podem ser submetidos a vários envios em outros periódicos, o que não é mostrado aqui.

Mesma hora no próximo ano?

Minha análise anterior (nos dados do PubMed de 2013) descobriu que o tempo era muito mais longo, 239 dias. O que é responsável pela aceleração?

  • Mais dados: na análise anterior, cerca de 400.000 tempos de atraso poderiam ser calculados a partir de 1,5 milhão de registros. Desta vez, mais de 1 milhão de tempos de latência podem ser calculados.
  • Os processos ficaram mais rápidos: o atraso entre a aceitação e a publicação foi anterior a 122 dias. É provável que tenha caído (ainda não calculei esse número). Muitos periódicos agora executam um modelo de publicação contínua que diminui o tempo para a publicação real.

Seja qual for o motivo, é ótimo que os tempos de atraso das publicações tenham diminuído nos últimos seis anos.

O código

## the purpose of this script is to aggregate large PubMed XML datasets
## An example is an entire year of PubMed Journal Articles in month-sized XML files
require(XML)
require(ggplot2)

## Setup preferred directory structure in wd
ifelse(!dir.exists("Data"), dir.create("Data"), "Folder exists already")
ifelse(!dir.exists("Output"), dir.create("Output"), "Folder exists already")
ifelse(!dir.exists("Output/Data"), dir.create("Output/Data"), "Folder exists already")
ifelse(!dir.exists("Output/Plots"), dir.create("Output/Plots"), "Folder exists already")
ifelse(!dir.exists("Script"), dir.create("Script"), "Folder exists already")

## Function to extract a data frame from XML file
## This is modified from christopherBelter's pubmedXML R code
extract_xml  0),]
## summarise by journal
journalInfo  10),]
journalInfo 

The post title comes from “Same Time Next Year” by Paul McCartney & Wings from the bootleg “Cold Cuts” album.



If you got this far, why not subscribe for updates from the site? Choose your flavor: e-mail, twitter, RSS, or facebook...



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br