Mutantes: um sistema de nomenclatura implausível para mutantes SARS-CoV-2

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

[This article was first published on Rstats – quantixed, and kindly contributed to R-bloggers]. (Você pode relatar problemas sobre o conteúdo desta página aqui)


Quer compartilhar seu conteúdo em R-bloggers? clique aqui se você tiver um blog, ou aqui se não tiver.

A resposta científica à pandemia COVID-19 tem sido impressionante. Além dos esforços para gerar vacinas, a vigilância genômica do vírus tem sido realmente notável. Por exemplo, o projeto nextstrain tem sequência de muitos genomas SARS-CoV-2. Na verdade, a rápida identificação de várias novas cepas e mutações por diversos grupos de cientistas resultou em uma crise de nomenclatura.

Uma estratégia altamente memorável é dar nomes de animais de estimação aos mutantes SARS-CoV-2. A “variante do Reino Unido” designada B.1.1.7 tem uma mutação N501Y. A primeira letra se refere ao aminoácido original, o número representa a posição do aminoácido na proteína do pico e a segunda letra é o aminoácido naquela posição após a mutação. Assim, o mutante N501Y torna-se Nelly, E484K é chamado Eek, D614G é dublado Doug e assim por diante.

Eu realmente gosto dessa estratégia. Obviamente, há deficiências: Nelly poderia se referir a mudanças de N para Y no pico, exceto em 501, enquanto as mutações subsequentes também representam um problema. No entanto, nomes de animais de estimação são muito memoráveis. Eu me perguntei o quão plausível isso é como uma estratégia geral de nomenclatura.

Todas as mutações possíveis podem ser descritas por palavras em inglês?

Vamos escrever algum código R e descobrir! Role para baixo para ver o resultado.

O código

Primeiro, pegamos uma lista de palavras em inglês. Há um arquivo de texto útil disponível no GitHub para essa finalidade. Tem quase meio milhão de palavras. Também fazemos um vetor de todos os vinte aminoácidos. Eu verifiquei se a proteína spike realmente tem pelo menos um de cada aminoácido, e tem. Em seguida, fazemos uma matriz 20 x 20 para conter a contagem de palavras no dicionário que correspondem a todas as 380 mutações possíveis. Por que 380? Bem, existem 400 combinações, mas 20 delas não são mutações, A para A, C para C e assim por diante.

Leia Também  Novo pacote - {cdccovidview} - Para trabalhar com os novos rastreadores COVID-19 do CDC dos EUA: COVIDView e COVID-NET

Eu uso o grep para encontrar correspondências, itero usando dois loops for e preencho a matriz com as correspondências. Sinta-se à vontade para me dizer uma maneira mais eficiente de fazer isso. Usei o ggplot para mostrar os resultados porque é complicado mostrar a escala de cores na base R.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
library(ggplot2)
library(reshape2)
# character vector of 20 amino acids
aaList 


The result

Heatmap of word frequency

Almost all the mutations have some words in the dictionary to describe them. For example the N501Y “Nelly” mutation could easily be Nabobery or Nuttily. There are 2407 matches for the “from N to Y” combination.

The grey tiles show where there are no matches at all. So D to Q, G to Q etc. have no matches and I guess that not surprising. There are only 29 words in the dictionary that end in Q. Many of those are abbreviations that would receive a stern frown in a Scrabble match.

subList 


The heat map shows that mutations that lead to valine (V), tryptophan (W) or phenylalanine (F) are, like Glutamine (Q), lower frequency. The resulting residue is a tighter constraint than the starting letter/amino acid. Here, the lowest frequencies were Q and Y.

The top three most bountiful mutations are: C to S, P to S and S to E with 7149, 6576 and 5422 words respectively.

Conclusion

Although this naming strategy is fun and memorable, the answer is No: it cannot be used as a general naming system for mutations.

The post title comes from the eponymous debut album by Os Mutantes.



[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br