Usando R: 10 anos com R

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Ontem, 29 de fevereiro de 2020, foi o 20º aniversário do lançamento R 1.0.0. O blog de Jozef Hajnala tem um lindo post de aniversário com algumas curiosidades. Percebi que também é (não o dia, mas o ano) o meu aniversário de R.

Comecei a usar o R ​​em 2010, durante meu projeto de mestrado em Linköping. Daniel Nätt, que era um estudante de doutorado na época, estava usando-o para expressão gênica e trabalho de metilação do DNA. Eu acho que foi por isso que ele foi puxado para o R; ele precisava dos pacotes de biocondutores para microarrays. Ele me apresentou. Obrigado Daniel!

Acho que primeiro devo tê-lo usado para fazer algo com as curvas de derretimento do qPCR. Lembro que escrevi alguma função para remodelar / girar dados entre os formatos longo e amplo. Provavelmente era uma atrocidade de loops aninhados e indexação de colchetes rígidos. Vindo diretamente de um programa de graduação com cursos usando Ada e C ++, mesmo se também tivéssemos usado o Minitab para estatística e o Matlab para engenharia, falei R com um forte sotaque. De qualquer forma, eu estava preparado para pensar que fazer minha análise de dados com código era uma boa idéia e aproveitei a oportunidade para aprender uma ferramenta para isso. Obrigado, programa de graduação!

Eu acho que a coisa mais fácil de amar no R é o sistema de pacotes. Você certamente pode acabar na dependência com R e metaforicamente disparar o próprio pé, especialmente em um sistema de computação de alto desempenho compartilhado. Mas não encontrei nada até depois de vários anos. Fiquei, e ainda estou, impressionado com o funcionamento dos pacotes e consegui fazer quase tudo. Portanto, os pacotes de biocondutores foram provavelmente, indiretamente, o motivo pelo qual fui apresentado ao R e, depois disso, minha história de R pode ser contada em uma série de pacotes. Obrigado CRAN!

Leia Também  X é para scale_x | R-bloggers

O próximo pacote foi R / qtl, em que confiei no meu doutorado. Eu tinha minha própria cópia do R / qtl livro. Por um período, eu provavelmente escrevi coisas todos os dias:

library(qtl)

cross 

R/qtl is one of my favourite pieces or research software, relatively friendly and with lots of documentation. Thanks, R/qtl developers!

Of course it was Dom Wright, who was my PhD supervisor, who introduced me to R/qtl, and I think it was also he who introduced me to ggplot2. At least he used it, and at some point we were together trying to fix the formatting of a graph, probably with some ugly hack. I decided to use ggplot2 as much as possible, and as it is wont to, ggplot2 made me care about rearranging data, thus leading to reshape2 and plyr. ”The magic is not in plotting the data but in tidying and rearranging the data for plotting.” After a while, most everything I wrote used the ddply function in some way. Thank you, Hadley Wickham!

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Then came the contemporary tidyverse. For the longest time, I was uneasy with tidyr, and I’m still not a regular purrr user, but one can’t avoid loving dplyr. How much? My talk at the Swedish Bioinformatics Workshop in 2016 had a slide expressing my love of the filter function. It did not receive the cheers that the function deserves. Maybe the audience were Python users. With new file reading functions, new data frames and functions to manipulate data frames, modern R has become smoother and friendlier. Thanks, tidyverse developers!

The history of R on this blog started in 2011, originally as a way to make notes for myself or, ”a fellow user who’s trying to google his or her way to a solution”. This turned into a series of things to help teach R to biologists around me.

There was the Slightly different introduction to R series of blog posts. It used packages that feel somewhat outdated, and today, I don’t think there’s anything even slightly different about advocating RStudio, and teaching ggplot2 from the beginning.

This spawned a couple of seminars in course for PhD students, which were updated for the Wright lab computation lunches, and eventually turned into a course of its own given in 2017. It would be fun to update it and give it again.

The last few years, I’ve been using R for reasonably large genome datasets in a HPC environment, and gotten back to the beginnings, I guess, by using Bioconducor a lot more. However, the package that I think epitomises the last years of my R use is AlphaSimR, developed by colleagues in Edinburgh. It’s great to be able throw together a quick simulation to check how some feature of genetics behaves. AlphaSimR itself is also an example of how far the R/C++ integration has come with RCpp and RCppArmadillo. Thanks, Chris!

In summary, R is my tool of choice for almost anything. I hope we’ll still be using it, in new and interesting ways, in another ten years. Thank you, R core team!



If you got this far, why not subscribe for updates from the site? Choose your flavor: e-mail, twitter, RSS, or facebook...



cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br