Pesquisa genética com visão computacional: um estudo de caso no estudo da dormência de sementes

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

Miniatura do artigo

Auxiliando a pesquisa genética com visão computacional

Para melhorar a detecção de assinaturas genéticas em sementes correlacionadas com sua dormência, treinamos modelos de visão por computador, que captaram mais do que se entendia anteriormente sobre os mecanismos de dormência.

Novo em visão computacional? Leia nosso guia de primeiros passos com fastai, ResNet, MobileNet e muito mais.

Navegue até uma seção:

Introdução

A dormência de sementes é um fenômeno biológico estudado ativamente e crucial em muitas áreas da economia (por exemplo, nos estágios iniciais da cadeia de abastecimento alimentar) e ecologia (por exemplo, fornecendo insights para estudar os efeitos da crise climática nas plantas).

Um contribuidor ativo para a compreensão dos mecanismos genéticos que controlam a dormência das sementes é Laboratório swiezewski, hospedado no Instituto de Bioquímica e Biofísica da Academia Polonesa de Ciências.

Todo o ciclo de geração, dormência e germinação da semente é investigado pelos pesquisadores do laboratório, permitindo ampliar a compreensão dos gatilhos críticos do processo e proporcionando a possibilidade de encontrar formas escaláveis ​​de monitorá-lo.

Olhando para as sementes de agrião (Arabidopsis thaliana), os pesquisadores notaram que um parâmetro morfológico diferencia, em certa medida, as sementes germinadas e ainda dormentes após um período chave de duas semanas a partir do momento da observação.

Figura 1 - As distribuições de um dos parâmetros morfológicos de sementes germinadas e dormentes são mostradas, indicando que o parâmetro tem maior probabilidade de ser grande para sementes germinadas.

Figura 1 – As distribuições de um dos parâmetros morfológicos de sementes germinadas e dormentes são mostradas, indicando que o parâmetro tem maior probabilidade de ser grande para sementes germinadas.

O parâmetro morfológico das sementes foi estimado a partir de pares de imagens obtidas em máquina que manuseia seu plantio. Os pesquisadores nos contataram para obter ajuda na análise dos dados com visão de computador. Eles levantaram a hipótese de que características mais distinguíveis visualmente podem ser encontradas por esses modelos, permitindo-lhes discernir entre as sementes que, em duas semanas a partir do momento em que as fotos foram tiradas, estarão dormentes ou germinadas.

Dados

Os dados que nos foram fornecidos consistiam em vários milhares de pares de imagens de sementes – cada semente tendo cerca de 0,2 mm de diâmetro. As fotos vieram de uma máquina usada para automatizar seu posicionamento nas bandejas onde são monitoradas.

Imagem 2 - Par de fotos de uma única semente (suspensa em agulha pneumática)

Imagem 2 – Par de fotos de uma única semente (suspensa em agulha pneumática)

As imagens foram tiradas em um ambiente altamente controlado, então ficou claro que apenas uma pequena fração da imagem contém a semente. Portanto, devemos identificar a parte da imagem que contém a semente para ajudar os modelos planejados a focar nas características da semente.

Além disso, cortar as fotos até a semente reduz seu tamanho, agilizando o treinamento das modelos. No entanto, a agulha nem sempre foi colocada no mesmo local da imagem, então precisávamos realizar corte adaptativo. Decidimos analisar as intensidades totais de cor para cada linha e coluna de pixels na imagem – analisando os sinais obtidos e identificando automaticamente os picos nos canais vermelhos.

Imagem 3 - Sinais com intensidades de pixels somadas por linha para as fotos acima (gráficos análogos foram analisados ​​para as colunas).  Os picos são marcados com uma cruz.  O brilho do fundo na parte inferior das imagens se traduz em uma intensidade de cor crescente nos gráficos acima.

Imagem 3 – Sinais com intensidades de pixels somados por linha para as fotos acima (gráficos análogos foram analisados ​​para as colunas). Os picos são marcados com uma cruz. O brilho do fundo na parte inferior das imagens se traduz em uma intensidade de cor crescente nos gráficos acima.

Com uma janela quadrada fixa centrada nos locais dos picos, pudemos cortar as imagens para destacar as sementes.

Figura 4 - Fotos de uma semente com a localização das sementes identificada a partir do recorte a partir da localização do pico de intensidade de cor.

Imagem 4 – Fotos de uma semente com a localização das sementes identificada a partir do recorte com base na localização do pico de intensidade de cor

Imagem 5 - Fotos recortadas de uma semente com resolução real.  Essas imagens foram posteriormente inseridas nas redes neurais.

Imagem 5 – Fotos recortadas de uma semente com resolução real. Essas imagens foram posteriormente inseridas nas redes neurais

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Imagem 6 - Mais exemplos de imagens cortadas (uma única imagem por par é mostrada).  Pode-se ver que é quase impossível para um olho humano dizer a diferença entre as classes.

Imagem 6 – Mais exemplos de imagens cortadas (uma única imagem por par é mostrada). Pode-se ver que é quase impossível para um olho humano dizer a diferença entre as classes

A resolução não é muito alta. Embora as imagens originais tenham quase 400.000 pixels cada, as sementes normalmente ocupam cerca de 500 deles. Isso representa um desafio para qualquer tentativa de reconhecer as características visuais das sementes.

Além de recortar as imagens, foi necessário limpar os dados das etiquetas que recebemos. As sementes foram rotuladas com um dos quatro categorias: germinado, dormente, perdido e morto. As duas primeiras foram as aulas mais interessantes para nossos propósitos. Descartamos as classes adicionais para a análise atual, pois eram produtos de aplicação inadequada de manuseio de sementes.

Curiosamente, os dados vieram de quatro bandejas diferentes (cada uma contendo sementes de um espécime de planta distinto) e cada uma delas tinha uma distribuição diferente das quatro classes iniciais. Muitas observações interessantes podem ser feitas visualizando a localização das sementes nas bandejas redondas.

Imagem 7 - A distribuição das classes variou significativamente entre as bandejas

Imagem 7 – A distribuição das classes variou significativamente entre as bandejas

Selecionamos 10% dos dados (estratificados pelo rótulo) como um conjunto de validação.

Todos os resultados foram avaliados nesse conjunto, e todos os modelos treinados apenas no restante do conjunto de treinamento.

Benchmark

Sabíamos que o parâmetro morfológico das sementes se correlaciona com sua dormência no sentido acima, então primeiro treinamos um modelo de árvore incrementado com gradiente extremo simples para prever o rótulo (se a semente germinou ou permaneceu dormente). As previsões são baseadas apenas no valor daquele parâmetro morfológico das sementes identificadas individualmente nas duas fotos de uma determinada semente.

O modelo atingiu 62% de precisão de validação, o que não é muito impressionante para um classificador binário, mas serve como referência para modelagem futura. Em particular, este benchmark quantifica até que ponto a dormência da semente pode ser explicada apenas com o parâmetro morfológico mencionado.

Arquitetura

Para acomodar os dados sendo pares de fotos RGB, decidimos adaptar arquiteturas de rede neural conhecidas para aceitar seis canais de entrada, misturando as informações das duas fotos apenas nas camadas densas posteriores.

Começamos treinando redes residuais dentro da família ResNet, pois são as mais robustas em nossa experiência, oferecendo resultados promissores em um ritmo de treinamento razoável. Decidimos usar uma versão adaptada de uma versão B3 EfficientNet que nos deu um precisão de validação de 70%.

Resultados

Usando análises de visão computacional dos pares de imagens, fomos capazes de prever a dormência das sementes com uma precisão significativamente maior do que um modelo baseado apenas no único parâmetro morfológico conhecido por se correlacionar com a dormência das sementes.

É uma descoberta empolgante, pois apóia a hipótese de que os mecanismos genéticos que controlam a dormência também se refletem em características mais distinguíveis visualmente.

Para confirmar o resultado acima, analisamos como a precisão do modelo difere entre os diferentes tamanhos de sementes. Embora haja uma diferença (sementes com a característica morfológica mais pronunciada sendo classificadas com mais precisão), ela não é significativa.

Além disso, as bandejas nas quais as sementes foram cultivadas foram um indicador mais forte de sua previsibilidade de dormência. As sementes da bandeja 2 foram as mais difíceis de prever e as das bandejas 1 e 4 as mais fáceis (com precisão chegando a 75%).

Curiosamente, para as bandejas 1 e 4, as distribuições dos parâmetros morfológicos para ambas as classes não estão desalinhadas e o equilíbrio entre as classes é complementar.

Figura 8 - Distribuições do parâmetro morfológico para as etiquetas separadamente e bandejas individuais.  As bandejas 2 e 3 exibem o deslocamento das sementes germinadas para valores maiores, enquanto as bandejas 1 e 4 apenas em uma extensão modesta - as duas distribuições para essas bandejas estão mais bem alinhadas.

Figura 8 – Distribuições do parâmetro morfológico para as etiquetas separadamente e bandejas individuais. As bandejas 2 e 3 exibem o deslocamento das sementes germinadas para valores maiores, enquanto as bandejas 1 e 4 apenas em uma extensão modesta – as duas distribuições para essas bandejas estão mais bem alinhadas.

Conclusão

Neste projeto, preparamos e modelamos um conjunto de dados muito interessante – que consiste em pares de pequenas fotos de sementes. Nossa principal contribuição foi a confirmação da hipótese dos pesquisadores – a dormência é controlada por mecanismos genéticos que possuem assinaturas visuais em um estágio muito inicial no desenvolvimento das sementes.

Saiba mais sobre visão computacional:

Appsilon está contratando para funções remotas! Veja nosso Carreiras página para todas as posições em aberto, incluindo R Shiny Developers, Engenheiros Fullstack, Engenheiros front-end, uma Engenheiro de infraestrutura sênior, e um Gerente de Comunidade. Junte-se à Appsilon e trabalhe em projetos inovadores com as empresas Fortune 500 mais influentes do mundo.

Artigo Pesquisa genética com visão computacional: Um estudo de caso no estudo da dormência de sementes vem de Appsilon | Soluções de ciência de dados de ponta a ponta.



[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
Leia Também  Apresentando o GooglyPlusPlus !!! | R-bloggers