FRAMEWORK PARA INTEGRAÇÃO E TRADUÇÃO DE DADOS BIOLÓGICOS DO GENBANK EM NANOPUBLICAÇÕES

Publicado em 22/03/2021 - ISBN: 978-65-5941-128-3

Título do Trabalho
FRAMEWORK PARA INTEGRAÇÃO E TRADUÇÃO DE DADOS BIOLÓGICOS DO GENBANK EM NANOPUBLICAÇÕES
Autores
  • José Vitor da Cunha Hisse Alves Cabral
  • Matheus Pedra Puime Feijoó
  • Guilherme Duarte Franco
  • André Cordeiro Santos de Queiroz
Modalidade
Resumo apresentação oral curta
Área temática
Centro de Ciências Matemáticas e da Natureza (CCMN)/Ciência da Computação
Data de Publicação
22/03/2021
País da Publicação
Brasil
Idioma da Publicação
Português
Página do Trabalho
https://www.even3.com.br/anais/jgmictac/319842-framework-para-integracao-e-traducao-de-dados-biologicos-do-genbank-em-nanopublicacoes
ISBN
978-65-5941-128-3
Palavras-Chave
Nanopublicação, Genbank, Fair, Go Fair, PubMed, RDF, Linked Data, Banco de dados, Genoma, GenKnowlets, Knowlets
Resumo
Os recentes avanços na tecnologia possibilitaram o aumento na variedade de fontes de dados ligados à bioinformática. Pesquisadores da área relatam que grande parte dessas fontes são descentralizadas, desestruturadas e de difícil acesso. Banco de dados inconsistentes, falta de informação sobre proveniência, dados ou metadados incompletos ou inconsistentes, são exemplos desses problemas vivenciados (Chen et al., 2017). Um exemplo disso é a base de dados genômicos Genbank (Benson et al., 2013), que é considerada uma das maiores da área biológica, mas também uma das que apresenta diversos problemas no controle de dados de sua própria base (Gonçalves et al., 2019). Esse trabalho consiste em relatar e implementar uma possível proposta de um fluxo de dados para extração, estruturação, indexação e disponibilização de dados biológicos a fim de mitigar os problemas vivenciados por pesquisadores da área. Propomos a construção de três módulos independentes. O primeiro é um crawler para obter informações do Genbank e do repositório de literatura biomédica PubMed (NCBI, 2020). O segundo é um conversor das informações obtidas pelo crawler para RDF (RDF, 2020). E o terceiro módulo é focado no envio de Nanopublicações para um servidor específico para este fim. O uso da Nanopublicação, e toda a tecnologia que a compõem, como o RDF, possibilitará a estruturação de bases usadas em pesquisas, a proveniência de toda afirmação oriunda dos dados, a indexação e centralização de dados e metadados e por fim, permitiremos que máquinas processem, interpretem e aprendam com as informações. Assim fazendo com que os dados e metadados atinjam os princípios de dados FAIR, que estão sendo amplamente utilizados atualmente para aumentar a possibilidade dos dados científicos serem achados, acessíveis, interoperáveis e reusáveis tanto por humanos quanto por máquinas. A proposta desenvolvida possui potencial de se tornar um software que vasculha bases de dados biológicas e insere as nanopublicações criadas em um repositório central de forma completamente autônoma e consequentemente gerando uma maior reusabilidade destes dados. REFERÊNCIAS BIBLIOGRÁFICAS Chen, Q., Zobel, J., Verspoor, K. Duplicates, redundancies and inconsistencies in the primary nucleotide databases: a descriptive study. Database, 2017. Benson, D. A., Cavanaugh, M., Clark, K., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., & Sayers, E. W. GenBank. Nucleic acids research, 2013 D36–D42. Gonçalves, R., Musen, M. The variable quality of metadata about biological samples used in biomedical experiments. Sci Data, 2019. v. 6. NCBI. PubMed. Disponível em: https://pubmed.ncbi.nlm.nih.gov/. Acesso em: 30 nov. 2020. RDF. Resource Description Framework (RDF). Disponível em: https://www.w3.org/RDF/. Acesso em: 30 nov. 2020.
Título do Evento
XLII Jornada Giulio Massarani de Iniciação Científica, Tecnológica, Artística e Cultural (JICTAC 2020 - Edição Especial) - Evento UFRJ
Título dos Anais do Evento
Anais da Jornada Giulio Massarani de Iniciação Científica, Tecnológica, Artística e Cultural
Nome da Editora
Even3
Meio de Divulgação
Meio Digital

Como citar

CABRAL, José Vitor da Cunha Hisse Alves et al.. FRAMEWORK PARA INTEGRAÇÃO E TRADUÇÃO DE DADOS BIOLÓGICOS DO GENBANK EM NANOPUBLICAÇÕES.. In: Anais da Jornada Giulio Massarani de Iniciação Científica, Tecnológica, Artística e Cultural. Anais...Rio de Janeiro(RJ) UFRJ, 2021. Disponível em: https//www.even3.com.br/anais/jgmictac/319842-FRAMEWORK-PARA-INTEGRACAO-E-TRADUCAO-DE-DADOS-BIOLOGICOS-DO-GENBANK-EM-NANOPUBLICACOES. Acesso em: 15/02/2025

Trabalho

Even3 Publicacoes