期刊名称:RECIIS - Electronic Journal of Communication, Information & Innovation in Health
电子版ISSN:1981-6278
出版年度:2007
卷号:1
期号:2
页码:1-5
DOI:10.3395/reciis.v1i2.Sup.100en
出版社:Institute of Communication and Scientific and Technological Information in Health
摘要:Os recursos computacionais se tornaram essenciais para o desenvolvimento de projetos genoma. Vários sistemas distribuídos que gerenciam estruturas complexas e que integram interfaces gráficas voltadas para o usuário, processamento e mineração de grandes quantidades de dados e bancos de dados volumosos, foram propostos. A maioria dos laboratórios de seqüenciamento já consolidados desenvolveu soluções próprias. Entretanto, um sistema portável e escalonável, integrando todos esses aspectos, ainda não está disponível para a comunidade científica. Neste estudo, apresentamos um protótipo de tal sistema em curso de desenvolvimento aberto em http://sourceforge.net/projects/ askgene. Este sistema permite (i) acessibilidade aos dados e processos ao longo de todo o fluxo de dados, (ii) representação de dados e ontologia, (iii) manejo do fluxo de processamento (workflow), (iv) arquitetura e documentação do sistema, (v) desenvolvimento corporativo, anotação manual, (vii) processamento de dados corrompidos, (viii) distribuição e paralelização de processos, (ix) portabilidade e escalonabilidade.
其他摘要:Computational resources have become essential for genome project development. Distributed systems managing complex structures integrating graphical user interfaces, expensive data processing, data mining and large databases, have been proposed. Most consolidated sequencing laboratories have developed their own bioinformatics solutions. However, a portable and scalable system integrating all these aspects is not yet available to the scientific community. In this report, we present the prototype of such a system in open development at http://sourceforge.net/projects/askgene. It allows for the (i) accessibility of data and processes all along the data flow, (ii) data representation and ontology, (iii) workflow tuning, (iv) system architecture and documentation, (v) corporate development, (vi) manual annotation, (vii) bogus data processing, (viii) process parallelization and distribution, (ix) portability and scalability.
关键词:Anotação de gene; Perl; banco de dados relacional; PostgreSQL; código aberto