Preview

Труды Института системного программирования РАН

Расширенный поиск

Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии

https://doi.org/10.15514/ISPRAS-2014-26(4)-4

Аннотация

В работе кратко описывается масштабируемая программная инфраструктура для хранения и обработки данных в задачах вычислительной биологии. Обсуждаются использованные технологии, собственное программное решение для предсказания сайтов связывания транскрипционных факторов в геномах, реализация предоставления решения как части веб-лаборатории с REST API и веб-интерфейсом для исследователей.

Об авторах

О. Д. Борисенко
ИСП РАН
Россия


А. В. Лагута
ИСП РАН
Россия


Д. Ю. Турдаков
ИСП РАН
Россия


С. Д. Кузнецов
ИСП РАН
Россия


Список литературы

1. Страница проекта «1000 Genomes project» - http://www.1000genomes.org/about

2. Страница проекта по предоставлению данных геномов и разметки известных генов от университета Санта-Круз - http://genome.ucsc.edu/

3. Страница проекта Google Genomics - https://cloud.google.com/genomics/

4. Ivan V. Kulakovskiy, Yulia A. Medvedeva, Ulf Schaefer, Artem S. Kasianov, Ilya E. Vorontsov, Vladimir B. Bajic and Vsevolod J. Makeev, HOCOMOCO: a comprehensive collection of human transcription factor binding sites models, Nucleic Acids Research 2012. doi: 10.1093/nar/gks1089

5. M. Ahrens, OpenZFS: a Community of Open Source ZFS Developers."AsiaBSDCon 2014, pp. 27-32.

6. Страница проекта NFS - http://nfs.sourceforge.net/

7. Duan, Zhi Ying, and Yi Zhen Cao, The Implementation of Cloud Storage System Based on OpenStack Swift, Applied Mechanics and Materials. Vol. 644. 2014, pp. 2981-2984.

8. Beernaert, L., Matos, M., Vilaça, R., & Oliveira, R., Automatic elasticity in Openstack, In Proceedings of the Workshop on Secure and Dependable Middleware for Cloud Monitoring and Management, ACM, p. 2.

9. Zhou, Qing, and Jun S. Liu., Modeling within-motif dependence for transcription factor binding site predictions., Bioinformatics 20.6, 2004, pp. 909-916.

10. Bintu, Lacramioara, et al., Transcriptional regulation by the numbers: applications. Current opinion in genetics & development 15.2, 2005: pp. 125-135.

11. Описание механики процесса связывания факторов транскрипции с геномом с точки зрения статистики - http://www.bio-physics.at/wiki/index.php?title=Statistical_Mechanics_of_Binding

12. Описание формата FASTA - http://genetics.bwh.harvard.edu/pph/FASTA.html

13. Zhang, Xiujun, Position Weight Matrices., Encyclopedia of Systems Biology. Springer New York, 2013, 1721-1722.

14. Genomes project web page - http://www.1000genomes.org/about

15. University of California, Santa Cruz genome project - http://genome.ucsc.edu/

16. Google Genomics web page - https://cloud.google.com/genomics/

17. Ivan V. Kulakovskiy, Yulia A. Medvedeva, Ulf Schaefer, Artem S. Kasianov, Ilya E. Vorontsov, Vladimir B. Bajic and Vsevolod J. Makeev, HOCOMOCO: a comprehensive collection of human transcription factor binding sites models, Nucleic Acids Research 2012. doi: 10.1093/nar/gks1089

18. M. Ahrens, OpenZFS: a Community of Open Source ZFS Developers."AsiaBSDCon 2014, pp. 27-32.

19. NFS project web page - http://nfs.sourceforge.net/

20. Duan, Zhi Ying, and Yi Zhen Cao, The Implementation of Cloud Storage System Based on OpenStack Swift, Applied Mechanics and Materials. Vol. 644. 2014, pp. 2981-2984.

21. Beernaert, L., Matos, M., Vilaça, R., & Oliveira, R., Automatic elasticity in Openstack, In Proceedings of the Workshop on Secure and Dependable Middleware for Cloud Monitoring and Management, ACM, p. 2.

22. Zhou, Qing, and Jun S. Liu., Modeling within-motif dependence for transcription factor binding site predictions., Bioinformatics 20.6, 2004, pp. 909-916.

23. Bintu, Lacramioara, et al., Transcriptional regulation by the numbers: applications. Current opinion in genetics & development 15.2, 2005: pp. 125-135.

24. Statistical mechanics of transctiption factors binding sites - http://www.bio-physics.at/wiki/index.php?title=Statistical_Mechanics_of_Binding

25. FASTA format description - http://genetics.bwh.harvard.edu/pph/FASTA.html

26. Zhang, Xiujun, Position Weight Matrices., Encyclopedia of Systems Biology. Springer New York, 2013, 1721-1722.


Рецензия

Для цитирования:


Борисенко О.Д., Лагута А.В., Турдаков Д.Ю., Кузнецов С.Д. Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии. Труды Института системного программирования РАН. 2014;26(4):45-54. https://doi.org/10.15514/ISPRAS-2014-26(4)-4

For citation:


Borisenko O., Laguta A., Turdakov D., Kuznetsov S. Developing scalable software infrastructure for data storage and processing for computational biology problems. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2014;26(4):45-54. (In Russ.) https://doi.org/10.15514/ISPRAS-2014-26(4)-4



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)