Вход для сотрудников

Федеральное государственное бюджетное научное учреждение
«ФЕДЕРАЛЬНЫЙ НАУЧНЫЙ ЦЕНТР ПИЩЕВЫХ СИСТЕМ
ИМ. В.М.ГОРБАТОВА»
Российской Академии Наук

УДК 004.85:57
Ил. 3. Табл. 1. Библ. 27.

DOI: 10.21323/2071-2499-2021-3-40-43

Общие сведения о машинном обучении и его применении для решения биологических задач

Корниенко В.Ю., канд. биол. наук, Минаев М.Ю., канд. техн. наук
ФНЦ пищевых систем им. В.М. Горбатова
Ключевые слова: искусственный интеллект, машинное обучение, искусственные нейронные сети,
Реферат:
Представлены общие принципы устройства и функционирования искусственных нейронных сетей, обсуждаются особенности формирования групп данных, используемых для обучения искусственных нейросетей. Затрагивается проблема переобучения и вопросы различия между машинным и глубоким машинным обучением. Описаны современные тенденции применения искусственных нейронных сетей для решения задач в биологии и пищевой промышленности. Обсуждаются перспективы применения машинного обучения для задач выполнения лабораторных анализов, а также их возможная роль при анализе результатов научных исследований. Приведены ссылки на основные ресурсы, использующие машинное обучение. Информация, приведённая в статье, будет полезна для специалистов, планирующих реализацию проектов, использующих машинное обучение в пищевой индустрии.


General information about machine learning and its use for solving biological problems

Kornienko V.Yu., Minaev M.Yu.
Gorbatov Research Center for Food Systems
Key words: machine learning, neural networks, artificial intelligence
Summary:
This article describes the general principles of the structure and functioning of artificial neural networks, we discuss the features of the formation of data groups used for training artificial neural networks. We address the problem of retraining and the difference between machine learning and deep learning. This article describes the current trends in the use of artificial neural networks for solving problems in biology and the food industry. We discuss the prospects of using machine learning for laboratory analysis tasks, as well as their possible role in analyzing the results of scientific research. We provide links to the main resources that use machine learning. The information provided in the article will be useful for specialists planning the implementation of projects using machine learning in the food industry.


СПИСОК ЛИТЕРАТУРЫ / REFERENCES:

1.Zou, J. A primer on deep learning in genomics / J. Zou, M. Huss, A. Abid, P. Mohammadi, A. Torkamani, A. Telenti // Nat Genet. – 2019. – № 51. – P. 12–18. DOI: 10.1038/s41588-018-0295-5.

2.Kalinin, A. Deep Learning in Pharmacogenomics: From Gene Regulation to Patient Stratification / A.A. Kalinin, G.A. Higgins, N. Reamaroon, S. Soroushmehr, A. Allyn-Feuer, I.D. Dinov, K. Najarian, B.D. Athey // Pharmacogenomics. – 2018. – № 19 (7). – P. 629-650. DOI: 10.2217/pgs-2018-0008.

3.Leung, M.K.K. Machine learning in genomic medicine: a review of computational problems and datasets / M.K.K. Leung, A. Delong, B. Alipanahi, B.J. Frey // Proc. IEEE. – 2016. – № 104. – P. 176–197. DOI: 10.1109/JPROC.2015.2494198.

4.Angermueller, C. Deep learning for computational biology / C. Angermueller, T. Pärnamaa, L. Parts, O. Stegle // Mol. Syst. Biol. – 2016. – № 12. – P. 878. DOI: 10.15252/msb.20156651.

5.Ching, T. Opportunities and obstacles for deep learning in biology and medicine / T. Ching, D.S. Himmelstein, B.K. Beaulieu-Jones, A.A. Kalinin, B.T. Do, G.P. Way, E. Ferrero, P. Agapow, M. Zietz, M.M. Hoffman, W. Xie, G.L. Rosen, B.J. Lengerich, J. Israeli, J. Lanchantin, S. Woloszynek, A.E. Carpenter, A. Shrikumar, J. Xu, E.M. Cofer, C.A. Lavender, S.C. Turaga, A.M. Alexandari, Z. Lu, D.J. Harris, D. DeCaprio, Y. Qi, A. Kundaje, Y. Peng, L.K. Wiley, M.H.S. Segler, S.M. Boca, S.J. Swamidass, A. Huang, A. Gitter, C.S. Greene // J. R. Soc. Interface. – 2018. – № 15. – P. 20170387. DOI: 10.1098/rsif.2017.0387.

6.Esteva, A. A guide to deep learning in healthcare / A. Esteva, A. Robicquet, B. Ramsundar, V. Kuleshov, M. DePristo, K. Chou, C. Cui, G. Corrado, S. Thrun, J. Dean // Nat Med. – 2019. – № 25. – P. 24–29. DOI: 10.1038/s41591-018-0316-z.

7.Moen, E. Deep learning for cellular image analysis / E. Moen, D. Bannon, T. Kudo, W. Graf, M. Covert, D.V. Valen // Nat Methods. – 2019. – № 16. – P. 1233–1246. DOI: 10.1038/s41592-019-0403-1.

8.Fomina, T.A. Methods of molecular diagnostics for fish species identification / T.A. Fomina, V.Yu. Kornienko, M.Yu. Minaev // Food systems. – 2020. – № 3. – P. 32–41. DOI: 10.21323/2618-9771-2020-3-3-32-41.

9.Корниенко, В.Ю. Обзор мировых тенденций видовой идентификации мяса. Часть 2 / В.Ю. Корниенко, Т.А. Фомина, М.Ю. Минаев // Мясная индустрия. – 2020. – № 3. – С. 39-42. DOI: 10.37861/2618-8252-2020-3-39-42.

Korniyenko, V.Yu. Obzor mirovykh tendentsiy vidovoy identifikatsii myasa. Chast' 2 [A review of world trends in meat species identification. Part 2] / V.Yu. Korniyenko, T.A. Fomina, M.Yu. Minayev // Myasnaya industriya. – 2020. – № 3. – Р. 39-42. DOI: 10. 37861/2618-8252-2020-3-39-42.

10.Хвостов, Д.В. Применение протеаз в мясной индустрии: обзор / Д.В. Хвостов, Е.А. Коноров, М.В. Захарова, Ж.И. Ковалевская // Мясная индустрия. – 2020. – № 11. – С. 32-37.  DOI: 10.37861/2618-8252-2020-11-32-36.

Khvostov, D.V. Primeneniye proteaz v myasnoy industrii: obzor [Application of proteases in the meat industry: a review] / D.V. Khvostov, Ye.A. Konorov, M.V. Zakharova, Zh.I. Kovalevskaya // Myasnaya industriya. – 2020. – № 11. – S. 32-37. DOI: 10.37861/2618-8252-2020-11-32-36.

11.Zhou, J. Predicting effects of noncoding variants with deep learning-based sequence model / J. Zhou, O.G. Troyanskaya // Nat. Methods. – 2015. – № 12. – P. 931–934. DOI: 10.1038/nmeth.3547.

12.Quang, D. DanQ: a hybrid convolutional and recurrent deep neural network for quantifying the function of DNA sequences / D. Quang, X. Xie // Nucleic Acids Res. – 2016. – № 44. – P. 107.  DOI: 10.1093/nar/gkw226.

13.Poplin, R. A universal SNP and small-indel variant caller using deep neural networks / R. Poplin, P. Chang, D. Alexander, S. Schwartz, T. Colthurst, A. Ku, D. Newburger, J. Dijamco, N. Nguyen, P.T. Afshar, S.S. Gross, L. Dorfman, C.Y. McLean, M.A. DePristo // Nat Biotechnol. –2018. – № 36. – P. 983–987. DOI: 10.1038/nbt.4235.

14.Andrew, A.W. Improved protein structure prediction using potentials from deep learning / A.W. Senior, R. Evans, J. Jumper, J. Kirkpatrick, L. Sifre, T. Green, C. Qin, A. Žídek, A.W.R. Nelson, A. Bridgland, H. Penedones, S. Petersen, K. Simonyan, S. Crossan, P. Kohli, D.T. Jones, D. Silver, K. Kavukcuoglu, D. Hassabis // Nature. – 2020. – № 577. – P. 706–710. DOI: 10.1038/s41586-019-1923-7.

15.Avsec, Z. Modeling positional effects of regulatory sequences with spline transformations increases prediction accuracy of deep neural networks / Z. Avsec, M. Barekatain, J. Cheng, J. Gagneur // bioRxiv, 2017. DOI: 10.1101/165183.

16.Alipanahi, B. Predicting the sequence specificities of DNA- and RNA-binding proteins by deep learning / B. Alipanahi, A. Delong, M.T. Weirauch, B.J. Frey // Nat. Biotechnol. – 2015. – № 33. – P. 831–838.  DOI: 10.1038/nbt.3300.

17.Xu, Y. Deep learning for drug-induced liver injury / Y. Xu, Z. Dai, F. Chen, S. Gao, J. Pei, L. Lai // J. Chem. Inf. Model. – 2015. – № 55. – P. 2085–2093. DOI: 10.1021/acs.jcim.5b00238.

18.Kelley, D.R. Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks / D.R. Kelley, J. Snoek, J.L. Rinn // Genome Res. – 2016. – № 26. – P. 990–999. DOI: 10.1101/gr.200535.115.

19.Kelley, D.R. Sequential regulatory activity prediction across chromosomes with convolutional neural networks / D.R. Kelley, Y.A. Reshef // bioRxiv, 2017. DOI: 10.1101/161851.

20.Singh, R. DeepChrome: deep-learning for predicting gene expression from histone modifications / R. Singh, J. Lanchantin, G. Robins, Y. Qi // Bioinformatics. – 2016. – № 32. – P. 639–648. DOI: 10.1093/bioinformatics/btw427.

21.Qin, Q. Imputation for transcription factor binding predictions based on deep learning / Q. Qin, J.X. Feng //. PLoS Comput. Biol. – 2017. – №. 13. – e1005403. DOI: 10.1371/journal.pcbi.1005403.

22.Schreiber, J. Nucleotide sequence and DNaseI sensitivity are predictive of 3D chromatin architecture / J. Schreiber, M. Libbrecht, J. Bilmes, W. Noble // bioRxiv, 2017. DOI: 10.1101/103614.

23.Zeng, H. Predicting the impact of non-coding variants on DNA methylation / H. Zeng, D.K. Gifford // Nucleic Acids Res. – 2017. – № 45. – e99. DOI: 10.1093/nar/gkx177.

24.Angermueller, C. DeepCpG: accurate prediction of single-cell DNA methylation states using deep learning / C. Angermueller, H.J. Lee, W. Reik, O. Stegle // Genome Biol. – 2017. – № 18. – P. 67. DOI: 10.1186/s13059-017-1189-z.

25.Pan, X. RNA-protein binding motifs mining with a new hybrid deep learning based cross-domain knowledge integration approach / X. Pan, H.B. Shen // BMC Bioinformatics. – 2017. – № 18. – P. 136. DOI: 10.1186/s12859-017-1561-8.

26.Pan, X. Prediction of RNA-protein sequence and structure binding preferences using deep convolutional and recurrent neural networks / X. Pan, P. Rijnbeek, J. Yan, H.B. Shen // bioRxiv, 2017. DOI: 10.1101/146175.

27.Quang, D. FactorNet: a deep learning framework for predicting cell type specific transcription factor binding from nucleotide-resolution sequential data / D. Quang, X. Xie // bioRxiv, 2017. DOI: 10.1101/151274.


Контакты:

Корниенко Владимир Юрьевич
unipraim@yandex.ru
Михаил Юрьевич Минаев
m.minaev@fncps.ru

Для цитирования:

Корниенко, В.Ю. Общие сведения о машинном обучении и его применении для решения биологических задач / В.Ю. Корниенко, М.Ю. Минаев // Все о мясе. – 2021. – № 3. – С. 40-43. DOI: 10.21323/2071-2499-2021-3-40-43.

For citation:

Kornienko, V.Yu. General information about machine learning and its use for solving biological problems / V.Yu. Kornienko, M.Yu. Minaev // Vsyo o myase. – 2021. – № 3. – Р. 40-43. DOI: 10.21323/2071-2499-2021-3-40-43.





Политика конфиденциальности

Противодействие коррупции

Карта сайта

Яндекс цитирования Яндекс.Метрика