Россия
Россия
Россия
Россия
Поиск эффективных препаратов для лечения инфекционных заболеваний сельскохозяйственных животных является актуальной проблемой. В статье представлены модели антипастереллезной активности обширного массива химических соединений, построенные с использованием дескрипторов, генерируемых программой Dragon и разработанной нами компьютерной программы PROGROC. Пастереллез – инфекционная болезнь многих видов животных, вызываемая бактериями рода Pasteurella, имеет широкое географическое распространение и наносит существенный экономический ущерб животноводству. Лечение заболевших животных антибиотиками осложняется появлением форм микроорганизмов, устойчивых к ним. Для решения проблемы бактериальной резистентности к лекарственным препаратам предлагается вести поиск и отбор соединений с антипастереллезной активностью при использовании методов QSAR (Quantitative Structure-Activity Relationship). Для оценки антипастереллезной активности использован показатель lgMIC (MIC – минимальная ингибирующая концентрация вещества). Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lgMIC и стандартным отклонением s. В настоящей работе получены модели ингибирующей активности по отношению к Pasteurella multocida 362 химических соединений, отобранных на сайте ChEMBL. При моделировании были задействованы 445 дескрипторов молекулярной структуры, вычисляемых программой Dragon 7. Расчеты выполнены с помощью компьютерной программы PROGROC (PROGgram RObustness Calculation). Достигнутые значения коэффициента корреляции 0,9360–0,9549 для контрольной выборки, где представлено 55–61 % от всего набора веществ, весьма высокие. При проверке качества моделирования посредством скользящего контроля получены показатели: R = 0,9297 и s = 0,40. Сделаны расчеты для соединений, имеющих только пороговые оценки (
Pasteurella multocida, антимикробная активность, лекарственные препараты, минимальная ингибирующая концентрация MIC, QSAR, органические вещества, дескрипторы, Dragon, корреляция, PROGROC.
Постановка проблемы (Introduction)
Пастереллез – инфекционная болезнь сельскохозяйственных, домашних и диких животных, вызываемая бактериями рода Pasteurella, из которых более изученным является этиологически значимый вид Pasteurella multocida. Заболевание проявляется явлениями геморрагической септицемии при остром течении и преимущественным поражением легких при подостром и хроническом течении. Пастереллез регистрируется во всех странах мира, в том числе во всех регионах России, и характеризуется высокой летальностью, причиняя значительный экономический ущерб животноводству [1, 2].
Весьма актуальной продолжает оставаться проблема заболевания в Казахстане, одной из причин падежа домашних и диких животных в республике признается пастереллез. В 2015 году более 200 000 сайгаков погибло за 3 недели в центральном Казахстане. Проведением международного мультидисциплинарного исследования массовой гибели сайгаков установлено, что непосредственной причиной смерти была геморрагическая септицемия, вызванная бактерией Pasteurella multocida [3].
Для лечения пастереллеза используются антибактериальные препараты, чаще всего пенициллины и цефалоспорины. Серьезной проблемой, значительно осложняющей лечение как животных, так и человека, является формирование резистентности к антибиотикам, что отмечено, в частности, при сравнении чувствительности к ним культур Pasteurella multocida, выделенных в разные годы [4]. Данные мониторинга за уровнем лекарственной устойчивости микроорганизмов при лечении респираторных заболеваний свиней, вызванных Pasteurella multocida, показали, что к гентамицину высокочувствительными оказались только 43 % изолятов пастерелл, а 29 % – резистентными. Более 30 % от всех исследуемых изолятов пастерелл оказалась резистентными к препаратам тетрациклиновой группы, котримоксазолу и триметоприму [5]. Для предотвращения развития бактериальной устойчивости к антибиотикам используют комбинированную химиотерапию, но кардинального решения проблемы данный подход не обеспечивает. Существует насущная потребность в поиске новых препаратов или химической модификации имеющихся с целью усиления их противомикробного действия.
Одним из путей преодоления лекарственной резистентности является поиск и разработка новых активных агентов. Для этих целей все шире привлекаются компьютерные технологии, которые позволяют минимизировать затраты на экспериментальные исследования, сделав разработку лекарств более рациональной и эффективной.
Наиболее популярны методы QSAR (Quantitative Structure-Activity Relationship), CoMFA (Comparative Molecular Field Analysis), CoMSIA (Comparative Molecular Similarity Indices Analysis). Эти методы устанавливают корреляции между параметрами биологической активности и структурными и пространственными характеристиками тренировочного набора молекул для последующего моделирования и прогнозирования свойства неисследованных соединений.
Методология и методы исследования (Methods)
Цель работы – исследовать возможность QSAR моделирования ингибирующей активности больших массивов химических соединений по отношению к Pasteurella multocida.
Актуальность исследования определяется тем, что, несмотря на большое число публикаций по вопросам компьютерного моделирования антимикробной активности химических соединений, данные по антипастереллезной активности в подобных исследованиях представлены незначительно.
Для характеристики антимикробной активности обычно применяются концентрация полумаксимального ингибирования IC50 и минимальная ингибирующая концентрация антибиотика MIC, угнетающая популяции бактерий in vitro. При моделировании используют логарифмическую шкалу ингибирующих молярных концентраций lgIC50, lgMIC или pIC50, pMIC. Качество моделирования оценивается коэффициентом корреляции R или R2 между расчетными и экспериментальными значениями и стандартным отклонением s.
Приведем несколько примеров последних лет, характеризующих состояние направления. Антимикробная активность с построением моделей QSAR изучалась в отношении лямблий, сальмонелл, золотистого стафилококка и других патогенов.
Так, анализ QSAR был применен к набору данных из 37 синтезированных производных 2-амино-4-арилтиазола, активных против лямблий Giardia intestinalis [6]. Полученная модель для pIC50 имеет R2 = 0,70, s = 0,28.
Авторами [7] осуществлен синтез 26 новых конъюгатов хинолоновых и фторхинолоновых антибиотиков и моделирование их антибактериальной активности по отношению к четырем микроорганизмам. Результаты моделирования по отношению к Salmonella typhi показали R2 = 0,854 и s = 0,0004.
В работе Катрицкого и др. [8] описаны результаты синтеза и молекулярного моделирования антимикробной активности 10 новых конъюгатов фторхинолоновых антибиотиков с пиразином. Модель антисальмонеллезной активности по отношению к Salmonella typhi характеризовалась R2 = 0,831 и s = 0,179.
При исследовании взаимосвязи «структура – активность хиназолинонового фрагмента» для антибактериальной активности против Salmonella typhimurium [9] было использовано 29 производных 4(3H) – хиназолинона. Лучшие модели для CoMFA и CoMSIA имели коэффициент корреляции 0,905 и 0,868.
Моделирование активности конъюгатов хинолоновых антибиотиков с производными с 1,2,3-триазола по отношению к Staphylococcus aureus выполнено в [10]. Набор содержал 21 соединение, R2 = 0,952, s2 = 0,18. Для Salmonella typhi набор включал 22 соединения, R2 = 0,878, s2 = 0,406.
Исследована антибактериальная активность 72 производных изотиазолохинолонов по отношению к Staphylococcus aureus [11]. Полученные модели с использованием CoMFA имели R2 = 0,988, для CoMSIA R2 = 0,975. Тестовый набор молекул дал приемлемые значения прогностической корреляции R2 до 0,57.
Среди 54 гетероциклических производных пиразолина выявлены соединения с антитуберкулезный активностью в отношении Mycobacterium tuberculosis H37Rv [12]. Разработаны статистически значимые (R2 = 0.85) модели QSAR.
Получены статистически значимые модели MIC для 63 производных бензимидазола [13] по отношению к Mycobacterium tuberculosis с R2 = 0,90. Использование моделей позволило разработать 223 новых соединения, часть из них показали некоторые многообещающие результаты.
В работе [14] была исследована серия из 109 известных ингибиторов микобактериальных мембранных белков (MmpL3) Mycobacterium tuberculosis и проведен 3D-анализ QSAR. Был использован тренировочный набор из 74 молекул для получения моделей CoMFA и CoMSIA, которые были статистически достоверными, максимальное значение R2 = 0,93.
Обзор приведенных публикаций показывает, что для построения моделей антибактериальной активности используются наборы близкородственных химических соединений, в основном, небольшие по объему. В большей части моделей достигнутый показатель R (R2) был менее 0,9.
В нашей работе данные об ингибирующей активности химических веществ и их структуры в виде смайлов (smiles) получены на сайте ChEMBL [15], где аккумулируются базы данных химических соединений с лекарственно-подобными свойствами. Сайт также содержит обширную информацию о других видах биологической активности и различных способах описания структуры молекул.
Были отобраны 362 индивидуальных соединения с установленными значениями MIC и лежащие в широком диапазоне молекулярных масс 172–1033. Солевые формы соединений и дублирующие записи были удалены.
Все нестандартные способы выражения концентраций приведены в наиболее часто используемую на сайте наномолярную (nM) концентрацию и прологарифмированы. Диапазон значений lgMIC – от 0,71 до 6,23.
Структура соединений была представлена в виде числовых описателей – дескрипторов молекулярной структуры, вычисляемых по смайлам с помощью компьютерной программы Dragon 7. При моделировании были задействованы 445 дескрипторов, имеющих значения отличные от нуля для всех соединений и коэффициент взаимной корреляции не более 0,99.
Для выравнивания весов различных дескрипторов осуществлялась предварительная обработка по формуле
где – значение дескриптора с номером j для вещества i, m – количество веществ.
Расчеты выполнены с помощью разработанной нами компьютерной программы PROGROC (PROGgram RObustness Calculation), которая была успешно применена для прогнозирования некоторых параметров биологической активности, в частности токсичности органических соединений для Toxoplasma gondii [16]. Программа использует алгоритмы, позволяющие привлекать число дескрипторов, превышающее количество веществ без предварительного отбора. Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lg MIC и стандартным отклонением s.
Результаты (Results)
Для отобранных соединений были получены модели при использовании трех вариантов разделения набора из 362 соединений на контрольную и тренировочную выборки, для каждого варианта определены статистические параметры, приведенные в таблице 1.
Таблица 1
Показатели корреляции между экспериментальными и вычисленными значениями lgMIC при различных соотношениях числа веществ в тренировочной и контрольной выборках
Число веществ трен./контр. |
R, трен. |
s, трен. |
R, контр. |
s, контр. |
142/220 |
0,9684 |
0,28 |
0,9360 |
0,42 |
152/210 |
0,9716 |
0,27 |
0,9493 |
0,34 |
162/200 |
0,9650 |
0,29 |
0,9549 |
0,34 |
Table 1
The correlation between the experimental and calculated values of lgMIC at different ratios of the number of substances in the training and control sets
Number of compounds train./ control |
R, train |
s, train |
R, control |
s, control |
142/220 |
0,9684 |
0,28 |
0,9360 |
0,42 |
152/210 |
0,9716 |
0,27 |
0,9493 |
0,34 |
162/200 |
0,9650 |
0,29 |
0,9549 |
0,34 |
Значения статистических показателей R и s указывают на высокое качество моделей, особенно с учетом того, что в контрольной выборке представлено от 55 до 61 % от всего набора веществ, тогда как при моделировании биологического отклика долю контрольной выборки определяют примерно в 20–25 %.
Для модели с соотношением объемов тренировочной и контрольной выборок 152/210 результаты прогнозирования приведены на рис. 1.
● – тренировочная выборка; × – контрольная выборка
Рис. 1 Корреляция между экспериментальными и вычисленными
значениями lgMIC по молекулярным дескрипторам
● – training set; × – control set
Fig. 1 Correlation between the experimental and calculated
values of lgMIC by molecular descriptors
На рис. 2 представлена гистограмма распределения частот ошибок прогнозирования lgMIC. Симметричный вид гистограммы, приближающийся к нормальному закону распределения, может свидетельствовать о том, что исходные экспериментальные данные биологической активности отобранных веществ не содержат грубых ошибок и полученная модель адекватна.
Рис. 2. Гистограмма распределения частот ошибок прогнозирования lgMIC
Fig. 2. Histogram of the frequency distribution of prediction errors lgMIC
Одним из эффективных способов проверки валидности корреляционных моделей в QSАR-исследованиях является перекрестная проверка leave-one-out – «удаление одного из» или, «скользящий контроль». Из исследуемого набора последовательно извлекается по одному каждое вещество. Оставшиеся вещества используются для построения модели, с помощью которой проводится расчет (прогнозирование) свойства удаленного вещества. Проведенное в таком режиме прогнозирование является также и способом оценки качества и практической значимости полученных значений для свойства веществ, не имеющих экспериментально установленных данных. Хотя при этом статистические параметры моделей имеют более низкие значения R и большие стандартные отклонения s, таким образом максимально выявляются возможности метода для оценки неизвестных значений новых веществ.
Качество выполненного нами моделирования также проверялась с помощью скользящего контроля (рис. 3), в результате которого получены показатели: R = 0,9297 и s = 0,40.
Учитывая, что разброс экспериментальных данных MIC, полученных в различных лабораториях, может достигать нескольких порядков, достигнутое нами значение стандартного отклонения s = 0,40 можно считать вполне приемлемым для компьютерного скрининга неизученных веществ, а также для уточнения экспериментальных данных.
Рис. 3. Корреляция между экспериментальными и вычисленными значениями lgMIC, скользящий контроль
Fig. 3. Histogram of the frequency distribution of prediction errors lgMIC
Нами также выполнены расчеты для соединений, имеющих только пороговые оценки (<lgMIC>) в исходной базе. Сравнительные результаты расчета и экспериментальных пороговых оценок приведены в таблице 2.
Таблица 2
Сравнительные результаты расчета и экспериментальных пороговых оценок lgMIC
№ |
ChEMBLID |
МW |
Оценка lgMIC |
№ |
ChEMBLID |
МW |
Оценка lgMIC |
||
< [15] |
Расч. |
> [15] |
Расч. |
||||||
1 |
355841 |
685 |
1,07 |
0,52 |
6 |
327366 |
214 |
5,67 |
6,29 |
2 |
298584 |
392 |
2,11 |
1,63 |
7 |
433129 |
796 |
1,10 |
1,68 |
3 |
292597 |
375 |
2,12 |
1,73 |
8 |
33 |
361 |
1,62 |
1,93 |
4 |
96164 |
749 |
2,13 |
2,20 |
9 |
329094 |
209 |
5,68 |
5,81 |
5 |
431618 |
775 |
2,11 |
2,52 |
10 |
316697 |
379 |
5,72 |
5,70 |
Примечание: ChEMBLID – уникальный идентификатор, который назначается соединениям, мишеням, пробам, документам, тканям и типам клеток в базе [15], МW – молекулярная масса соединения.
Table 2
Comparative results of the calculation and experimental threshold estimates lgMIC
No. |
ChEMBLID |
МW |
Estimate lgMIC |
No. |
ChEMBLID |
МW |
Estimate lgMIC |
||
< [15] |
Calculation |
> [15] |
Calculation |
||||||
1 |
355841 |
685 |
1,07 |
0,52 |
6 |
327366 |
214 |
5,67 |
6,29 |
2 |
298584 |
392 |
2,11 |
1,63 |
7 |
433129 |
796 |
1,10 |
1,68 |
3 |
292597 |
375 |
2,12 |
1,73 |
8 |
33 |
361 |
1,62 |
1,93 |
4 |
96164 |
749 |
2,13 |
2,20 |
9 |
329094 |
209 |
5,68 |
5,81 |
5 |
431618 |
775 |
2,11 |
2,52 |
10 |
316697 |
379 |
5,72 |
5,70 |
Note: ChEMBLID is a unique identifier assigned to compounds, targets, samples, documents, tissues and cell types in the database [15], MW is the molecular weight of the compound.
Среди соединений в таблице присутствуют антибиотики (1, 8), аналоги макролидных антибиотиков (4, 5), производные различных классов.
Можно видеть, что расчетные оценки lgMIC хорошо согласуются с экспериментальными, это означает, что эксперимент мог быть в таких случаях заменен несопоставимо менее затратными расчетами.
Оценивая результаты нашего исследования в сравнении с данными других авторов, следует иметь в виду, что в публикациях [6–14] приведены результаты моделирования антимикробной активности небольших (до нескольких десятков) по объему наборов производных одного какого-либо класса химических соединений, имеющих близкие молекулярные структуры. В среднем модели обладали R (R2) менее 0,9 и s достигающим 0,55, а применимость моделей на гомогенных наборах веществ для прогнозирования ограничена кругом соединений, подобных использованным.
Данное исследование отличается от приведенных выше значительно большим числом веществ и гетерогенностью набора, что позволяет расширить круг соединений – претендентов на роль лекарств. Полученные при этом высокие значения коэффициента корреляции и приемлемые значения стандартного отклонения свидетельствуют об удачном выборе дескрипторов и алгоритма вычислений для моделирования антипастереллезной активности органических соединений.
Обсуждение и выводы (Discussion and Conclusion)
1. Подобраны 362 органических соединения, обладающие установленной противомикробной активностью по отношению к Pasteurella multocida. Набор может быть использован в дальнейших исследованиях по QSAR моделированию и прогнозированию новых лекарственных препаратов.
2. Использование большого набора дескрипторов, генерируемых программой Dragon, и расчетов антипастереллезной активности с помощью программы PROGROC, позволяет прогнозировать и моделировать MIC с высокими и статистическим значимыми параметрами. Таким образом, созданы предпосылки для виртуального скрининга новых антимикробных препаратов.
3. Показано хорошее согласие выполненных расчетных оценок и приблизительных (пороговых) экспериментальных значений MIC.
1. Лаишевцев А. И. Пастереллез сельскохозяйственных животных: современная эпизоотическая ситуации на территории Российской Федерации // Биотика. 2016. № 2 (9). С. 41-46.
2. Полковниченко А. П., Полковниченко П. А., Воробьев Д. В., Воробьев В. И. Особенности биологических свойств культур Р. multocida, выделенных от животных в условиях Астраханской области // Ученые записки Казанской государственной академии ветеринарной медицины им. Н. Э. Баумана. 2017. Т. 3. С. 112-115.
3. Kock R. A., Orynbayev M., Robinson S., Zuther S. [et al.] Saigas on the brink: Multidisciplinary analysis of the factors influencing mass mortality events [Электронный ресурс] // Science Advances. 2018. Vol. 4. No. 1. URL: https://advances.sciencemag.org/content /4/1/eaao2314.
4. Лаишевцев А. И., Капустин А. В., Гулюкин А. М. Сравнительный анализ антибиотикочувствительности коллекционных штаммов Pasteurella multocida, выделенных в период до 1990 г., с полевыми изолятами, выделенными в течение 2014-2016 гг. от крупного и мелкого рогатого скота на территории Российской Федерации // Труды Кубанского государственного аграрного университета. 2016. № 63. С. 132-138.
5. О результатах мониторинга ФГБУ «ВНИИЗЖ» антибиотикорезистентности возбудителей респираторных болезней свиней [Электронный ресурс] // Новости Россельхознадзора. 2015. 4 сентября. URL: http://www.fsvps.ru/fsvps/print/news/14947.html.
6. Mocelo-Castell R., Villanueva-Novelo C., Cáceres-Castillo D., Carballo R. M. [et al.] 2-Amino-4-arylthiazole Derivatives as Anti-giardial Agents: Synthesis, Biological Evaluation and QSAR Studies Quantitative Structure - Activity Relationship // Open Chem. 2015. No. 13. Pp. 1127-1136.
7. Panda S. S., Liaqat S., Girgis A. S., Samir A., Hall C. D., Katritzky A. R. Novel antibacterial active quinolone-fluoroquinolone conjugates and 2D-QSAR studies // Bioorganic & Medicinal Chemistry Letters 2015. No. 25. Pp. 3816-3821.
8. Panda S. S., Detistov O. S., Girgis A. S., Mohapatra P. P., Samir A., Katritzky A. R. Synthesis and molecular modeling of antimicrobial active fluoroquinolone-pyrazine conjugates with amino acid linkers // Bioorganic & Medicinal Chemistry Letters 2016. No. 26. Pp. 2198-2205.
9. Dixit R., Soni L. K., Sharma R. CoMFA and CoMSIA Studies on 6, 8-Dibromo-4(3H)-Quinazolinone Derivatives for Anti-Bacterial Activity against Salmonella typhimurium // Journal of Drug Discovery and Therapeutics. 2017. No. (7). Pp. 93-96.
10. Faidallah H., Girgis A., Tiwari A., Honkanadavar H. [et al.] Synthesis, antibacterial properties and 2D-QSAR studies of quinolone-triazole conjugates // European Journal of Medicinal Chemistry 2018. No. 143. Pp. 1524-1534.
11. Ballu S., Itteboina R., Sivan S. K., Manga V. Rational design of methicillin resistance Staphylococcus aureus inhibitors through 3D-QSAR, molecular docking and molecular dynamics simulations // Computational Biology and Chemistry. 2018. No. 73. Pp. 95-104.
12. Hemal M. S., Popatbhai K. P., Mahesh T. C. [et al.] 2D-QSAR Study of a Series of Pyrazoline-Based Anti-Tubercular Agents Using Genetic Function Approximation // Journal of Computational Chemistry. 2015. Vol. 3. No. 4. Pp. 45-53.
13. Ahamad S., Islam A., Ahmad F., Dwivedi N., Hassan M. I. 2/3D-QSAR, molecular docking and MD simulation studies of FtsZ protein targeting benzimidazoles derivatives // Computational Biology and Chemistry. 2019. Vol. 78. Pp. 398-413.
14. Munnaluri R., Reddy Peddi S., Kanth Sivan S., Manga V. Computational studies on N-phenyl pyrrole derivatives as MmpL3 inhibitors in Mycobacterium tuberculosis // Computational Biology and Chemistry. 2019. No. 78. Pp. 81-94.
15. ChEMBL. European Molecular Biology Laboratory [Electronic resource]. URL: https://www.ebi.ac.uk/chembl.
16. Важев В. В., Мунарбаева Б. Г., Важева Н. В., Губенко М. А., Ергалиева Э. М. Моделирование антитоксоплазмоидной активности органических соединений методом QSAR // Аграрный вестник Урала. 2018. № 07 174). С. 4-10.