QSAR-МОДЕЛИРОВАНИЕ ИНГИБИТОРОВ РОСТА PASTEURELLA MULTOCIDA
Аннотация и ключевые слова
Аннотация (русский):
Поиск эффективных препаратов для лечения инфекционных заболеваний сельскохозяйственных животных является актуальной проблемой. В статье представлены модели антипастереллезной активности обширного массива химических соединений, построенные с использованием дескрипторов, генерируемых программой Dragon и разработанной нами компьютерной программы PROGROC. Пастереллез – инфекционная болезнь многих видов животных, вызываемая бактериями рода Pasteurella, имеет широкое географическое распространение и наносит существенный экономический ущерб животноводству. Лечение заболевших животных антибиотиками осложняется появлением форм микроорганизмов, устойчивых к ним. Для решения проблемы бактериальной резистентности к лекарственным препаратам предлагается вести поиск и отбор соединений с антипастереллезной активностью при использовании методов QSAR (Quantitative Structure-Activity Relationship). Для оценки антипастереллезной активности использован показатель lgMIC (MIC – минимальная ингибирующая концентрация вещества). Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lgMIC и стандартным отклонением s. В настоящей работе получены модели ингибирующей активности по отношению к Pasteurella multocida 362 химических соединений, отобранных на сайте ChEMBL. При моделировании были задействованы 445 дескрипторов молекулярной структуры, вычисляемых программой Dragon 7. Расчеты выполнены с помощью компьютерной программы PROGROC (PROGgram RObustness Calculation). Достигнутые значения коэффициента корреляции 0,9360–0,9549 для контрольной выборки, где представлено 55–61 % от всего набора веществ, весьма высокие. При проверке качества моделирования посредством скользящего контроля получены показатели: R = 0,9297 и s = 0,40. Сделаны расчеты для соединений, имеющих только пороговые оценки () в исходной базе. Полученные расчетные оценки lgMIC хорошо согласуются с экспериментальными, что указывает на возможность замены эксперимента менее затратными расчетами.

Ключевые слова:
Pasteurella multocida, антимикробная активность, лекарственные препараты, минимальная ингибирующая концентрация MIC, QSAR, органические вещества, дескрипторы, Dragon, корреляция, PROGROC.
Текст
Текст (PDF): Читать Скачать

Постановка проблемы (Introduction)

Пастереллез – инфекционная болезнь сельскохозяйственных, домашних и диких животных, вызываемая бактериями рода Pasteurella, из которых более изученным является этиологически значимый вид Pasteurella multocida. Заболевание проявляется явлениями геморрагической септицемии при остром течении и преимущественным поражением легких при подостром и хроническом течении. Пастереллез регистрируется во всех странах мира, в том числе во всех регионах России, и характеризуется высокой летальностью, причиняя значительный экономический ущерб животноводству [1, 2].

Весьма актуальной продолжает оставаться проблема заболевания в Казахстане, одной из причин падежа домашних и диких животных в республике признается пастереллез. В 2015 году более 200 000 сайгаков погибло за 3 недели в центральном Казахстане. Проведением международного мультидисциплинарного исследования массовой гибели сайгаков установлено, что непосредственной причиной смерти была геморрагическая септицемия, вызванная бактерией Pasteurella multocida [3].

Для лечения пастереллеза используются антибактериальные препараты, чаще всего пенициллины и цефалоспорины. Серьезной проблемой, значительно осложняющей лечение как животных, так и человека, является формирование резистентности к антибиотикам, что отмечено, в частности, при сравнении чувствительности к ним культур Pasteurella multocida, выделенных в разные годы [4]. Данные мониторинга за уровнем лекарственной устойчивости микроорганизмов при лечении респираторных заболеваний свиней, вызванных Pasteurella multocida, показали, что к гентамицину высокочувствительными оказались только 43 % изолятов пастерелл, а 29 % – резистентными. Более 30 % от всех исследуемых изолятов пастерелл оказалась резистентными к препаратам тетрациклиновой группы, котримоксазолу и триметоприму [5]. Для предотвращения развития бактериальной устойчивости к антибиотикам используют комбинированную химиотерапию, но кардинального решения проблемы данный подход не обеспечивает. Существует насущная потребность в поиске новых препаратов или химической модификации имеющихся с целью усиления их противомикробного действия.

Одним из путей преодоления лекарственной резистентности является поиск и разработка новых активных агентов. Для этих целей все шире привлекаются компьютерные технологии, которые позволяют минимизировать затраты на экспериментальные исследования, сделав разработку лекарств более рациональной и эффективной.

Наиболее популярны методы QSAR (Quantitative Structure-Activity Relationship), CoMFA (Comparative Molecular Field Analysis), CoMSIA (Comparative Molecular Similarity Indices Analysis). Эти методы устанавливают корреляции между параметрами биологической активности и структурными и пространственными характеристиками тренировочного набора молекул для последующего моделирования и прогнозирования свойства неисследованных соединений.

Методология и методы исследования (Methods)

Цель работы – исследовать возможность QSAR моделирования ингибирующей активности больших массивов химических соединений по отношению к Pasteurella multocida.

Актуальность исследования определяется тем, что, несмотря на большое число публикаций по вопросам компьютерного моделирования антимикробной активности химических соединений, данные по антипастереллезной активности в подобных исследованиях представлены незначительно.

Для характеристики антимикробной активности обычно применяются концентрация полумаксимального ингибирования IC50 и минимальная ингибирующая концентрация антибиотика MIC, угнетающая популяции бактерий in vitro. При моделировании используют логарифмическую шкалу ингибирующих молярных концентраций lgIC50, lgMIC или pIC50,  pMIC. Качество моделирования оценивается коэффициентом корреляции R или R2 между расчетными и экспериментальными значениями и стандартным отклонением s.

Приведем несколько примеров последних лет, характеризующих состояние направления. Антимикробная активность с построением моделей QSAR изучалась в отношении лямблий, сальмонелл, золотистого стафилококка и других патогенов.

Так, анализ QSAR был применен к набору данных из 37 синтезированных производных 2-амино-4-арилтиазола, активных против лямблий Giardia intestinalis [6]. Полученная модель для pIC50 имеет R2 = 0,70, s = 0,28.

Авторами [7] осуществлен синтез 26 новых конъюгатов хинолоновых и фторхинолоновых антибиотиков и моделирование их антибактериальной активности по отношению к четырем микроорганизмам. Результаты моделирования по отношению к Salmonella typhi показали R2 = 0,854 и s = 0,0004.

В работе Катрицкого и др. [8] описаны результаты синтеза и молекулярного моделирования антимикробной активности 10 новых конъюгатов фторхинолоновых антибиотиков с пиразином. Модель антисальмонеллезной активности по отношению к Salmonella typhi характеризовалась R2 = 0,831 и s = 0,179.

При исследовании взаимосвязи «структура – активность хиназолинонового фрагмента» для антибактериальной активности против Salmonella typhimurium [9] было использовано 29 производных 4(3H) – хиназолинона. Лучшие модели для CoMFA и CoMSIA имели коэффициент корреляции 0,905 и 0,868.

Моделирование активности конъюгатов хинолоновых антибиотиков с производными с 1,2,3-триазола по отношению к Staphylococcus aureus выполнено в [10]. Набор содержал 21 соединение, R2 = 0,952, s2 = 0,18. Для Salmonella typhi набор включал 22 соединения, R2 = 0,878, s2 = 0,406.

Исследована антибактериальная активность 72 производных изотиазолохинолонов по отношению к Staphylococcus aureus [11]. Полученные модели с использованием CoMFA имели R2 = 0,988, для CoMSIA R2 = 0,975. Тестовый набор молекул дал приемлемые значения прогностической корреляции R2 до 0,57.

Среди 54 гетероциклических производных пиразолина выявлены соединения с антитуберкулезный активностью в отношении Mycobacterium tuberculosis H37Rv [12]. Разработаны статистически значимые (R2 = 0.85) модели QSAR.

Получены статистически значимые модели MIC для 63 производных бензимидазола [13] по отношению к Mycobacterium tuberculosis с R2 = 0,90. Использование моделей позволило разработать 223 новых соединения, часть из них показали некоторые многообещающие результаты.

В работе [14] была исследована серия из 109 известных ингибиторов микобактериальных мембранных белков (MmpL3) Mycobacterium tuberculosis и проведен 3D-анализ QSAR. Был использован тренировочный набор из 74 молекул для получения моделей CoMFA и CoMSIA, которые были статистически достоверными, максимальное значение R2 = 0,93.

Обзор приведенных публикаций показывает, что для построения моделей антибактериальной активности используются наборы близкородственных химических соединений, в основном, небольшие по объему. В большей части моделей достигнутый показатель R (R2) был менее 0,9.

В нашей работе данные об ингибирующей активности химических веществ и их структуры в виде смайлов (smiles) получены на сайте ChEMBL [15], где аккумулируются базы данных химических соединений с лекарственно-подобными свойствами. Сайт также содержит обширную информацию о других видах биологической активности и различных способах описания структуры молекул.

Были отобраны 362 индивидуальных соединения с установленными значениями MIC и лежащие в широком диапазоне молекулярных масс 1721033. Солевые формы соединений и дублирующие записи были удалены.

Все нестандартные способы выражения концентраций приведены в наиболее часто используемую на сайте наномолярную (nM) концентрацию и прологарифмированы. Диапазон значений lgMIC – от 0,71 до 6,23.

Структура соединений была представлена в виде числовых описателей – дескрипторов молекулярной структуры, вычисляемых по смайлам с помощью компьютерной программы Dragon 7. При моделировании были задействованы 445 дескрипторов, имеющих значения отличные от нуля для всех соединений и коэффициент взаимной корреляции не более 0,99.

Для выравнивания весов различных дескрипторов осуществлялась предварительная обработка по формуле

где   – значение дескриптора с номером j для вещества i, m – количество веществ.

Расчеты выполнены с помощью разработанной нами компьютерной программы PROGROC (PROGgram RObustness Calculation), которая была успешно применена для прогнозирования некоторых параметров биологической активности, в частности токсичности органических соединений для Toxoplasma gondii [16]. Программа использует алгоритмы, позволяющие привлекать число дескрипторов, превышающее количество веществ без предварительного отбора. Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями lg MIC и стандартным отклонением s.

Результаты (Results)

Для отобранных соединений были получены модели при использовании трех вариантов разделения набора из 362 соединений на контрольную и тренировочную выборки, для каждого варианта определены статистические параметры, приведенные в таблице 1.

Таблица 1

Показатели корреляции между экспериментальными и вычисленными значениями lgMIC при различных соотношениях числа веществ в тренировочной и контрольной выборках

Число веществ

трен./контр.

R, трен.

s, трен.

R, контр.

s, контр.

142/220

0,9684

0,28

0,9360

0,42

152/210

0,9716

0,27

0,9493

0,34

162/200

0,9650

0,29

0,9549

0,34

 

Table 1

The correlation between the experimental and calculated values of lgMIC at different ratios of the number of substances in the training and control sets

Number of compounds

train./ control

R, train

s, train

R, control

s, control

142/220

0,9684

0,28

0,9360

0,42

152/210

0,9716

0,27

0,9493

0,34

162/200

0,9650

0,29

0,9549

0,34

 

Значения статистических показателей R и s указывают на высокое качество моделей, особенно с учетом того, что в контрольной выборке представлено от 55 до 61 % от всего набора веществ, тогда как при моделировании биологического отклика долю контрольной выборки определяют примерно в 20–25 %.

Для модели с соотношением объемов тренировочной и контрольной выборок 152/210 результаты прогнозирования приведены на рис. 1.

 

 

● – тренировочная выборка; × – контрольная выборка

Рис. 1 Корреляция между экспериментальными и вычисленными

значениями lgMIC по молекулярным дескрипторам

 

● – training set; × control set

Fig. 1 Correlation between the experimental and calculated

values of lgMIC by molecular descriptors

 

На рис. 2 представлена гистограмма распределения частот ошибок прогнозирования lgMIC. Симметричный вид гистограммы, приближающийся к нормальному закону распределения, может свидетельствовать о том, что исходные экспериментальные данные биологической активности отобранных веществ не содержат грубых ошибок и полученная модель адекватна.

 

Рис. 2. Гистограмма распределения частот ошибок прогнозирования lgMIC

 

 

 

 

Fig. 2. Histogram of the frequency distribution of prediction errors lgMIC

 

Одним из эффективных способов проверки валидности корреляционных моделей в QSАR-исследованиях является перекрестная проверка leave-one-out – «удаление одного из» или, «скользящий контроль». Из исследуемого набора последовательно извлекается по одному каждое вещество. Оставшиеся вещества используются для построения модели, с помощью которой проводится расчет (прогнозирование) свойства удаленного вещества. Проведенное в таком режиме прогнозирование является также и способом оценки качества и практической значимости полученных значений для свойства веществ, не имеющих экспериментально установленных данных. Хотя при этом статистические параметры моделей имеют более низкие значения R и большие стандартные отклонения s, таким образом максимально выявляются возможности метода для оценки неизвестных значений новых веществ.

Качество выполненного нами моделирования также проверялась с помощью скользящего контроля (рис. 3), в результате которого получены показатели: R = 0,9297 и s = 0,40.

Учитывая, что разброс экспериментальных данных MIC, полученных в различных лабораториях, может достигать нескольких порядков, достигнутое нами значение стандартного отклонения s = 0,40 можно считать вполне приемлемым для компьютерного скрининга неизученных веществ, а также для уточнения экспериментальных данных.

 

 

 

 

Рис. 3. Корреляция между экспериментальными и вычисленными значениями lgMIC, скользящий контроль

 

Fig. 3. Histogram of the frequency distribution of prediction errors lgMIC

 

Нами также выполнены расчеты для соединений, имеющих только пороговые оценки (<lgMIC>) в исходной базе. Сравнительные результаты расчета и экспериментальных пороговых оценок приведены в таблице 2.

 

Таблица 2

Сравнительные результаты расчета и экспериментальных пороговых оценок lgMIC

ChEMBLID

МW

Оценка lgMIC

ChEMBLID

МW

Оценка lgMIC

< [15]

Расч.

> [15]

Расч.

1

355841

685

1,07

0,52

6

327366

214

5,67

6,29

2

298584

392

2,11

1,63

7

433129

796

1,10

1,68

3

292597

375

2,12

1,73

8

33

361

1,62

1,93

4

96164

749

2,13

2,20

9

329094

209

5,68

5,81

5

431618

775

2,11

2,52

10

316697

379

5,72

5,70

Примечание: ChEMBLID – уникальный идентификатор, который назначается соединениям, мишеням, пробам, документам, тканям и типам клеток в базе [15], МW – молекулярная масса соединения.

 

Table 2

Comparative results of the calculation and experimental threshold estimates lgMIC

No.

ChEMBLID

МW

Estimate lgMIC

No.

ChEMBLID

МW

Estimate lgMIC

< [15]

Calculation

> [15]

Calculation

1

355841

685

1,07

0,52

6

327366

214

5,67

6,29

2

298584

392

2,11

1,63

7

433129

796

1,10

1,68

3

292597

375

2,12

1,73

8

33

361

1,62

1,93

4

96164

749

2,13

2,20

9

329094

209

5,68

5,81

5

431618

775

2,11

2,52

10

316697

379

5,72

5,70

Note: ChEMBLID is a unique identifier assigned to compounds, targets, samples, documents, tissues and cell types in the database [15], MW is the molecular weight of the compound.

 

Среди соединений в таблице присутствуют антибиотики (1, 8), аналоги макролидных антибиотиков (4, 5), производные различных классов.

Можно видеть, что расчетные оценки lgMIC хорошо согласуются с экспериментальными, это означает, что эксперимент мог быть в таких случаях заменен несопоставимо менее затратными расчетами.

Оценивая результаты нашего исследования в сравнении с данными других авторов, следует иметь в виду, что в публикациях [6–14] приведены результаты моделирования антимикробной активности небольших (до нескольких десятков) по объему наборов производных одного какого-либо класса химических соединений, имеющих близкие молекулярные структуры. В среднем модели обладали R (R2) менее 0,9 и s достигающим 0,55, а применимость моделей на гомогенных наборах веществ для прогнозирования ограничена кругом соединений, подобных использованным.

Данное исследование отличается от приведенных выше значительно большим числом веществ и гетерогенностью набора, что позволяет расширить круг соединений – претендентов на роль лекарств. Полученные при этом высокие значения коэффициента корреляции и приемлемые значения стандартного отклонения свидетельствуют об удачном выборе дескрипторов и алгоритма вычислений для моделирования антипастереллезной активности органических соединений.

Обсуждение и выводы (Discussion and Conclusion)

1. Подобраны 362 органических соединения, обладающие установленной противомикробной активностью по отношению к Pasteurella multocida. Набор может быть использован в дальнейших исследованиях по QSAR моделированию и прогнозированию новых лекарственных препаратов.

2. Использование большого набора дескрипторов, генерируемых программой Dragon, и расчетов антипастереллезной активности с помощью программы PROGROC, позволяет прогнозировать и моделировать MIC с высокими и статистическим значимыми параметрами. Таким образом, созданы предпосылки для виртуального скрининга новых антимикробных препаратов.

3. Показано хорошее согласие выполненных расчетных оценок и приблизительных (пороговых) экспериментальных значений MIC.

Список литературы

1. Лаишевцев А. И. Пастереллез сельскохозяйственных животных: современная эпизоотическая ситуации на территории Российской Федерации // Биотика. 2016. № 2 (9). С. 41-46.

2. Полковниченко А. П., Полковниченко П. А., Воробьев Д. В., Воробьев В. И. Особенности биологических свойств культур Р. multocida, выделенных от животных в условиях Астраханской области // Ученые записки Казанской государственной академии ветеринарной медицины им. Н. Э. Баумана. 2017. Т. 3. С. 112-115.

3. Kock R. A., Orynbayev M., Robinson S., Zuther S. [et al.] Saigas on the brink: Multidisciplinary analysis of the factors influencing mass mortality events [Электронный ресурс] // Science Advances. 2018. Vol. 4. No. 1. URL: https://advances.sciencemag.org/content /4/1/eaao2314.

4. Лаишевцев А. И., Капустин А. В., Гулюкин А. М. Сравнительный анализ антибиотикочувствительности коллекционных штаммов Pasteurella multocida, выделенных в период до 1990 г., с полевыми изолятами, выделенными в течение 2014-2016 гг. от крупного и мелкого рогатого скота на территории Российской Федерации // Труды Кубанского государственного аграрного университета. 2016. № 63. С. 132-138.

5. О результатах мониторинга ФГБУ «ВНИИЗЖ» антибиотикорезистентности возбудителей респираторных болезней свиней [Электронный ресурс] // Новости Россельхознадзора. 2015. 4 сентября. URL: http://www.fsvps.ru/fsvps/print/news/14947.html.

6. Mocelo-Castell R., Villanueva-Novelo C., Cáceres-Castillo D., Carballo R. M. [et al.] 2-Amino-4-arylthiazole Derivatives as Anti-giardial Agents: Synthesis, Biological Evaluation and QSAR Studies Quantitative Structure - Activity Relationship // Open Chem. 2015. No. 13. Pp. 1127-1136.

7. Panda S. S., Liaqat S., Girgis A. S., Samir A., Hall C. D., Katritzky A. R. Novel antibacterial active quinolone-fluoroquinolone conjugates and 2D-QSAR studies // Bioorganic & Medicinal Chemistry Letters 2015. No. 25. Pp. 3816-3821.

8. Panda S. S., Detistov O. S., Girgis A. S., Mohapatra P. P., Samir A., Katritzky A. R. Synthesis and molecular modeling of antimicrobial active fluoroquinolone-pyrazine conjugates with amino acid linkers // Bioorganic & Medicinal Chemistry Letters 2016. No. 26. Pp. 2198-2205.

9. Dixit R., Soni L. K., Sharma R. CoMFA and CoMSIA Studies on 6, 8-Dibromo-4(3H)-Quinazolinone Derivatives for Anti-Bacterial Activity against Salmonella typhimurium // Journal of Drug Discovery and Therapeutics. 2017. No. (7). Pp. 93-96.

10. Faidallah H., Girgis A., Tiwari A., Honkanadavar H. [et al.] Synthesis, antibacterial properties and 2D-QSAR studies of quinolone-triazole conjugates // European Journal of Medicinal Chemistry 2018. No. 143. Pp. 1524-1534.

11. Ballu S., Itteboina R., Sivan S. K., Manga V. Rational design of methicillin resistance Staphylococcus aureus inhibitors through 3D-QSAR, molecular docking and molecular dynamics simulations // Computational Biology and Chemistry. 2018. No. 73. Pp. 95-104.

12. Hemal M. S., Popatbhai K. P., Mahesh T. C. [et al.] 2D-QSAR Study of a Series of Pyrazoline-Based Anti-Tubercular Agents Using Genetic Function Approximation // Journal of Computational Chemistry. 2015. Vol. 3. No. 4. Pp. 45-53.

13. Ahamad S., Islam A., Ahmad F., Dwivedi N., Hassan M. I. 2/3D-QSAR, molecular docking and MD simulation studies of FtsZ protein targeting benzimidazoles derivatives // Computational Biology and Chemistry. 2019. Vol. 78. Pp. 398-413.

14. Munnaluri R., Reddy Peddi S., Kanth Sivan S., Manga V. Computational studies on N-phenyl pyrrole derivatives as MmpL3 inhibitors in Mycobacterium tuberculosis // Computational Biology and Chemistry. 2019. No. 78. Pp. 81-94.

15. ChEMBL. European Molecular Biology Laboratory [Electronic resource]. URL: https://www.ebi.ac.uk/chembl.

16. Важев В. В., Мунарбаева Б. Г., Важева Н. В., Губенко М. А., Ергалиева Э. М. Моделирование антитоксоплазмоидной активности органических соединений методом QSAR // Аграрный вестник Урала. 2018. № 07 174). С. 4-10.

Войти или Создать
* Забыли пароль?