
Исследователи из научно-исследовательского вычислительного центра и химического факультета МГУ в рамках Научно-образовательной школы «Мозг, когнитивные системы и искусственный интеллект» представили NanoporeInspect. Этот интерактивный веб-сервис служит для точной оценки качества лигирования в данных нанопорового секвенирования, обеспечивая надежный контроль над процессом.
Преимущества нанопорового секвенирования
Нанопоровое секвенирование уверенно зарекомендовало себя как высокоперспективный метод анализа ДНК и РНК. Ключевое его достоинство — способность считывать молекулы огромной длины, включая модифицированные основания. Эта особенность особенно востребована, например, при идентификации аптамеров — коротких молекул, избирательно связывающихся с мишенями и широко используемых в диагностике и биомедицине.
Узкий аспект: качество лигирования
Однако технология требует кропотливой подготовки образцов. Для успеха эксперимента к исследуемым молекулам ДНК или РНК добавляют искусственные последовательности (адаптеры, праймеры, баркоды). Они выступают служебными метками, помогая идентифицировать и различать образцы. Некорректное их присоединение резко снижает качество данных: возникает «шум» в библиотеке, и часть важной информации теряется.
Долгое время аналитики работали без детального контроля этой стадии: существовавшие инструменты не позволяли досконально проверить корректность лигирования служебных последовательностей. Разработка ученых из МГУ в корне меняет ситуацию.
Как работает NanoporeInspect
«NanoporeInspect дает возможность задать нужные искусственные последовательности и визуализировать их распределение по прочитанным фрагментам», — поясняет ведущий специалист лаборатории математического моделирования НИВЦ МГУ Мария Григорьева. — Ошибки в прикреплении адаптеров, баркодов, их недостаточная представленность сразу становятся очевидны благодаря интерактивным графикам».
Сервис, написанный на Python, работает через веб-интерфейс. Пользователь загружает файл с данными нанопорового секвенирования и указывает искусственные последовательности. Специальные алгоритмы NanoporeInspect определяют позиции их вхождения в каждую длинную цепочку входного файла. На основе этих позиций строятся наглядные графики распределения.
Наглядность и мощность анализа
Для визуализации выбран Plotly, что делает графики интерактивными: легко увеличить любой фрагмент. Для обработки больших данных применяется система асинхронных задач (Celery, Redis), эффективно обрабатывающая нагрузки в фоне без простоев сервера. Сервис также предлагает гибкие методики сглаживания для анализа зашумленных данных или неравномерных распределений.
«Исследователь видит не просто цифры, а понятные диаграммы: положение адаптеров, распределение баркодов, отсутствующие последовательности», — подчеркивает соавтор работы, профессор химического факультета МГУ Мария Зверева.
Приложение интеллектуально находит пики вхождения искусственных последовательностей, предоставляя данные и в табличном виде.
Возможности для исследователей
NanoporeInspect открывает новые горизонты для контроля и оптимизации экспериментов. Его ключевые задачи:
• Доскональный контроль лигирования – выявление дефектов присоединения адаптеров и праймеров.
• Поиск систематических ошибок (например, остаточных адаптеров).
• Оптимизация протоколов – рекомендации по улучшению качества данных и повышению надежности экспериментов.
Особенно ценен инструмент для SELEX-экспериментов, где многократный отбор ищет оптимальные аптамеры. Точность здесь критична: единственная ошибка при подготовке библиотеки может привести к утрате уникальной последовательности.
Таким образом, новаторский инструмент позволяет «увидеть» качество библиотеки *до* начала сложного анализа биологического содержимого, что часто критически важно, ведь фундаментом достоверного результата всегда служит высокое качество исходных данных.
Источник: scientificrussia.ru





