Часть 1: Обзор, основные компоненты и начало работы

Это основные моменты, которые помогут вам понять структуру программного обеспечения NIST и начать с ним работать.

1. Основные программные компоненты

Программный пакет NIST состоит из нескольких ключевых утилит:

  • NIST MS Search Program (NISTMS.EXE): Основная программа для поиска по масс-спектральным библиотекам. Она имеет графический интерфейс и множество настроек.
  • Lib2NIST: Утилита командной строки, предназначенная для конвертации и создания библиотек. В основном используется продвинутыми пользователями для пакетной обработки.
  • AMDIS (Automated Mass Spectral Deconvolution & Identification System): Утилита для деконволюции и идентификации компонентов в сложных хроматографических данных (GC/MS, LC/MS). Особенно полезна, когда пики перекрываются.
  • MS Interpreter: Инструмент для анализа масс-спектров, который помогает соотнести пики с возможными структурными фрагментами молекулы.

2. Ключевые библиотеки (Libraries)

NIST поставляется с набором эталонных библиотек. Важно понимать их назначение:

  • mainlib: Основная библиотека масс-спектров электронной ионизации (EI).
  • replib: Библиотека реплик (повторных измерений) спектров из mainlib. Полезна для оценки воспроизводимости и надежности совпадения.
  • hr_msms_nist: Библиотека тандемных масс-спектров (MS/MS) высокого разрешения (accurate mass).
  • lr_msms_nist: Библиотека тандемных масс-спектров низкого разрешения.
  • apci_msms_nist: Специализированная библиотека тандемных спектров, полученных методом химической ионизации при атмосферном давлении (APCI), часто для "extractables and leachables".
  • nist_ri: База данных индексов удерживания (Retention Index) для газовой хроматографии.

3. Начало работы и конфигурация (NIST MS Search v.3.0)

  • Выбор типа спектра (Select Spectrum Type): Это первое, что нужно сделать. В версии 3.0 это ключевая функция, которая адаптирует интерфейс.
    • EI: Для спектров электронной ионизации.
    • Tandem: Для тандемных спектров (MS/MS).
    • Peptide: Для пептидных спектров.
    • All: Показывает все возможные опции для всех типов спектров.
  • Сохранение конфигурации: Все ваши настройки (шрифты, расположение окон, выбранные библиотеки, параметры поиска) можно сохранить в .INI файл через меню File -> Save Configuration.
    • NIST предоставляет преднастроенные файлы, например, settings_EI.INI и settings_MSMS.INI.
    • Это крайне удобно для быстрого переключения между разными типами анализа.
  • Настройка внешнего вида:
    • Вы можете изменять шрифты, цвета, ширину колонок и расположение окон.
    • Чтобы применить шрифт ко всем окнам на вкладке, используйте кнопку Set for all views в свойствах (Properties).
    • Расположение окон можно менять, перетаскивая разделители, или через меню View -> Change Splitter Orientation.

4. Импорт данных (Как загрузить спектр в программу)

Это самый первый вопрос, который возникает у пользователей.

  • Прямая отправка из ПО производителя: Если у вас установлено ПО от Agilent (ChemStation, MassHunter) или Thermo Fisher (Xcalibur, FreeStyle), вы можете отправлять спектры напрямую в NIST MS Search.
  • Импорт из файлов: Программа поддерживает импорт из множества форматов, включая:
    • *.MSP (стандартный текстовый формат NIST)
    • *.JDX (JCAMP-DX)
    • *.SDF, *.MOL (файлы структур)
    • mzXML, mzData и другие.
  • Через AMDIS: AMDIS может читать "сырые" файлы данных многих производителей, деконволюировать их и отправлять чистые спектры в MS Search.

Важно: По умолчанию NIST MS Search настроен на автоматический поиск (Automatic Search On) каждого импортированного спектра. Эту опцию можно отключить в настройках Library Search Options -> Automation.

Часть 2: Поиск по библиотекам и интерпретация результатов

После того как спектр загружен, следующий шаг — выполнить поиск и правильно понять его результаты.

1. Основные типы поиска

NIST предлагает несколько подходов к поиску, доступных на разных вкладках.

  • Lib. Search (Поиск по библиотеке): Это основной вид поиска, где ваш неизвестный спектр сравнивается со спектрами в выбранных библиотеках.

    • Identity Search (Поиск на идентичность): Используется, когда вы предполагаете, что точное совпадение для вашего соединения есть в библиотеке. Это поиск "один в один".
    • Similarity Search (Поиск на сходство): Используется, когда точного совпадения, скорее всего, нет. Этот режим ищет структурно похожие соединения. Самый мощный его вариант — Hybrid Search.
  • Other Searches (Другие виды поиска): Позволяют искать не по спектру целиком, а по конкретным данным:

    • MW: Поиск по молекулярной массе.
    • Formula: Поиск по химической формуле.
    • CAS Number: Поиск по номеру CAS.
    • Any Peaks: Поиск спектров, содержащих определенные пики (или комбинацию пиков).
    • Sequential Method: "Дикий" поиск, позволяющий комбинировать несколько критериев (например, найти все спектры с MW > 300, содержащие атом брома и пик с m/z 91).
  • Structure Search (Поиск по структуре): Вы можете нарисовать или вставить структуру и найти соединения с похожим строением. Не путать с поиском по спектру!

2. Интерпретация результатов: Ключевые показатели

В окне результатов (Hit List) вы увидите несколько колонок с числами. Их понимание — ключ к правильной идентификации.

  • Match Factor (MF, Фактор совпадения): Показывает, насколько спектр из библиотеки совпадает с вашим (от 0 до 999).

    • > 900: Отличное совпадение.
    • 800–900: Хорошее совпадение.
    • 700–800: Среднее совпадение.
    • < 600: Плохое совпадение, скорее всего, соединение другое.
  • Reverse Match Factor (R.Match, Обратный фактор совпадения): То же, что и Match Factor, но при расчете игнорируются пики, которые есть в вашем спектре, но отсутствуют в библиотечном.

    • Зачем это нужно? Если R.Match значительно выше, чем Match, это верный признак того, что ваш образец содержит примеси или это смесь нескольких соединений (коэлюция).
  • Prob. % (Вероятность, %): Оценка вероятности того, что найденное совпадение является правильным, основанная на распределении факторов совпадения в списке результатов. Высокое значение у первого хита (>90%) говорит о высокой надежности.

  • InLib: Параметр, оценивающий вероятность того, что ваше соединение вообще присутствует в обыскиваемых библиотеках. Положительные значения — хороший знак.

Это одна из самых мощных функций NIST, особенно когда вы не находите точного совпадения.

  • Что он делает? Hybrid Search ищет не только совпадающие пики, но и совпадающие нейтральные потери (neutral loss). Это позволяет находить структурно родственные соединения, которые отличаются на одну или несколько функциональных групп.
  • Пример: У вас есть спектр неизвестного производного фентанила, которого нет в библиотеке. Обычный поиск даст низкие совпадения. Hybrid Search найдет обычный фентанил с высоким фактором совпадения, потому что у них одинаковый "остов" и, следовательно, похожие нейтральные потери.
  • Требование: Для EI поиска требуется указать молекулярную массу (Precursor MW). Для MS/MS она определяется автоматически.
  • DeltaMass: В результатах гибридного поиска появляется колонка DeltaMass, которая показывает разницу в массах между вашим ионом и ионом из библиотеки. Это прямо указывает на то, какая группа была добавлена или удалена (например, +14 Da = добавилась CH₂ группа).

4. Особенности тандемных (MS/MS) поисков

При работе с тандемными данными есть свои нюансы.

  • Настройка точности: В Library Search Options -> MS/MS необходимо правильно задать допуски по массе (Search m/z Tolerance) для прекурсора и для продуктовых ионов. Они должны соответствовать возможностям вашего прибора (например, ppm для высокоточных масс-спектрометров).
  • Фильтрация результатов (Hit List Filtering): Тандемный поиск часто выдает множество результатов для одного и того же соединения (разные энергии соударений, аддукты и т.д.). Чтобы в этом не утонуть, используйте фильтр (иконка "воронка" на панели инструментов). Он позволяет отфильтровать результаты по:
    • Типу аддукта ([M+H]+, [M+Na]+ и т.д.)
    • Типу прибора (Q-TOF, Ion Trap и т.д.)
  • Best matching only: Кнопка на панели инструментов, которая убирает дубликаты, оставляя только лучший хит для каждого уникального соединения. Очень полезно для очистки списка результатов.

Часть 3: Продвинутые настройки, Lib2NIST и пользовательские библиотеки

Эта часть предназначена для пользователей, которые хотят выйти за рамки стандартного поиска и адаптировать программу под свои специфические задачи.

1. Продвинутые настройки и автоматизация

  • Constraints (Ограничения): Это мощнейший инструмент для фильтрации поисковых запросов. В диалоговом окне поиска (Library Search Options) есть вкладка Constraints. Здесь вы можете задать жесткие критерии, например:

    • Наличие/отсутствие определенных элементов (например, "должен содержать 1 атом Br").
    • Диапазон молекулярных масс.
    • Наличие фрагментов в названии соединения.
    • Наличие определенных пиков.

    Важно: Не забывайте сбрасывать ограничения (Clear All) после выполнения специфического поиска, иначе они будут применяться ко всем последующим запросам и могут приводить к пустым результатам.

  • Использование .INI файлов:

    • Любую конфигурацию поиска и интерфейса можно сохранить в .INI файл (File -> Save Configuration).
    • Это позволяет создать разные "профили" для работы, например:
      • EI_search.ini: Настроен для поиска по EI библиотекам.
      • Tandem_HRAM.ini: Настроен для тандемного поиска высокого разрешения с соответствующими допусками.
      • My_Project_Lib.ini: Настроен для поиска только по вашей пользовательской библиотеке.
    • Это избавляет от необходимости каждый раз менять настройки вручную.

2. Утилита командной строки Lib2NIST

Lib2NIST — это инструмент для продвинутых пользователей, который позволяет автоматизировать работу с библиотеками без использования графического интерфейса.

  • Основное назначение: Конвертация библиотек из одного формата в другой и создание/обновление пользовательских библиотек в пакетном режиме.
  • Базовый синтаксис: lib2nist [опции] [входные файлы] [путь для вывода\]
  • Ключевые опции:
    • InputFile или InputLibrary: Указывает на входной файл или библиотеку.
    • OutputPath\: Папка, куда будут сохранены результаты. Важно: путь должен заканчиваться обратным слэшем (\).
    • =OutputName: Задает имя для выходной библиотеки или файла.
    • /LOGn: Создает лог-файл с уровнем детализации n (от 0 до 11). /LOG9 — самый подробный, очень полезен для отладки.
    • Inifile.INI: Позволяет использовать файл конфигурации для задания всех настроек, что гораздо удобнее, чем перечислять их в командной строке.
    • /OutLib, /OutMSP, /OutSDF: Указывают формат выходных данных (библиотека NIST, MSP-файл, SDF-файл).

3. Создание и управление пользовательскими библиотеками (User Libraries)

Создание собственных библиотек — одна из важнейших функций для систематизации данных.

  • Где это делается?: Основной инструмент — вкладка Librarian.
  • Как наполнять библиотеку?:
    1. Из результатов поиска: Любой спектр из Hit List можно отправить в Spec List (правый клик -> Send to -> Spec List).
    2. Из файлов: Импортировать спектры из файлов (.MSP, .JDX и т.д.).
    3. Вручную: Создать новую запись (New spectrum) и ввести данные.
  • Редактирование спектров:
    • В Librarian выберите спектр и нажмите Edit Spectrum. Откроется диалоговое окно Spectrum Information.
    • Здесь можно добавить или изменить: Имя, CAS, формулу, структуру, комментарии и, что очень важно, индексы удерживания (RI).
  • Tags в комментариях: Это скрытая, но очень мощная функция. В поле Comments можно добавлять структурированные метаданные в формате Tag=Value.
    • Пример: Contributor="My Lab" Instrument="Agilent 7890" Column="DB-5"
    • Эти теги становятся доступными для поиска через Constraints, что позволяет очень гибко фильтровать ваши собственные данные.
  • Где хранятся библиотеки?: Каждая пользовательская библиотека — это просто папка с файлами внутри директории C:\NIST23\MSSEARCH\. Это упрощает резервное копирование и перенос.

КРАЙНЕ ВАЖНО: Если вы редактируете пользовательскую библиотеку, содержащую тандемные или высокоточные (accurate mass) спектры, ее необходимо переиндексировать с помощью утилиты Lib2NIST после внесения изменений. В противном случае поиск по точной массе или Hybrid Search по этой библиотеке может работать некорректно или не работать вовсе.

Часть 4: Нюансы, "скрытые возможности" и частые ошибки

Это моменты, которые могут сэкономить вам много времени и уберечь от неверных выводов.

1. Мышление при поиске: "Я ищу ЭТО или что-то ПОХОЖЕЕ?"

Это самый важный вопрос, который вы должны задавать себе перед каждым поиском.

  • Если вы уверены, что соединение стандартное и должно быть в библиотеке (например, кокаин, кофеин, известный пестицид), ваш выбор — Identity Search. Он оптимизирован для поиска точных совпадений.
  • Если вы анализируете что-то неизвестное, метаболит, продукт синтеза, новый дизайнерский наркотик — сразу начинайте с Similarity: Hybrid Search. Не тратьте время на Identity, он, скорее всего, даст низкие результаты и введет в заблуждение. Hybrid Search — ваш главный инструмент для исследования неизвестного.

2. Ловушка гибридного поиска (Hybrid Search) для EI спектров

Для EI Hybrid Search требуется молекулярная масса (Precursor MW). Если вы ее не укажете, программа попытается ее угадать, но может ошибиться, и результаты будут неверными.

  • Проблема: У многих EI спектров нет пика молекулярного иона.
  • Решение: Если у вас нет точных данных о молекулярной массе из других экспериментов (например, химическая ионизация), лучше не использовать Hybrid Search вслепую. Результаты могут быть некорректными. Этот поиск наиболее ценен, когда у вас есть надежное значение MW.

3. Не бойтесь "беспорядка" в результатах MS/MS поиска

Когда вы впервые делаете поиск по тандемным библиотекам, список результатов (Hit List) может показаться хаотичным: десятки хитов для одного соединения с разными аддуктами, энергиями и т.д.

  • Это не ошибка, это особенность! Библиотека специально содержит спектры, снятые в разных условиях, чтобы повысить шансы на совпадение.
  • Ваш рабочий процесс должен быть таким:
    1. Выполнить поиск.
    2. Включить фильтр (Hit List Filter, иконка "воронка").
    3. Выбрать интересующий вас аддукт (например, [M+H]+).
    4. Нажать кнопку Best matching only.
  • Только после этих шагов список результатов станет чистым, ясным и пригодным для анализа.

4. InChIKey — ваш мост во внешний мир

У каждого соединения в библиотеке NIST есть строка под названием InChIKey. Не игнорируйте ее.

  • Что это? Это уникальный, стандартизированный "штрих-код" для химической структуры.
  • Как использовать? Скопируйте InChIKey из окна Text Information и вставьте его в Google, PubChem или любой другой научный поисковик. Вы мгновенно найдете всю доступную информацию об этом соединении: статьи, патенты, свойства, токсичность. Это невероятно ускоряет сбор данных о найденном веществе.

5. MS Interpreter — не просто просмотрщик, а инструмент валидации

Многие используют MS Interpreter только для просмотра структур. Его истинная сила в другом.

  • Проверка гипотезы: Допустим, Hybrid Search предполагает, что ваше неизвестное — это фентанил с добавленной пропильной группой. Вы можете нарисовать эту гипотетическую структуру в любом хим. редакторе, скопировать ее и вставить в MS Interpreter рядом с вашим спектром.
  • Что произойдет? MS Interpreter попытается объяснить фрагментацию вашего спектра на основе предложенной структуры. Если ключевые пики спектра объясняются логичными разрывами связей в вашей гипотетической структуре, вы с высокой вероятностью подтвердили свою догадку. Это мощнейший инструмент для валидации структурных гипотез.

6. Вся соль в метаданных (Text Information)

Не пренебрегайте окном с текстовой информацией. Иногда там можно найти настоящие сокровища.

  • Comments: Часто содержит информацию об условиях эксперимента, от кого получен спектр, о чистоте образца.
  • Other DBs: Показывает, в каких еще (не масс-спектральных) базах данных встречается это соединение (токсикологических, фармацевтических и т.д.). Это дает контекст.
  • Данные по Retention Index: Если для хита есть экспериментальные индексы удерживания, они будут перечислены здесь с указанием типа колонки. Это критически важная информация для подтверждения идентификации в хроматографии.

7. "Золотое правило" чистого рабочего процесса

Всегда используйте .INI файлы для разных задач.

  • Проблема: Вы сделали сложный поиск с кучей Constraints. Потом забыли их сбросить. Следующие несколько "простых" поисков выдают странные или пустые результаты, и вы тратите час, пытаясь понять, что не так.
  • Решение: Заведите себе правило. Перед началом работы загрузите нужную конфигурацию через File -> Restore Configuration. Например, EI_Simple_Search.ini. Это гарантирует, что все настройки сброшены в известное, чистое состояние. Это простое действие убережет вас от огромного количества ошибок и потерянного времени.

Руководство по настройке NIST MS Search 3.0 (Тандемный режим)

Этот документ представляет собой руководство по типичным настройкам программы NIST MS Search 3.0 в тандемном режиме, включая советы из Краткого руководства NIST.

1. Основные Настройки и Конфигурация

  • Переключение на программу производителя: Чтобы вернуться в программу вашего прибора после обработки данных, используйте иконку "Switch to Caller".
  • Выбор типа спектра (v.3.0): Версия 3.0 упрощает выбор режима работы. При запуске выберите тип спектра (File -> Select Spectrum Type):
    • Tandem: Для тандемных масс-спектров.
    • Peptide: Для пептидов.
    • EI: Для электронной ионизации.
  • Настройки импорта спектров (Options -> Spectrum Import Options):
    • Точность m/z: Установите количество знаков после запятой для ионов-предшественников и дочерних ионов (например, 4), чтобы соответствовать точности вашего прибора.
    • Удаление шума: Эта секция очень полезна для удаления низкоинтенсивных ионов и электронного шума.

2. Типы Поиска в Библиотеке (Options -> Library Search Options)

Во вкладке Search можно выбрать один из следующих типов поиска:

  • Identity MS/MS: Основной тип поиска. Ищет спектры в библиотеке, ограничиваясь ионом-предшественником и указанным для него допуском (m/z Tolerance).
  • Identity/High Resolution No Precursor: Сравнивает общий вид неизвестного спектра с референсными, не используя ион-предшественник для ограничения поиска.
  • Similarity/Hybrid MS/MS: Очень полезен, если в библиотеке нет точного совпадения, но есть похожее соединение. Этот поиск находит спектры с совпадающими дочерними ионами и нейтральными потерями.
    • Внимание: Гибридный поиск для отрицательных ионов (neg ion hybrid) может работать некорректно.

3. Настройки Поиска в Библиотеке (Вкладки)

  • Вкладка Libraries:
    • Spectrum search: Выберите библиотеки для поиска по спектру. Стандартные библиотеки для NIST 2023 уже выбраны по умолчанию.
    • Structure Search: Выберите библиотеки для поиска по структуре.
  • Вкладка MS/MS:
    • Search m/z Tolerance: Установите допуски для масс иона-предшественника (Precursor) и дочерних ионов (Product ions), которые соответствуют точности вашего прибора.
    • Ignoring peaks around precursor: Рекомендуется установить значение (например, 1.6 m/z), чтобы игнорировать пики вблизи иона-предшественника.
  • Вкладка Limits:
    • Minimum m/z: Рекомендуется установить минимальное значение m/z (по умолчанию 50), чтобы соответствовать диапазону вашего прибора.
  • Вкладка Constraints:
    • Позволяет применять фильтры по типу прибора, заряду, типу иона-предшественника и т.д.

4. Фильтрация и Анализ Результатов

  • Фильтр списка совпадений ("Воронка"):
    • Этот фильтр (Enable Filtering (Tandem Only)) позволяет отсеять результаты по полярности, типу аддукта (M+H, M+Na и т.д.) и другим параметрам.
    • ВАЖНО: Рекомендуется сначала выполнять поиск с отключенным фильтром, а затем применять его к списку результатов. Это поможет не отсеять нужные совпадения на начальном этапе.
  • "Best Matching only": Эта опция значительно упрощает список результатов, удаляя дубликаты с тем же номером CAS и оставляя только лучшее совпадение.
  • Включение/Исключение MS3+ спектров:
    • Библиотеки NIST содержат MS3 спектры, что может усложнять анализ.
    • Чтобы упростить результаты, можно в фильтре снять галочку "Include MS3+ spectra".
  • Отображение колонок в списке результатов:
    • Для удобства анализа рекомендуется добавить в список результатов колонки: Prec. Type (тип иона-предшественника), Instr. Type (тип инструмента) и Energy.

5. Оценка Результатов (Scores)

  • Dot Product: Математическая мера сходства спектров (999 — идеальное совпадение).
  • Score: Скорректированное значение, которое учитывает количество пиков и является более надежной мерой уверенности в идентификации, особенно для спектров с малым числом фрагментов.

6. Сохранение Настроек

  • ВАЖНО: После завершения всех настроек сохраните конфигурацию для будущих сессий через File -> Save Configuration.
  • Вы можете легко восстановить сохраненные настройки через File -> Restore Configuration.