Классификация методов практического извлечения знаний
I. Коммуникативные
-
Пассивные
- Наблюдения – аналитик только наблюдает за экспертом, записывает его реплики и рассуждения. Популярен на начальных этапах разработки.
- Наблюдение за реальным процессом – сначала аналитик использует этот вариант, чтобы глубже понять предметную область и отметить все внешние особенности процесса принятия решений
- Наблюдение за имитацией процесса – процесс имитации деятельности запускается специально для аналитика. Плюсы:
- Меньшие риски
- Фокусировка эксперта только на демонстрации деятельности
- Применимо даже тогда, когда прямое наблюдение невозможно
- Протокол мыслей вслух – эксперт поясняет всю цепочку своих рассуждений. Основная трудность протоколирования – для человека принципиально сложно объяснить, как он думает.
- Лекции – эксперт передаёт свои знания с помощью последовательного изложения. Нельзя прерывать эксперта в процессе чтения лекции.
-
Активные
-
Групповые
- Мозговой штурм – один из наиболее распространённых методов по раскрепощению и активизации творческого мышления. Впервые был использован в США. Основное требование – запрещение критики. Основная идея – отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки. Длительность – до 40 минут, количество участников – до 10 человек. Регламент выступления – до двух минут. Только 10-15% идей оказываются разумными. Анализ результатов проводится группой аналитиков, не участвовавших в генерации идей.
- Круглый стол – обсуждение темы из предметной области, в котором принимают участие несколько экспертов на равных правах. Существует проблема «эффекта фасада» – желание произвести впечатление на других экспертов. Порядок:
- Участники высказываются по теме в определённом порядке (рекомендуется 3-5 экспертов)
- Дискуссия.
Правила:
- Убедиться, что все понимают задачу
- Установить регламент
- Чётко сформулировать тему
Требует больших организационных усилий.
- Ролевые игры - тестируется реальная производственная ситуация. Пример: игра учитель – ученик, причём учителем играет аналитик, а учеником – эксперт.
-
Индивидуальные
- Анкетирование – наиболее стандартизованный метод.
Какой должна быть анкета:
- Анкета не должна быть монотонной. Для этого периодически добавляются игровые вопросы.
- Анкета должна быть приспособлена к языку эксперта.
- Следует учитывать влияния вопросов друг на друга, поэтому следует тщательно выбирать последовательность вопросов.
- Желательно стремиться к оптимальной избыточности.
- Анкета должна иметь хорошие манеры.
Процедура анкетирования проводится двумя способами:
- Эксперт заполняет анкету самостоятельно
- Аналитик заполняет анкету со слов эксперта
- Диалог – беседа без регламентированного плана и вопросника. Несмотря на отсутствие явных ограничений, требует большой подготовки и знаний о предметной области. Беседа на равных при уникальности каждого из партнёров. Важное требование – ориентация каждого на понимание и активную интерпретацию точки зрения партнёра.
Стадии:
- Начало беседы – знакомство, объяснение целей и задач
- Диалог по извлечению знаний
- Заключение – благодарности эксперту, подведение итогов и договор о последующих встречах
- Интервью – задаётся серия вопросов для извлечения и углубления знаний о предметной области. Форма более непринуждённая и развёрнутая, чем в случае с анкетированием. Вопросительные предложения разбивают на два типа:
- Вопрос с неопределённостью, относящийся ко всему предложению («Действительно ли введение больших доз антибиотиков может вызвать анафилактический шок?»)
- Вопросы с неполной информацией («При каких условиях необходимо нажать кнопку?»)
- Экспертные ролевые игры.
II. Текстологические.
Обязательно предшествуют всем остальным методам. Позволяют извлекать знания из статей, учебников и прочих текстовых носителей.
Алгоритм извлечения знаний из текста:
- Составление базового списка литературы для ознакомления с предметной областью и чтения по списку
- Выбор текста для извлечения знаний
- Беглое прочтение, определение значения незнакомых слов с привлечением специалистов или справочной литературы
- Формирование первой гипотезы о макроструктуре текста
- Внимательное изучение текста с выписыванием ключевых слов и выражений (компрессия текста)
- Определение связей между ключевыми словами, разработка макроструктуры текста в виде графа или реферата
- Формирование поля знаний на основании макроструктуры текста
Виды
- Анализ учебников
- Анализ литературы
- Анализ документов
По степени структурированности знаний предметные области могут быть:
- Хорошо структурированные (с чёткой аксиоматизацией, с широким применением математического аппарата и устоявшейся терминологией)
- Средне-структурированные (с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями)
- Слабо-структурированные (с размытыми определениями, скрытыми взаимосвязями, с большим количеством белых пятен; информация в основном добывается опытным путём)
Методы структурирования
Потребность в структурировании возникает при наборе достаточного количества информации.
Алгоритм (для «чайников»):
- Определение входных и выходных данных. Можно заметить, что структура этих данных существенно влияет на форму и содержание поля знаний. На этом шаге определение может быть достаточно размытым. Потом оно будет уточняться.
- Составление словаря терминов и наборов ключевых слов (N). Происходит текстуальный анализ всех протоколов извлечения знаний, которые были ранее получены, и выписывание всех значимых слов, обозначающих понятия, явления, процессы, предметы, действия и т.д. При этом важно разбираться в значении терминов.
- Выявление объектов и понятий ({A}). Производится просеивание словаря N и выбор значимых для принятия решения понятий и их признаков. В идеале формируется полный систематический набор терминов предметной области.
- Выявление связей между понятиями. Строится сеть ассоциаций, где связи только намечены, но не поименованы.
- Выявление метапонятий и детализация понятий.
- Построение пирамиды знаний – иерархическая лестница понятий, подъём по которой означает углубление уровня понимания и повышение уровня абстракции понятий. Количество уровней зависит от профессионализма аналитика и эксперта.
- Определение отношений. Отношения между понятиями выявляются как внутри каждого уровня пирамиды, так и между уровнями. Связям даются имена, выявляются причинно-следственные, временные, лингвистические и другие отношения.
- Определение стратегии принятия решений. Выявление цепочек рассуждений, которые связывают все определённые ранее понятия в динамическую систему поля знаний. Стратегии придают знаниям активность.