7. Технологии инженерии знаний

Классификация методов практического извлечения знаний

I. Коммуникативные

  • Пассивные

    • Наблюдения – аналитик только наблюдает за экспертом, записывает его реплики и рассуждения. Популярен на начальных этапах разработки.
      • Наблюдение за реальным процессом – сначала аналитик использует этот вариант, чтобы глубже понять предметную область и отметить все внешние особенности процесса принятия решений
      • Наблюдение за имитацией процесса – процесс имитации деятельности запускается специально для аналитика. Плюсы:
      1. Меньшие риски
      2. Фокусировка эксперта только на демонстрации деятельности
      3. Применимо даже тогда, когда прямое наблюдение невозможно
    • Протокол мыслей вслух – эксперт поясняет всю цепочку своих рассуждений. Основная трудность протоколирования – для человека принципиально сложно объяснить, как он думает.
    • Лекции – эксперт передаёт свои знания с помощью последовательного изложения. Нельзя прерывать эксперта в процессе чтения лекции.
  • Активные

    • Групповые

      • Мозговой штурм – один из наиболее распространённых методов по раскрепощению и активизации творческого мышления. Впервые был использован в США. Основное требование – запрещение критики. Основная идея – отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки. Длительность – до 40 минут, количество участников – до 10 человек. Регламент выступления – до двух минут. Только 10-15% идей оказываются разумными. Анализ результатов проводится группой аналитиков, не участвовавших в генерации идей.
      • Круглый стол – обсуждение темы из предметной области, в котором принимают участие несколько экспертов на равных правах. Существует проблема «эффекта фасада» – желание произвести впечатление на других экспертов. Порядок:
        1. Участники высказываются по теме в определённом порядке (рекомендуется 3-5 экспертов)
        2. Дискуссия.
          Правила:
          • Убедиться, что все понимают задачу
          • Установить регламент
          • Чётко сформулировать тему Требует больших организационных усилий.
      • Ролевые игры - тестируется реальная производственная ситуация. Пример: игра учитель – ученик, причём учителем играет аналитик, а учеником – эксперт.
    • Индивидуальные

      • Анкетирование – наиболее стандартизованный метод.
        Какой должна быть анкета:
        • Анкета не должна быть монотонной. Для этого периодически добавляются игровые вопросы.
        • Анкета должна быть приспособлена к языку эксперта.
        • Следует учитывать влияния вопросов друг на друга, поэтому следует тщательно выбирать последовательность вопросов.
        • Желательно стремиться к оптимальной избыточности.
        • Анкета должна иметь хорошие манеры.
          Процедура анкетирования проводится двумя способами:
          1. Эксперт заполняет анкету самостоятельно
          2. Аналитик заполняет анкету со слов эксперта
      • Диалог – беседа без регламентированного плана и вопросника. Несмотря на отсутствие явных ограничений, требует большой подготовки и знаний о предметной области. Беседа на равных при уникальности каждого из партнёров. Важное требование – ориентация каждого на понимание и активную интерпретацию точки зрения партнёра.
        Стадии:
        1. Начало беседы – знакомство, объяснение целей и задач
        2. Диалог по извлечению знаний
        3. Заключение – благодарности эксперту, подведение итогов и договор о последующих встречах
      • Интервью – задаётся серия вопросов для извлечения и углубления знаний о предметной области. Форма более непринуждённая и развёрнутая, чем в случае с анкетированием. Вопросительные предложения разбивают на два типа:
        1. Вопрос с неопределённостью, относящийся ко всему предложению («Действительно ли введение больших доз антибиотиков может вызвать анафилактический шок?»)
        2. Вопросы с неполной информацией («При каких условиях необходимо нажать кнопку?»)
      • Экспертные ролевые игры.

II. Текстологические.

Обязательно предшествуют всем остальным методам. Позволяют извлекать знания из статей, учебников и прочих текстовых носителей.

Алгоритм извлечения знаний из текста:

  1. Составление базового списка литературы для ознакомления с предметной областью и чтения по списку
  2. Выбор текста для извлечения знаний
  3. Беглое прочтение, определение значения незнакомых слов с привлечением специалистов или справочной литературы
  4. Формирование первой гипотезы о макроструктуре текста
  5. Внимательное изучение текста с выписыванием ключевых слов и выражений (компрессия текста)
  6. Определение связей между ключевыми словами, разработка макроструктуры текста в виде графа или реферата
  7. Формирование поля знаний на основании макроструктуры текста

Виды

  • Анализ учебников
  • Анализ литературы
  • Анализ документов

По степени структурированности знаний предметные области могут быть:

  • Хорошо структурированные (с чёткой аксиоматизацией, с широким применением математического аппарата и устоявшейся терминологией)
  • Средне-структурированные (с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями)
  • Слабо-структурированные (с размытыми определениями, скрытыми взаимосвязями, с большим количеством белых пятен; информация в основном добывается опытным путём)

Методы структурирования

Потребность в структурировании возникает при наборе достаточного количества информации.

Алгоритм (для «чайников»):

  1. Определение входных и выходных данных. Можно заметить, что структура этих данных существенно влияет на форму и содержание поля знаний. На этом шаге определение может быть достаточно размытым. Потом оно будет уточняться.
  2. Составление словаря терминов и наборов ключевых слов (N). Происходит текстуальный анализ всех протоколов извлечения знаний, которые были ранее получены, и выписывание всех значимых слов, обозначающих понятия, явления, процессы, предметы, действия и т.д. При этом важно разбираться в значении терминов.
  3. Выявление объектов и понятий ({A}). Производится просеивание словаря N и выбор значимых для принятия решения понятий и их признаков. В идеале формируется полный систематический набор терминов предметной области.
  4. Выявление связей между понятиями. Строится сеть ассоциаций, где связи только намечены, но не поименованы.
  5. Выявление метапонятий и детализация понятий.
  6. Построение пирамиды знаний – иерархическая лестница понятий, подъём по которой означает углубление уровня понимания и повышение уровня абстракции понятий. Количество уровней зависит от профессионализма аналитика и эксперта.
  7. Определение отношений. Отношения между понятиями выявляются как внутри каждого уровня пирамиды, так и между уровнями. Связям даются имена, выявляются причинно-следственные, временные, лингвистические и другие отношения.
  8. Определение стратегии принятия решений. Выявление цепочек рассуждений, которые связывают все определённые ранее понятия в динамическую систему поля знаний. Стратегии придают знаниям активность.
Topics:

7. Технологии инженерии знаний

Классификация методов практического извлечения знаний

I. Коммуникативные

  • Пассивные

    • Наблюдения – аналитик только наблюдает за экспертом, записывает его реплики и рассуждения. Популярен на начальных этапах разработки.
      • Наблюдение за реальным процессом – сначала аналитик использует этот вариант, чтобы глубже понять предметную область и отметить все внешние особенности процесса принятия решений
      • Наблюдение за имитацией процесса – процесс имитации деятельности запускается специально для аналитика. Плюсы:
      1. Меньшие риски
      2. Фокусировка эксперта только на демонстрации деятельности
      3. Применимо даже тогда, когда прямое наблюдение невозможно
    • Протокол мыслей вслух – эксперт поясняет всю цепочку своих рассуждений. Основная трудность протоколирования – для человека принципиально сложно объяснить, как он думает.
    • Лекции – эксперт передаёт свои знания с помощью последовательного изложения. Нельзя прерывать эксперта в процессе чтения лекции.
  • Активные

    • Групповые

      • Мозговой штурм – один из наиболее распространённых методов по раскрепощению и активизации творческого мышления. Впервые был использован в США. Основное требование – запрещение критики. Основная идея – отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки. Длительность – до 40 минут, количество участников – до 10 человек. Регламент выступления – до двух минут. Только 10-15% идей оказываются разумными. Анализ результатов проводится группой аналитиков, не участвовавших в генерации идей.
      • Круглый стол – обсуждение темы из предметной области, в котором принимают участие несколько экспертов на равных правах. Существует проблема «эффекта фасада» – желание произвести впечатление на других экспертов. Порядок:
        1. Участники высказываются по теме в определённом порядке (рекомендуется 3-5 экспертов)
        2. Дискуссия.
          Правила:
          • Убедиться, что все понимают задачу
          • Установить регламент
          • Чётко сформулировать тему Требует больших организационных усилий.
      • Ролевые игры - тестируется реальная производственная ситуация. Пример: игра учитель – ученик, причём учителем играет аналитик, а учеником – эксперт.
    • Индивидуальные

      • Анкетирование – наиболее стандартизованный метод.
        Какой должна быть анкета:
        • Анкета не должна быть монотонной. Для этого периодически добавляются игровые вопросы.
        • Анкета должна быть приспособлена к языку эксперта.
        • Следует учитывать влияния вопросов друг на друга, поэтому следует тщательно выбирать последовательность вопросов.
        • Желательно стремиться к оптимальной избыточности.
        • Анкета должна иметь хорошие манеры.
          Процедура анкетирования проводится двумя способами:
          1. Эксперт заполняет анкету самостоятельно
          2. Аналитик заполняет анкету со слов эксперта
      • Диалог – беседа без регламентированного плана и вопросника. Несмотря на отсутствие явных ограничений, требует большой подготовки и знаний о предметной области. Беседа на равных при уникальности каждого из партнёров. Важное требование – ориентация каждого на понимание и активную интерпретацию точки зрения партнёра.
        Стадии:
        1. Начало беседы – знакомство, объяснение целей и задач
        2. Диалог по извлечению знаний
        3. Заключение – благодарности эксперту, подведение итогов и договор о последующих встречах
      • Интервью – задаётся серия вопросов для извлечения и углубления знаний о предметной области. Форма более непринуждённая и развёрнутая, чем в случае с анкетированием. Вопросительные предложения разбивают на два типа:
        1. Вопрос с неопределённостью, относящийся ко всему предложению («Действительно ли введение больших доз антибиотиков может вызвать анафилактический шок?»)
        2. Вопросы с неполной информацией («При каких условиях необходимо нажать кнопку?»)
      • Экспертные ролевые игры.

II. Текстологические.

Обязательно предшествуют всем остальным методам. Позволяют извлекать знания из статей, учебников и прочих текстовых носителей.

Алгоритм извлечения знаний из текста:

  1. Составление базового списка литературы для ознакомления с предметной областью и чтения по списку
  2. Выбор текста для извлечения знаний
  3. Беглое прочтение, определение значения незнакомых слов с привлечением специалистов или справочной литературы
  4. Формирование первой гипотезы о макроструктуре текста
  5. Внимательное изучение текста с выписыванием ключевых слов и выражений (компрессия текста)
  6. Определение связей между ключевыми словами, разработка макроструктуры текста в виде графа или реферата
  7. Формирование поля знаний на основании макроструктуры текста

Виды

  • Анализ учебников
  • Анализ литературы
  • Анализ документов

По степени структурированности знаний предметные области могут быть:

  • Хорошо структурированные (с чёткой аксиоматизацией, с широким применением математического аппарата и устоявшейся терминологией)
  • Средне-структурированные (с определившейся терминологией, развивающейся теорией, явными взаимосвязями между явлениями)
  • Слабо-структурированные (с размытыми определениями, скрытыми взаимосвязями, с большим количеством белых пятен; информация в основном добывается опытным путём)

Методы структурирования

Потребность в структурировании возникает при наборе достаточного количества информации.

Алгоритм (для «чайников»):

  1. Определение входных и выходных данных. Можно заметить, что структура этих данных существенно влияет на форму и содержание поля знаний. На этом шаге определение может быть достаточно размытым. Потом оно будет уточняться.
  2. Составление словаря терминов и наборов ключевых слов (N). Происходит текстуальный анализ всех протоколов извлечения знаний, которые были ранее получены, и выписывание всех значимых слов, обозначающих понятия, явления, процессы, предметы, действия и т.д. При этом важно разбираться в значении терминов.
  3. Выявление объектов и понятий ({A}). Производится просеивание словаря N и выбор значимых для принятия решения понятий и их признаков. В идеале формируется полный систематический набор терминов предметной области.
  4. Выявление связей между понятиями. Строится сеть ассоциаций, где связи только намечены, но не поименованы.
  5. Выявление метапонятий и детализация понятий.
  6. Построение пирамиды знаний – иерархическая лестница понятий, подъём по которой означает углубление уровня понимания и повышение уровня абстракции понятий. Количество уровней зависит от профессионализма аналитика и эксперта.
  7. Определение отношений. Отношения между понятиями выявляются как внутри каждого уровня пирамиды, так и между уровнями. Связям даются имена, выявляются причинно-следственные, временные, лингвистические и другие отношения.
  8. Определение стратегии принятия решений. Выявление цепочек рассуждений, которые связывают все определённые ранее понятия в динамическую систему поля знаний. Стратегии придают знаниям активность.