Виведення відповідей на питання на icon

Виведення відповідей на питання на



НазваниеВиведення відповідей на питання на
Дата конвертации08.11.2012
Размер271.98 Kb.
ТипРеферат
скачать >>>

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ
КИЄВО-МОГИЛЯНСЬКА АКАДЕМІЯ”
Департамент комп’ютерних технологій
Кафедра інформатики
Реферат з курсу:
“ЛІНГВІСТИЧНЕ ЗАБЕЗПЕЧЕННЯ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ”
за весняний триместр 1999/2000 навчального року



ВИВЕДЕННЯ ВІДПОВІДЕЙ НА ПИТАННЯ НА
ВІРТУАЛЬНІЙ СЕМАНТИЧНІЙ СІТЦІ
студентки ДКТ-5
Федосової Н. Є
Керівник – доц. І. Б. Штерн
^




Київ – 1999

Зміст.


Зміст. 2

Вступ. 4

Основні поняття. 5

Базові конструкції фраз. 5

Синтаксичні конструкції базових питань. 5

Базові конструкції тверджень. 6

^ Структурована семантична сітка. 7

Семантичні групи понять. 8

Групові залежності. 8

Проблемні сфери. 9

Словник. 10

Принцип віртуальної семантичної сітки. 11

Мовні рівні при перетворенні запитів в базі знань. Структура системи керування базою знань. 12

Правила перетворення питань та виведення відповідей. 14

Перетворення М0  М1 (МІП  МДРО). 15

^ Перетворення М1  М2. 15

Ліва частина 16

АКТИВ 16

РЕАКТИВ 16

Перетворення М2  М3 (МСГ  МСТ). 16

Перетворення М3  М4 (МСТ  МПС). 21

Перетворення М4  М5 (МПС  МСС). 24

Перетворення М5  М6 (МСС  МПО). 26

Мова М8 (мова доступу до даних). 26

Перетворення М6  М7 (МПВ  МФО). 27

Висновок. 30

Література. 31

Вступ.


Інформаційні інтелектуальні системи основуються на знаннях, здійснюють дружній інтерфейс з користувачами, логічне виведення та пояснення своїх дій. В них використовується спеціальне логічне виведення, що відповідає тій проблемній області, тій задачі, на яку налаштовано дану ІІС. Можна сказати, що ІІС імітує спосіб розмірковування певного спеціаліста.

Атомарною процедурою при моделюванні таких розмірковувань є процедура ПИТАННЯ-ВІДПОВІДЬ, причому питання формулюється на обмеженій природній мові (ОПМ), що полегшує роботу користувача з системою.

Ми розглянемо можливу реалізацію процедури ПИТАННЯ-ВІДПОВІДЬ, а саме: внутрішнє перетворення системою запиту користувача та формулювання відповіді, яка буде зрозумілою цьому ж користувачу.


^

Основні поняття.

Базові конструкції фраз.

Синтаксичні конструкції базових питань.


Якщо питання просте, тобто без базових конструкцій, то воно повинно містити питальну область (ПО) та умови питання (УП). Питальна область – це слово (можливо, група слів), що задає множину понять, з яких здійснюється вибір при виведенні відповіді на питання. Умови питання – це слова (або група слів, чисел), що задають умови, у відповідності з якими повинен здійснюватися вибір. Наприклад, в питанні “СПІВРОБІТНИКИ ПІДРОЗДІЛ 7?” питальну область, очевидно задає слово СПІВРОБІТНИКИ (це множина усіх співробітників деякої організації), а умовою є словосполучення ПІДРОЗДІЛ 7.

Так як умов питання може бути декілька, то між ними повинні існувати певні відношення. Відношення можуть бути різними: кон’юнктивними, диз’юнктивними, інверсними. Але нас цікавить найпростіша базова форма питання, а значить, і відношення між УП в ній повинні бути найпростішими. Найпростішими слід визнати кон’юнктивні відношення, так як в природній мові саме ці відношення замовчуються. Наприклад, у питанні “СПІВРОБІТНИКИ ПІДРОЗДІЛ 7 КТН?” містяться дві умови : ПІДРОЗДІЛ 7 та КТН, та ці умови кон’юнктивно пов’язані, так як відповіддю на це питання повинен бути перелік співробітників, кожний з яких працює у підрозділі 7 та є кандидатом технічних наук. Значить, крім слів, що задають ПО (та питальних слів), інші слова питальної фрази задають умови питання УП.

Синтаксично правильні конструкції простих базових питань породжує граматика:

<ПП> ::= <ТПП>?

<ТПП> ::= <ПО> <ПУ> | <ПУ> <ПС> <ПО> | <ПУ> <ПС> <ПО> <ПУ> | <ПО> | <ПС> <ПО>

<ПУ> ::= <УП> | <УП> <ПУ> (1.1)

<ПО> ::= <СЛОВО> | <СЛОВО> <ЧИСЛО>

<УП> ::= <СЛОВО> | <СЛОВО> <ЧИСЛО>

<ПС> ::= ЯКІ

де використані наступні позначення: ПП – просте питання, ТПП – текст (тіло) простого питання, ПС – питальне слово, ПУ – множина питальних умов, УП – одинична умова питання.

Вкладена конструкція (ВК) синтаксично близька до простого питання з тією відмінністю, що питальне слово або розташовується на початку тексту ВК, або замовчується:

<ВК> ::= <ПС> <ПО> | <ПО> | <ПС> <ПО> <ПУ> (1.2)

Складне питання містить основну частину, конструкція якої співпадає з конструкцією тексту простого питання, та кілька вкладених одна в одну ВК. В загальному вигляді структура питання описується наступним чином:

<ПИТАННЯ> ::= <ТПП>? | <ТПП>, <ГВК>? | <ТПП> ДЛЯ <ГВК>?

<ГВК> ::= <ВК> | <ВК>, <ГВК> | <ВК> ДЛЯ <ГВК> (1.3)

де ГВК – група вкладених конструкцій. Практично необхідно обмежити кількість вкладених конструкцій.
^

Базові конструкції тверджень.


Крім питань користувач повинен мати можливість вводити в ІІС деякі твердження (факти). Тому слід ввести в ОПМ розповідну базову конструкцію (РБК).

<РБК> ::= <ЗО> <СЛОВО> [<ЧИСЛО>] <ІВ> <СЛОВО> [<ЧИСЛО>]

де ЗО – знак операції (1.4)

<ЗО> ::= + | –

причому знак “+” відповідає операції приєднання факту до значень ІС, а “–” – операції видалення факту із знань ІС. Необов’язкові символи у виразі (1.4) містяться у прямокутних дужках; ІО – ім’я відношення між поняттями, заданими словами (або словами у супроводі чисел). Якщо відношення однозначно визначається пов’язаними поняттями, замість імені відношення можна ввести роздільник, наприклад, знак “:”:

<РБК> ::= <ЗО> <СЛОВО> [<ЧИСЛО>] : <СЛОВО> [<ЧИСЛО>] (1.4a)
^

Структурована семантична сітка.


Із багатьох способів представлення знань в ІІС, таких як числення предикатів першого порядку, семантичні сітки, рольові фрейми та ін., найбільш просту та зрозумілу для користувача-непрограміста реалізацію представлення знань забезпечують семантичні сітки (СС). СС є граф (або квазіграф), вершинам якого відповідають об’єкти чи поняття, а дугам – зв’язки між цими об’єктами (поняттями). В загальному випадку СС бази знань ІІС повинна забезпечувати:

  • зберігання відомостей про об’єкти (поняття) світу системи та про зв’язки між ними;

  • можливість пошуку об’єктів (понять) за заданими характеристиками (за зв’язками з іншими об’єктами, поняттями);

  • можливість здійснювати процедури узагальнення та конкретизації знань;

  • можливість представляти квантифіковану інформацію, що виражає відтінки змісту ОПМ-фраз.

До цих вимог можна додати простоту реалізації та зрозумілість для спеціаліста з інформаційного забезпечення (непрограміста).

Кількість фактів, які повинна зберігати система знань промислової ІІС, вираховується, як правило, десятками та сотнями тисяч. Відповідно такою ж буде кількість вершин та дуг графа СС. Одночасне представлення сітки такого обсягу в оперативній пам’яті (що необхідне для швидкого пошуку по СС) неможливе . тому необхідно ввести структурування СС, тобто розбиття її на фрагменти (підсітки). Потрібна також процедура для визначення фрагментів СС, релевантних даній задачі (виведенню відповіді на дане питання). Вибрані фрагменти зчитуються з зовнішньої пам’яті ЕОМ в оперативну пам’ять. З цих фрагментів збирається структура, необхідна для вирішення даної задачі.
^

Семантичні групи понять.


Для структурування на рівні понять спочатку треба визначити множину понять, необхідних для побудови моделі світу ІІС. Потім слід розділити цю множину на підмножини, що не перетинаються, у кожному з яких будуть поняття близькі одне до одного за змістом. Такі підмножини назвемо семантичними групами (СГ).

Семантична група визначається четвіркою:

СГ = {W, I, D, T} (1.5)

Де W – назва СГ, слово вхідної мови; I – ідентифікатор СГ (літера українського та латинського алфавіту, крім); D – кількість елементів у групі; T – тіло групи (множина понять, що входять до СГ).

В базі знань ІІС семантичним групам відповідає спеціальний тип змінних, що називаються лінійками:

лінійка = {I, D, ТЛ} (1.6)

де D – кількість елементів даної СГ; ТЛ – тіло лінійки, а інші позначення – як в (1.5). ТЛ складається з D бітів, причому одиничне значення і-го біта означає, що і-й елемент даної СГ має певну властивість.

Семантична група в цілому позначається в БЗ своїм ідентифікатором І, а її елементи – сполученнями вигляду <I> <N>, де N – число, логічний номер елемента в СГ.
^

Групові залежності.


Розглядаючи зв’язки між виділеними СГ, можна знайти, що деякі з цих зв’язків відносяться, по-перше, не лише до окремих елементів СГ, а до груп в цілому та, по-друге, можуть бути віднесені до класів “бути видом (родом) або “бути невід’ємною властивістю”. Такі зв’язки між парами СГ назвемо груповими залежностями (ГЗ) та будемо позначати так:

I = ГЗ (J) (1.7)

де I, J – ідентифікатори груп. Вираз вигляду (1.7) означає, що група I “залежить” від групи J; інакше кажучи, всі елементи I пов’язані з елементами J відношенням “бути видом (родом)” або “бути невід’ємною властивістю”.

Формально ГЗ можуть бути встановлені шляхом аналізу графа зв’язків між СГ. “Залежні” групи (позначені індексом І у виразі (1.7)) відповідають термінальним вершинам цього графу.
^

Проблемні сфери.


Розглянемо тепер зв’язки між елементами семантичних груп. Елементи, що належать до однієї семантичної групи (точніше, поняттям, що їм відповідають), на мають безпосередніх зв’язків. Вони можуть пов’язуватися лише через елементи інших СГ.

Зв’язки одного вигляду між елементами двох різних СГ задаються таблицею, яка називається проблемною сферою (ПС). Кожен такий зв’язок може бути описано виразом

ЗВ’ЯЗОК ::= <I> <N> <p> <J> <M> (1.7)

де I, J – ідентифікатори СГ; N, M – числа, номера елементів СГ; р – ідентифікатор виду зв’язку. Якщо вид зв’язку однозначно визначається пов’язаними елементами, то ідентифікатор р можна опустити:

ЗВ’ЯЗОК ::= <I> <N> – <J> <M> (1.7a)

Ідентифікатор проблемної сфери описується виразом

<ІДЕНТИФІКАТОР ПС> ::= <I> <p> <J> (1.8)

<ІДЕНТИФІКАТОР ПС> ::= <I> – <J> (1.8а)

Одна з ПС, так звана ПС-АЛЬФА, представляє структуру бази знань. Вона містить інформацію про зв’язки між семантичними групами та проблемними сферами. Така ПС пов’язує дві особі СГ: ГРУПИ та СФЕРИ.

Словник.


Ідентифікатори семантичних груп та цифри, що позначають логічні номера елементів цих груп, а також розділові знаки є термінальними символами мови семантичних груп (МСГ). Введення ОПМ-фраз в БЗ ініціює переклад цієї фрази з вхідної мови на МСГ. Розділові знаки при цій трансляції не змінюються. Для перекладу на МСГ слів вхідної мови в БЗ повинен міститися Словник. Кожному слову вхідної мови Словник ставить у відповідність ланцюжок термінальних символів МСГ. Крім того, у Словнику повинні задаватися стійкі словосполучення вхідної мови та їх переклади на МСГ. Позначивши вхідну мову М1, а мову семантичних груп М2, можна дати формальний опис Словника:

<СЛОВНИК> ::= <СТАТТЯ> | <СТАТТЯ> <СЛОВНИК>

<СТАТТЯ> ::= <ЛІВА ЧАСТИНА> | <ПРАВА ЧАСТИНА>

<ЛІВА ЧАСТИНА> ::= <СЛОВО М1> (1.7)

<ПРАВА ЧАСТИНА> ::= <ЛАНЦЮГ М2> | <СЛОВО М1> * <СЛОВО М1>,

де <СЛОВО M1> – одне із слів вхідної мови М1, <ЛАНЦЮГ М2> – ланцюжок термінальних символів М2 (МСГ).

Останній запис з (1.7) означає, що вхідне слово лівої частина словникової статті або замінюється заданим у правій частині цієї статті ланцюгом символів (ЛАНЦЮГ М2), або, якщо воно входить до стійкого словосполучення з першим із слів М1 в правій частині статті, що стоїть до знаку *, повинно бути заміненим другим словом М1, що стоїть після знаку *. Потім це останнє слово слід знайти в лівій частині однієї з словникових статей та замінити перекладом на М2 або, якщо словосполучення місить більше двох слів М1, здійснювати нову заміну до тих пір, поки не відбудеться повна заміна на термінальні символи М2. Такий метод трансляції словосполучень дозволяє задавати та перекладати словосполучення із більш чим двох слів.
^

Принцип віртуальної семантичної сітки.


Швидкість бази знань при виведенні відповіді на питання суттєво залежить від розміщення знань у пам’яті ЕОМ. Найбільшого прискорення можна досягти, якщо помістити всі знання в оперативну пам’ять. Але для промислових ІІС це не є можливим через великий обсяг знань. Структурування знань ІІС дозволяє розміщувати структурні елементи сітки на зовнішніх носіях та викликати в оперативну пам’ять лише ті елементи сітки, які необхідні для виведення відповіді на задане питання. Структурними елементами сітки є так звані проблемні сфери (ПС). З вибраних в оперативну пам’ять ПС повинна бути зібрана локальна семантична сітка, релевантна до даного питання. Цю сітку будемо називати проблемною семантичною сіткою (ПСС). Даний метод представлення структурованої семантичної сітки можна назвати методом віртуальної семантичної сітки. Користувачу, що задає питання базі знань, здається, що виведення відповіді базується на повній семантичній сітці, тоді як насправді у виведенні відповіді бере участь лише невелика частина структурних елементів семантичної сітки бази знань. Для реалізації цього методу необхідні:

  1. Розробка алгоритму перетворення вхідного питання в релевантну проблемну семантичну сітку;

  2. Розробка алгоритму виведення відповіді на основі зібраної ПСС;

  3. Визначення структури системи керування базою знань (СКБЗ), в якій повинні виконуватися наведення вище алгоритми.

  4. Мовні рівні перетворення запитів у базі знань. Структура системи керування базою знань.
^

Мовні рівні при перетворенні запитів в базі знань. Структура системи керування базою знань.


Процес переходу питання користувача до виданої системою відповіді представляє собою багатоступеневе перетворення, причому кожному поверху такого перетворення відповідає свій рівень мови представлення інформації в системі. Нижче буде розглянуто ці мовні рівні. Для кожного мовного рівня будуть наведені його назва, абревіатура та позначення.

Мова М0. Мова, якою користувач виражає свою інформаційну потребу, є повною природною мовою. Тобто М0 – мова інформаційної потреби (МІП).

Мова М1. Обмежена природна мова, на якій користувач вводить свій запит до системи. Ступінь близькості М0 та М1 залежить від характеру обмежень, що накладаються в інформаційній системі на природну мову. В системах, орієнтованих на використання в диспетчерському керуванні, ця мова отримала назву мова диспетчерських рішень оперативна (МДРО).

Мова М2. Цей мовний рівень відповідає формулюванню запиту в термінах понятійних груп, представлених в інформаційній системі. Так як такі групи називаються семантичними групами, то цей мовний рівень назвемо мовою семантичних груп (МСГ).

Мова М3. Мова синтаксичних структур (МСТ). На цьому рівні формулюються результати математичного аналізу запиту, представленого на мові М2. На цьому рівні виявляється структура запиту (просте або складене питання), встановлюються відношення підпорядкування між основними та підрядними підпитаннями, в кожному підпитанні визначається питальна область (ПО) та умови питання (УП); здійснюється розбиття підпитань на елементарні блоки – субпитання та формується загальна синтаксична структура запиту із субпитань, зв’язаних певними відношеннями.

Мова М4. Мова проблемних сфер (МПС). Для кожного субпитання на М3 на цьому мовному рівні визначаються структурні елементи семантичної сітки, релевантні цьому субпитанню (проблемні сфери), та встановлюються зв’язки, що з’єднують вибрані ПС в ПСС.

Мова М5. Мова семантичних сіток (МСС). На цьому мовному рівні на базі зібраної ПСС здійснюється пошук для виведення відповіді. Термінами М5 є вершини та дуги графа ПСС.

Мова М6. Мова представлення відповіді (МПВ), виведеної на М5. мова йде про внутрішнє представлення відповіді.

Мова М7. Мова форм відображення (МФВ). На мові цього рівня вербалізуються відповіді для представлення користувачам.

Мова М8. Мова доступу до даних (МДД). Мова цього рівня забезпечує зв’язок між семантичними структурами як описами даних та конкретними даними. При перетворенні запитів в базі знань МДД виконує важливу роль по зв’язку фреймів опису форм відображення, якими користуються редагуючі програми, та конкретними даним, якими заповнюються слоти цих фреймів.

Система керування базою знань (СКБЗ) повинна таким чином, мати програмні модулі для забезпечення наступних мовних перетворень: М1  М2, М2  М3, М3  М4, М4  М5, М5  М6, М6  М7, М7  М8 (перетворення М0  М1 виконується самим користувачем). СКБЗ складається з наступних програмних процесорів:

  • лінгвістичний процесор (ЛП) – здійснює перетворення М1  М2 та М2  М3;

  • семантичний процесор (СП) – здійснює перетворення М3  М4, М4  М5, М5  М6;

  • редагуючий процесор (РП) – здійснює перетворення М6  М7;

  • процесор даних (ПД) – здійснює перетворення М7  М8.

Структура СКБЗ, зв’язок її елементів через мовні рівні наведено на мал.2.1.
^

Правила перетворення питань та виведення відповідей.


Розглянемо граматичні правила перетворення тексту запиту в БЗ та правила виведення та вербалізації відповіді.


^

Перетворення М0  М1 (МІП  МДРО).


Це перетворення здійснюється не базою знань, а користувачем. Складність такого перетворення залежить від ступеня близькості М1 до М0 (повної природної мови) та від зручності введення запитів на М1.
^

Перетворення М1  М2.


Термінами мови семантичних груп є ідентифікатори семантичних груп, натуральні числа, що відповідають номерам елементів семантичних груп, спеціальний термін k, що відповідає питальному слову ЯКІ (КОТРІ), знаки пунктуації та деякі спеціальні знаки. Із знаків пунктуації використовуються кома (для відокремлення підрядних питань), знак питання (для завершення питальної фрази), крапка (для завершення твердження), двокрапка (для відокремлення понять), знаки + та – для позначення операції приєднання або видалення (знаки + та – вважаються в мові знаками пунктуації). Перетворення слів мови МДРО у МСГ-ланцюжки здійснюється за допомогою Словника системи (див. (1.7)). Формальні вирази, що описують Словник, відповідають контекстно-вільній граматиці, за виключенням елементів контекстної залежності, що виникає при необхідності перетворення словосполучень. Фраза на МСГ формується з МДРО-фрази шляхом послівного перекладу за Словником та конкатенації МСГ-ланцюжків, записаних в правих частинах словникових статей, правими частинами яких є слова МДРО-фрази. При цьому знаки пунктуації та числа переходять у МСГ-фразу без змін.

Якщо МДРО-слово може входити до словосполучення, то лінгвістичний процесор СКБЗ знаходить відповідні посилання у Словнику системи та перевіряє, чи наступним відповідне слово.

Якщо це слово є в МДРО-фразі після даного слова, то за Словником здійснюється заміна словосполучення з двох слів на ланцюжок з правої частини словарної статті. Цей ланцюжок може складатися лише з термінальних символів МСГ або містити посилання на словосполучення. Таким чином можна задавати словосполучення з фактично необмеженої кількості слів.

Приклад 3.1. Для фрагмента словника, наведеного в табл. 3.1, наводяться приклади перетворення МДРО-питання на мову семантичних груп.

АКТИВНА ПОТУЖНІСТЬ СТАНЦІЙ ДОНБАСУ?  w1v1r3?

ДОНБАС СХЕМА?  r3kfx1?

РЕГІОНИ, У ЯКИХ ЧАСТОТА НОРМАЛЬНА  r, kw3s0?

Таблиця 3.1
^

Ліва частина


Права частина
Примітки

Ліва частина

Права частина

Примітки
















АКТИВ


ПОТ*АК-П

Активний

ПОТУЖ

w7

Потужність

АК-П

w1

Активна потужність

РЕАКТИВ


ПОТ*РЕ-П

Реактивний

ВЛ

l

Високовольт-ні лінії

РЕ-П

w4

Реактивна потужність

ВИД-ОБ

v

Вид енерго-об’єкту

РЕГІОН

r

Регіон

ВИД-ФОРМ

w

Вид форм

РЕС

r

Районна енергосистема

ГЕС

v2

Гідроелектро-станція

СТАНЦ

v1

Станція

ДОНБАС

r3

Донбас-енерго

СТ-ПАР

s

Стан параметру

КОТР

k

Котрий (котрі)

СХЕМ

kfx1

Схема

НАПРУГ

w2

Напруга

ТАБЛ

kfx2

Таблиця

НОРМА

s0

Норма

ФОРМ

f

Форма

ОБ’ЄКТ

o

Об’єкт

ЧАСТОТ

w3

Частота

ПАРАМ

p

Параметр

ЯК

k

Який (які)
^

Перетворення М2  М3 (МСГ  МСТ).


Перетворення М2  М3 проводиться в три етапи. На першому етапі визначається загальна синтаксична структура ПБК, виділяються підрядні вкладені конструкції, якщо вони є у фразі, що аналізується. В результаті ПБК диференціюється на кілька підпитань, кожний з яких є простим питанням. Встановлюються зв’язки між підпитаннями.

На другому етапі в кожному підпитанні виділяється питальна область (ПО) та умови питання (УП). При визначенні ПО можуть діяти трансформаційні правила, які здатні змінити синтаксичну структуру підпитання в цілому та примусити систему до повернення до першого етапу перетворення.

На третьому етапі кожне підпитання представляється у вигляді сукупності субпитань, причому кожне із субпитань складається з питальної області (однакової для всіх субпитань даного підпитання) та однієї (кон’юнктивної) умови питання. Між субпитаннями одного підпитання встановлюються відношення кон’юнкції.

^ Перший етап перетворення реалізує контекстно-вільну аналізуючу граматику:

<ПИТАННЯ>::=<ПРОСТЕ ПИТАННЯ>? |<ПРОСТЕ ПИТАННЯ>, <ВКЛАДЕНА КОНСТРУКЦІЯ>?

<ПРОСТЕ ПИТАННЯ>::=<ПОВНЕ ПИТАННЯ>| <КРАТКЕ ПИТАННЯ> (3.1)

<ВКЛАДЕНА КОНСТРУКЦІЯ> ::= <КРАТКЕ ПИТАННЯ> | k |<КРАТКЕ ПИТАННЯ>, <ВКЛАДЕНА КОНСТРУКЦІЯ>

<ПІДПИТАННЯ>::=<КРАТКЕ ПИТАННЯ>|<ПОВНЕ ПИТАННЯ>?

Граматика (3.1) перетворює МДРО-фразу у перелік підпитань. Послідовність підпитань у цьому переліку зворотня ієрархічна: спочатку йде найбільш підрядне питання, а останнє – основне підпитання фрази.

Приклад 3.1.
МДРО-фраза

МСГ-фраза

Список підпитань










ДОНБАС СХЕМА?

r3kfx1?

r3kfx1

РЕГІОНИ, У ЯКИХ ЧАСТОТА НОРМАЛЬНА?

r, kw3s0?

w3s0

r

РЕС, КОТРІ МІСТЯТЬ СТАНЦІЇ, У ЯКИХ РЕАКТИВНА ПОТУЖНІСТЬ НОРМАЛЬНА?

r, kv1, kw4s0?

w4s0

v1

r

Якщо на другому етапі перетворення не виникає необхідність використовувати трансформаційні правила, то цей етап реалізує контекстно-вільну граматику:

<ПО> ::= <І>

<УП> ::= <І> | <І> <ЧИСЛО> (3.2)

де <I> – ідентифікатор семантичної групи.

Питальна область підпитання співпадає з символом-ідентифікатором І семантичної групи в конструкціях підпитання виду

<ПІДПИТАННЯ>::=<І><ЛАНЦЮГ>|<ЛАНЦЮГ>k<І><ЛАНЦЮГ>

(3.3)

де <ЛАНЦЮГ> – будь-яка послідовність термінальних символів МСГ, що не починається з цифри (можливо, пуста). Таким чином, якщо в підпитанні міститься питальне слово (йому відповідає термінальний символ k в МСГ), то питальна область цього підпитання співпадає з ідентифікатором семантичної групи, розташованим безпосередньо після символу k. Якщо ж питальне слово в підпитання відсутнє, питальна область співпадає з ідентифікатором семантичної групи, з якого починається підпитання, з тією умовою, що безпосередньо після цього ідентифікатора не розташована цифра.

Терміном другого етапу перетворення є – місце ПО в підпитанні. Це порядковий номер символу, що співпадає з ПО (при =0 ПО – на початку питання). До переліку підпитань, який сформувався на першому етапі перетворення, додається колонка значень .

Приклад 3.2.
МДРО-фраза

МСГ-фраза

Список підпитань











ДОНБАС СХЕМА?

r3kfx1?

r3kfx1

3

ТАБЛИЦЯ ЧАСТОТИ?

kfx2w3?

Kfx2w3

1

ПАРАМЕТРИ СТАНЦІЙ ДОНБАСУ?

pv1r3

pv1r3

0

РЕС, У ЯКИХ ПАРАМЕТРИ НОРМАЛЬНІ?

r, kps0?

ps0

r

0

0

РЕС, ЯКІ МІСТЯТЬ ОБ’ЄКТИ, У ЯКИХ ПАРАМЕТРИ НОРМАЛЬНІ?

r, ko, kps0?

ps0

o

r

0

0

0

Не розглядаючи поки трансформаційні правила, які можуть застосовуватися на другому етапі перетворення М2  М3, опишемо третій етап цього перетворення, що заключається в розділенні кожного підпитання на субпитання:

<СУБПИТАННЯ>::=<ПО><УП> (3.4)

Якщо список підпитань для даного питання містить більше одного підпитання, то для першого підпитання в списку робиться розділення на субпитання у відповідності з правилами (3.4), а для наступних підпитань списку до кожного з них додається ще одне субпитання, що містить в якості УП питальну область попереднього підпитання, поміченого індексом підстановки:




Cубпитання




<ПІДПИТАННЯ­­­­і>

(<ПОі><ПОі-1>)







(<ПОі><УП>)

(3.5)




(<ПОі ><УП>)















(<ПОі><УПni>)




де і ≥ 1, n – кількість умов вданому підпитанні. Відповідь на попереднє підпитання, позначене індексом СГ, відповідній його ПО з індексом , входить до наступного підпитання в якості умови, породжуючи таким чином ще одне субпитання.

Підпитання в списку підпитань пов’язані відношеннями підпорядкування (підстановки), а субпитання одного підпитання – кон’юнктивними відношеннями:



Структура (3.6) описує загальну синтаксичну структуру питання.

Приклад 3.3.

МДРО-фраза

Список піпитань



Синтаксична структура













Д0НБАС СХЕМА?

r3kfx1

3



ТАБЛИЦЯ ЧАСТОТИ?

kfx2w2

1



ПАРАМЕТРИ СТАНЦІЙ ДОНБАСУ?

pv1r3

0



РЕС, ЯКІ МІСТЯТЬ ОБ’ЄКТИ, У ЯКИХ ПАРАМЕТРИ НОРМАЛЬНІ?

ps0

o

r

0

0

0



Тепер розглянемо трансформаційні правила, які можуть застосовуватися на другому етапі перетворення М2  М3. Правило (3.3) дозволяє виділити питальну область у підпитанні лише в тому випадку, коли вона вказана явно, тобто або вказана положенням питального слова, після якого йде ідентифікатор семантичної групи без наступної цифри, або питального слова у підпитанні немає, а він починається з ідентифікатора СГ без наступної цифри. Згаданий ідентифікатор СГ в цих випадках визначає ту групу понять (семантичну групу), з якої у відповідності з умовами підпитання повинні бути знайденими елементи цієї групи (один або декілька) для входження у відповідь на підпитання. Іншими словами, цей ідентифікатор СГ визначає питальну область (ПО) підпитання.

У багатьох випадках, однак, так явно ПО не вказано у тексті підпитання, та правило (3.3) застосувати не вдається. Тоді повинні бути використані трансформаційні правила, що перетворюють підпитання до форми, яка дозволяє застосувати правило (3.3). Застосування трансформаційних правил відповідає виділенню із тексту підпитання прихованої інформації про питальну область.
^

Перетворення М3  М4 (МСТ  МПС).


На вході цього етапу – синтаксична структура питання на мові МСТ, тобто список субпитань із вказівками зв’язків між субпитаннями (підстановок, кон’юнкцій). Для переходу до мови проблемних сфер для кожного субпитання необхідно знайти ідентифікатори проблемних сфер, необхідні для розв’язування субпитання (для визначення елементів питальної області субпитання, що задовольняють умові субпитання). Для цього перетворення використовується наступна інформація:

  • проблемна сфера ПС АЛЬФА, що зберігає інформацію про зв’язок проблемних сфер з семантичними групами;

  • групові залежності (ГЗ) між семантичними групами.

Задачею перетворення М3  М4 є визначення тих проблемних сфер, які необхідні для виведення відповіді на кожне субпитання. Якщо таких проблемних сфер виявиться більше однієї, необхідно визначити структуру їх з’єднання у проблемну семантичну сітку. В загальному вигляді перетворення субпитання вигляду IJN на структуру на мові МПС може бути описане за допомогою породжуючої граматики:

(IJN)М3  (N)  <СТРУКТУРА>  <СТРУКТУРА> ::= <ІПС> | <ІПС> <ЗВ’ЯЗОК> <СТРУКТУРА> (3.7)

ЗВ’ЯЗОК ::= –

Тут <ІПС> – ідентифікатор проблемної сфери (див. (1.8)).

Для субпитання виду IJ*, де знак * означає підстановку в якості умов відповіді на попереднє питання, у перетворенні на М; замість номера елемента умови підставляється знак *:

(IJ*)М3  *  СТРУКТУРА  (3.7а)

З (3.7) випливає, що структура субпитання на мові проблемних сфер складається з ідентифікаторів, релевантних субпитанню на М3. Ця структура має в якості входу номер елемента семантичної групи – умови субпитання або знак підстановки.

Основною задачею при побудові структури на М4 є визначення проблемних сфер, релевантних субпитанню, що перетворюється. Це може бути виконано, застосовуючи наступне правило: нехай до субпитання на М3 входять ідентифікатори семантичних груп I та J. Тоді деяка проблемна сфера ПСі буде релевантною до цього субпитання та повинна увійти до структури на М4, якщо істинний вираз

r(I, ПСі) r(J, ПСi) rs(I, L) (3.8)

r(J, ПСі) r(L, ПСі) rs(J, L)

r(I, ПСі) r(L, ПСі),

де I, J, L – ідентифікатори семантичних груп, rs – зв’язок по графу семантичних залежностей (rs=1, якщо такий зв’язок існує), r – зв’язок по графу ПС АЛЬФА (r=1, якщо такий зв’язок існує), – знак кон’юнкції,  – знак диз’юнкції.

Вираз (3.8) означає, що проблемна сфера ПСі релевантна субпитанню, яке перетворюється, та входить до структури проблемної семантичної сітки, якщо:

  1. є зв’язки по графу ПС АЛЬФА між вершиною ПС та вершинами I та J;

  2. існує зв’язок вершин I та L по графу ГЗ та при цьому по графу ПС АЛЬФА є зв’язки вершини ПСі з вершинами I та L, а також існує зв’язок по графу ГЗ між вершинами J та L та при цьому по графу ПС АЛЬФА є зв’язки вершини ПСі та вершин I та L.

ІПС, вибрані у відповідністю з умовою (3.8), з’єднуються у структуру проблемної семантичної сітки так, щоб сусіднім з входом-умовою був ідентифікатор СГ-умови, а виходом ПСС – ідентифікатор СГ питальної області. Якщо вибрати декілька релевантних ПС, то при утворенні структури ПСС ідентифікатори цих ПС повинні з’єднуватися зв’язками між одноіменними ідентифікаторами СГ.

Наприклад, використовуючи (3.7) та (3.8), можна отримати для субпитання структури ПСС наступного вигляді (при умові, що в графі ГЗ кожна вершина пов’язана не більше ніж з однією дугою):

а) N  (IJ) 

б) *  (IJ) 

в) N  (IL) – (LJ) 

г) *  (IL) – (LJ)  (3.9)

д)




е)



Структури д) та е) містять паралельні гілки, виходи яких повинні об’єднуватися символом диз’юнкції .
^

Перетворення М4  М5 (МПС  МСС).


Перетворення з мови проблемних сфер на мову семантичних сіток відбувається в два етапи. Перший етап заключається у зборці ПСС за структурою, визначеною засобами мови МПС (М4). Другий етап заключається у виведенні відповіді у відповідності з входами ПСС (ці входи відповідають умовам питання).

На мові М4 ПС представлені своїми ідентифікаторами, тобто на поверхневому семантичному рівні. Для зборки ПСС мовними засобами М5 необхідно замість ідентифікаторів ПС підставити в структуру ПСС записи проблемних сфер на глибинному семантичному рівні, тобто у вигляді множини відношень. Якщо ПСС включає декілька ПС, то з’єднувати слід одноіменні елементи семантичних груп. Входи ПСС, тобто елементи СГ-умов питання (субпитання) в структурі ПСС, на М5 повинні бути спеціальним чином помічені. Приймемо в якості такого позначення стрілку, що входить у відповідну вершину графа ПСС на М5.

Приклад 3. 4. На малюнку 3.1 приведено структуру ПСС, що відповідає питанню “АКТИВНА ПОТУЖНІСТЬ СТАНЦІЙ ДОНБАСУ?”, а на мал.3.2 – ПСС, що відповідає питанню “ПАРАМЕТРИ, [вимірювані на] ОБ’ЄКТАХ ДОНБАСУ?”


^



Перетворення М5  М6 (МСС  МПО).


Таким чином, відповідь на рівні мови семантичних сіток представляє собою ряд помічених вершин однієї з семантичних груп – питальної області даного питання. Для перекладу відповіді на мову представлення відповіді МПО (М6) необхідно сформувати лінійку у відповідності з описом (1.6). відмічені в ПСС вершини отримають в тілі лінійки одиничні біти. Інші вершини ПСС, що належать до СГ питальної області, отримають в лінійці нульові біти.
^

Мова М8 (мова доступу до даних).


Не всю інформацію, що зберігається в пам’яті системи, доцільно представляти у вигляді семантичних сіток. Якщо, з одного боку, по деякому виду даних немає необхідності проводити пошук за допомогою природно-мовних запитів, а з іншого боку, представлення даних цього виду семантичними сітками неекономно, то такі дані, на відміну від знань представлених сітками, назвемо конкретними даними. Конкретні дані доцільно об’єднувати в масиви, які, в свою чергу, складаються з елементів. Кожний масив конкретних даних повинен бути зв’язаним в одній з семантичних груп таким чином, щоб послідовність логічних номерів елементів СГ відповідала послідовності номерів елементів у відповідних масивах конкретних даних.

Таким чином, розділення інформації на знання та конкретні дані в значній мірі умовне та визначається при проектуванні інформаційної системи в залежності від її функцій та від ресурсних можливостей ЕОМ.

Масиви конкретних даних знаходяться під керуванням процесора даних (ПД). Для звертання до ПД слід визначити: вид операції (читання, запис та ін.), потрібний масив, елемент цього масиву. Будемо вважати масиви та їх елементи пронумерованими (ЛНМ – логічний номер масиву, ЛНЕ – логічний номер елемента).
^

Перетворення М6  М7 (МПВ  МФО).


Редагуючий процесор (РП) перетворює відповіді на запити, представлені на М6 у вигляді лінійок (внутрішнє машинне представлення), на зручну для людини мовну або графічну форму (мова форм відображення М7). Доцільно виділити основні класи форм відображення, що задовольняють вимогам використання в оперативних інформаційних системах:

а) синтез відповіді у вигляді природно-мовної фрази;

б) відповідь у вигляді штампу-коментарю;

в) відповідь у вигляді СПИСКУ;

г) відповідь у вигляді ФОРМИ;

д) відповідь у вигляді ГРАФІКУ;

е) відповідь у вигляді СТЕЖЕННЯ.

Методи синтезу відповіді у вигляді природно-мовної фрази в принципі є здійсненими, але їх реалізація пов’язана зі значними складнощами. Разом з тим, для абсолютної більшості промислових інформаційних систем немає необхідності звертатися до такої форми відповіді при виведенні відповіді. Тому далі ця форма представлення відповіді не розглядається.

Виведення штампів-коментарів здійснюється у випадку, нерозуміння базою знань запиту, відсутності у БЗ потрібної інформації, некоректності запиту та інших аналогічних випадках. Приклади коментарів: “ПОМИЛКА ЗАПИТУ”, “НЕМАЄ ІНФОРМАЦІЇ”, “ЗАПИТ Є НЕКОРЕКТНИМ; ПЕРЕФОРМУЛЮЙТЕ ЙОГО, БУДЬ-ЛАСКА”.

Для вибору інших видів відображення редагуючий процесор може використовувати текст запиту:

  • вид відповіді ФОРМА обирається, якщо у запиті були використані слова із раніше визначеного набору, наприклад СХЕМА, ТАБЛИЦЯ, БАЛАНС, РЕСУРС (останні два слова визначають вид таблиць);

  • вид відповіді ГРАФІК обирається при присутності у запиті слова ГРАФІК;

  • вид відповіді СТЕЖЕННЯ обирається при присутності у запиті слова СТЕЖЕННЯ;

  • вид відповіді СПИСОК обирається у наступних випадках: при присутності у запиті слова СПИСОК; при відсутності у запиті слів, що відповідають іншим (крім СПИСКУ) формам відображення, тобто за замовчанням; при виборі інших (крім СПИСКУ) видів відображення, але при наявності у відповіді на М6 більше одного елемента, що входить до об’єму відповіді.

Для кожного з видів відображення відповіді редагуючий процесор має відповідну редагуючу програму, яка працює, маючи на вході лінійку на мові М6 та у відповідності з описанням вихідної форми. Для цього і використовується мова М7, що відноситься до мов рольового типу.

На мал. 3.3 представлено алгоритм прийняття редагуючим процесором рішення про ініціювання тієї чи іншої редагуючої програми.


Висновок.


Ми розглянули основну складову частину інтелектуальних інформаційних систем процедуру аналізу питань на обмеженій природній мові та виведення відповідей на ці питання на віртуальній семантичній сітці.

У цій, так би мовити складовій ІІС можна виділити наступні типи знань:

  • Статичні (постійні) знання. До статичних можна віднести Словник системи, за допомогою якого здійснюється перетворення запиту з обмеженої природної мови на мову семантичних груп.

  • Динамічні (змінні) знання. Динамічної є сама віртуальна семантична сітка на якій здійснюється виведення відповіді на питання. Ця структура будується з частин, які є релевантиними до даного питання, тому для різних запитів вона має різний вигляд.

  • Процедурні знання. Процедурними знаннями є мовні перетворення, які можна ще назвати розмірковуваннями системи.

Література.


  • Ю.Я. Любарский. Интеллектуальные информационные системы. М., «Наука», 1990.

  • Л.С.Выготский Мышление и речь. Избранные психологические исследования. М., Изд-во Академии педагогических наук РСФР, 1956.

 Слово М1, записане в правій частині словникової статті після знаку *, не обов’язково є словом вхідної мови – це може бути штучне слово, яке використовується для кодування словосполучення лише на етапі перетворення вхідної фрази на М2.




Похожие:

Виведення відповідей на питання на iconЛабораторна робота 4 Тема. Перевантаження операторів потокового введення-виведення. Мета роботи: ознайомитись із принципами перевантаження операторів потокового введення-виведення. Теоретичні
Введення-виведення стандартних типів. Для виведення стандартних типів у С++ визначено клас ostream з оператором (float&)
Виведення відповідей на питання на iconНа шляху реформ актуальні питання Сучасної української освіти та змісту виховання
Вони носять певною мірою контроверсійний характер і, сподіваємось, спонукатимуть читача до роздумів та пошуку власних відповідей...
Виведення відповідей на питання на iconПсихологічна адаптація абітурієнтів до зно-2010
Бланка відповідей а (для всіх предметів) І бланка відповідей б (з української мови та літератури й іноземних мов) є обов’язковою...
Виведення відповідей на питання на iconРівень прояву комунікативних нахилів
Обробка матеріалів дослідження проводиться таким чином. За допомогою дешифраторів, які накладаються по черзі на “Бланк відповідей”,...
Виведення відповідей на питання на iconНа виконання завдання відводиться 120 хвилин. Спробуйте власні сили! Правильні відповіді буде оприлюднено на веб-сайті наступного тижня! Завдання 1-15 мають по чотири варіанти відповідей.
Завдання 1-15 мають по чотири варіанти відповідей. У кожному завданні лише одна правильна відповідь. Оберіть правильну відповідь...
Виведення відповідей на питання на iconУкраїнці вважають День Перемоги дійсно великим святом — соціологічне опитування Центру Разумкова
День звичайним святом. Не вважають День Перемоги святом 4,7% респондентів і 1,7% опитаних не змогли відповісти на питання. Розподіл...
Виведення відповідей на питання на iconКарта інтересів: Методика „одані”
Методика складається із трьох бланків: бланк запитань, бланк відповідей, та бланк дешифратора відповідей
Виведення відповідей на питання на iconЗапорізька обласна рада збірник відповідей на запитання міських, селищних, сільських голів, які були отримані 17 червня 2011 року за результатами наради у голови Запорізької обласної ради червень 2011 року Як вирішити питання із придбанням автотранспортних засобів для кожної сільської ради та виплат
Як вирішити питання із придбанням автотранспортних засобів для кожної сільської ради та виплатою коштів на відрядження?
Виведення відповідей на питання на iconРіздвяне інтерв’ю
«Блеск» опублікував інтерв’ю з цим церковним прелатом. Деякі віруючі з Чехії, будучи католиками, були неспокійні з приводу його відповідей...
Виведення відповідей на питання на iconРеферату : Діалогові програми Розділ : Комп'ютерні науки Діалогові програми План. Уведення даних. Виведення даних. Формати виведення. Імітація діалогів. Коментарі
Такий спосіб найпростіший, однак не найкращий, оскільки програми від цього стають не універсальними (немасовими). Ось чому в усіх...
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©gua.convdocs.org 2000-2015
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Документы

Разработка сайта — Веб студия Адаманов