|
Застосування індуктивного моделювання до прогнозування цінУДК 519.237 + 004.896 З досвіду застосування активного індуктивного моделювання до прогнозування цін Ю.В. Дзядик Міжнародний центр інформаційних технологій та систем, проспект академіка Глушкова, 40, Київ iurius@i.com.ua
Вступ Нехай ми будуємо індуктивну модель y = f (t1, t2, …, t l), яка є лінійною відносно базисних функцій {x1, x2, …, xk}, де xi = φ i (t1, t2, …, t l) – деякі функції [1, 7]. Нехай n – розмірність статистики, що використовується. Ми отримуємо вектор y та k векторів {x1, x2, …, xk} у дійсному n вимірному просторі R n. Позначимо X = (x1– μ(x1), x2– μ(x2), …, xk – μ(xk)), де wRn: μ(w) = ![]() Проблема нестабільності у лінійному моделюванні Ми шукаємо форму a лінійної залежності y = Xa, де n вектор y та (n, k) матриця X відомі, k вектор коефіцієнтів a є шуканим. Відомо, що чисто символічний шлях розв’язання формального рівняння y = Xa: y = Xa XTy = XTXa (XTX)–1XTy = a (2) приводить до результату, тотожного з розв’язком, що дає метод найменших квадратів (МНК): a = (XTX)–1XTy. (3) Позначимо квадратну (k, k) матрицю Грама [3] XTX = W. Нехай {λ1, λ2,… λk} – впорядкована множина власних значень W, занумерованих так, що λ1 λ2 ... λk. Нагадаємо, що для будь-якої матриці Грама всі власні значення λi дійсні та невід’ємні: λi 0 i. Нагадаємо, що тоді det W = λ1 λ2… λk ; trace W = λ1 + … + λk; cond W = λ1 (λ k)–1; (4) причому c: cond cW = cond W, де cond W = ||W|| ||W–1|| – число обумовленості, || || – будь-яка “розумна” норма, c – довільна константа. Тепер дослідимо вираз (3): a = W–1XTy. Він не має сенсу, якщо det W = 0 λk = 0 cond W = . Більш того, якщо cond W є близьким до нескінченності, тобто найменше власне значення λk є близьким до нуля, то рішення y = Xa є нічого не вартим для екстраполяції чи прогнозування [2]. Це очевидно з добре відомого частинного випадку: точна поліноміальна інтерполяція, яка є розв’язком деякого матричного рівняння вигляду y = Xa, не має сенсу за межами інтервалу інтерполяції. Визначимо міру стабільності матриці X як stab X = k λk Tr (XTX)–1 = k λk (λ1 + λ2 + … + λk)–1 . (5) Очевидно, для довільної матриці X та константи c мають місце властивості: 0 stab (X) 1; c: stab (cX) = stab (X); stab (X) cond (XTX) = k λ1 (λ1 + … + λk) –1 . (6) Тоді з (6) та нерівностей 1 (λ1 + λ2 + … + λk) / λ1 k отримуємо: 1 stab (X) cond (XTX) k stab X [cond (XTX)] –1. (7) Тепер ми готові підійти до головної проблеми – як уникнути безглуздості, беззмістовності, нікчемності моделі y = Xa поза межами області, у якій вона була побудована? ^ Приведемо матрицю Грама XTX = W ортогональним перетворенням S до такого діагонального вигляду STWS = D, що dii = λi, λ1 λ2 ... λk. Тоді вектори (стовпці) матриці XS = Z = (z1, z2, …, zk) називаються факторами X. Зауважимо, що i: μ(zi) = 0, отже, {i, y, c}: y + c, zi = y, zi. Позначимо через L лінійну оболонку вектор-стовпців матриці X: L = L (x1– μ(x1), x2– μ(x2), …, xk – μ(xk)). (8) За побудовою, перші ненульові фактори {z1, z2, …, zp}, де p = dim L = rank X min (k, n), утворюють ортогональний базис простору L. Отже, довільна лінійна модель ŷ (x1, x2, …, xk) застосуванням перетворення ![]() ŷ = y0 + y1 z1 + y2 z2 + … + yp zp, (9) де yi = ![]() Далі, визначимо для кожного фактора zi дві характеристики: стабільність stab (zi) та суттєвість essn (y, zi) stab (zi) = ![]() essn (y, zi) = corr2 (y, zi) = ![]() де corr (y, zi) = cos (y – y0, zi), тобто corr (y, zi) = ![]() Назвемо (β, γ) редукцією моделі ŷ за допомогою (β, γ)-методу двох порогів (МДП), таку діагональну проекцію P моделі (9), diag P = (s1, s2, …, sp) ŷs = y0 + s1 y1 z1 + s2 y2 z2 + … + sp yp zp, (14) де si = si (β, γ) = 0, якщо stab (zi) < β або essn (y, zi) < γ, та si = 1 для всіх інших факторів. Іншими словами, (β, γ) редукція є викреслювання всіх β нестабільних та γ несуттєвих факторів. Якщо γ = 0, то (β, 0) редукцію будемо називати β стабілізацією. Очевидно, для кожного β > 0 існує таке число j N, що всі β стабільні фактори – це просто підмножина перших j факторів {z1, z2, …, zj}. Принцип стабілізації у лінійному моделюванні Нагадаємо, що простір L визначено формулою (8). Нехай ^ – довільний підпростір L, P – відповідна проективна матриця, так що XP – це проекція X на підпростір V. Ми можемо вище замінити матрицю X матрицею XP та застосувати всі визначення: cond (PTWP), stab (XP) тощо. Нехай XPS = U = (u1, u2, …, uw) – фактори матриці XP. Визначимо стабільність, суттєвість та достатність підпростору ^ як stab (V) = min {stab (v): vV} = min {stab (ui): ui U} = stab (uw); (15) essn (y, V) = min {essn (y, v): vV} = min {essn (y, ui): ui U}; (16) suff (y, V) = ![]() Будемо говорити, що підпростір V є: β стабільним, якщо stab (V) > β; γ суттєвим, якщо essn (V) > γ; δ достатнім, якщо suff (y, V) > 1– δ. Якщо β, γ чи δ є фіксованими, ми будемо говорити, що підпростір V є просто стабільним, суттєвим чи достатнім. Як правило, неявні значення є: β = 10 3, γ = 10 4, δ = 5%. Нехай σ = {i1, i2, …, iσ} – деяка підмножина у K = {1, 2, …, k}. Позначимо через V(σ, X), V(σ, Z) лінійну оболонку векторів-стовпців {xi – μ(xi): iσ} та {zi: iσ} відповідно. Гіпотеза. Сутність МГУА полягає у проектуванні простору L на такий стабільний та суттєвий підпростір V(σ, X), який є найбільш достатнім. Загальним (β, γ)-методом, або принципом стабілізації, ми назвемо пошук розв’язку наступної оптимізаційної задачі. Нехай задано деяку множину ![]() ![]() {stab (V) > β} & {essn (y, V) > γ} & {suff (y, V) = max} & {V ![]() Приклади множин ![]() (a) ![]() (b) ![]() (c) ![]() ^ Якщо ми не знайшли достатньо показників { t1, t2, …, t l }, від яких залежить прогнозована величина y, то ніякий метод не дасть задовільного прогнозу. Отже, (β, γ)-метод двох порогів (МДП) лише відсіє нестабільні та несуттєві (зайві) змінні і забезпечить, що модель y = Xa буде стабільною. Але точність моделі не може бути більшою, ніж максимальна достатність серед стабільних підпросторів у 2L. Другою частиною циклу є абсорбція (поглинання) релевантних змінних (показників, в термінах економіки) у інформаційному просторі (як правило, у базах даних в Інтернет). Ця частина індуктивного моделювання має справу з такими термінами, як побудова інтелектуальних агентів (constructing intelligent agents, CIA) [8], штучний інтелект, мультиагентні системи (МАС) тощо. Більшість з цих тем ще не входять до теорії індуктивного моделювання. Дамо кілька початкових визначень. ^ – модель, яка шукає усі релевантні показники (t1, t2, …, t l), що необхідні для її функціонування (та статистику цих показників) у інформаційному просторі (як правило, в Інтернет). ^ – модель, яка провадить пошук у Інтернет за допомогою інтелектуальних пошукових агентів. Синонім: активна інтелектуальна модель. Активне прогнозування є прогнозування за допомогою активної інтелектуальної моделі. ^ Метод двох порогів був успішно застосований до моделювання та прогнозування цін на феромолібден (FeMo) та молібден (Mo). Особливий інтерес викликало прогнозування місячних цін у 2004–07, коли вони надзвичайно швидко змінювались. У 2004 році деякі часописи, які багато десятиліть надавали інформацію про FeMo та Mo ціни, перестали публікувати цю інформацію. Навіть можливість будь-якого прогнозування цін при таких початкових даних ставилася під сумнів. Нами для місячного прогнозування цін на молібден у 2005-07, у Інтернет (після чотирьох циклів абсорбції та редукції) було вибрано 9 показників: t1, t2 – ціни на експорт та імпорт молібдену, обчислені на підставі даних у таблицях [4], стовпці “Exports” та “Imports”, ряд “Molybdenum”, t3 – ціни на імпорт міді, аналогічно t1, t2 обчислені з таблиць [4] t4, t5, …, t 9 – ціни на сталь, взяті з [5]. Прогнозування цін на молібден ($/кг) у 2005-07 рр. за допомогою різних методів: МДП (стовпець 4), МГУА критерій Акаіке (5), МГУА регулярний критерій (6), прогноз зміни ціни за МДП (7, 8), та рекомендації плану закупок за прогнозом МДП: на скільки місяців (9) та на яку суму (10) Табл. 1.
З показників {t1, t2, …, t 9} ми утворюємо залежну змінну y(τ) та k = 12 вхідних змінних {x1, x2, …, x12}: y (τ) = t1(τ+1); x1(τ) = t1(τ), x2(τ) = t1(τ–1), x3(τ) = t1(τ-2), x4(τ) = t2(τ), x5(τ) = t2(τ-1), xi(τ) = ti–3(τ), i = 6..12. Для отримання прогнозів використовувалося декілька алгоритмів. Для усіх алгоритмів спільним є прогнозування методом ковзного вікна на місяць наперед: ми вибираємо значення вхідних змінних {x1(t), x2(t), …, xk(t)} для M послідовних значень часу t = q+1, q+2,…, q+M, та обраховуємо прогнозоване значення величини y(t) у (M+1)-й точці t = q+M+1. Величина q приймає значення, виходячи з умов 3 ≤ q+1 ≤ t ≤ q+M+1 ≤ 39, звідки отримуємо 2 ≤ q ≤ 38–M . У більшості випадків ми покладали M = 21, але для порівняння якості прогнозу вибирали й інші значення. Отримуємо наступні результати (табл. 1 та рис. 1). ![]() Рис.1.Результати моделювання цін на молібден Інший приклад базується на медичних даних з Motol hospital у Празі. Ці дані надав P. Kordik для порівняння (β, γ)-методу з результатами [6], які були отримані за допомогою методу GAME (Group of Adaptive Models Evolution). Табл. 2. Порівняння (β, γ)-методу (стовпець MTT) з МГУА (стовпці GMDH) та GAME на прикладах прогнозування цін на молібден (ряд Mo) у 2005-07 та прогнозу вмісту CO2 у мозку (ряд CO2): СКВ помилки передбачення
Дані з табл. 2 та порівняння графіків на рис. 2 демонструють перевагу МДП перед МГУА та GAME [6]. Варто відзначити, що GAME вимагає велетенську навчальну вибірку (декілька сот спостережень) [6], водночас для МДП (як і для МГУА) досить 10 20 спостережень. У таблиці 2 наведено середньоквадратичне відхилення помилки передбачення. ![]() Рис. 2. Графіки фактичних цін на молібден (лінія “fact”) та прогнозних значень, обчислених за МДП (лінія “Praha”) та МГУА (лінії “FPE” та “AR”) ^ Нехай y – ціна деякого товару (чи, більш загально, блага). Можна купувати цей товар щомісяця за ринковою ціною yi, тоді видатки будуть дорівнювати Z0 = ni=1 yi. Наприкінці періоду можна визначити найменшу ціну ymin = min ni=1 yi. Очевидно, видатки на придбання товару не могли бути меншими за Zmin = n ymin. Якщо ми будуємо прогноз за методом m (method), ми можемо за деяким правилом w (way) використати цей прогноз для планування закупок. Тоді ми можемо підрахувати відповідні видатки Zm,w : Zm,w = ![]() де pi (m, w) – кількість товару, придбаного у i му місяці, застосовуючи метод прогнозування m та спосіб використання прогнозу для планування закупок w. Можна запропонувати кілька різних економічних критеріїв. Наприклад, відносний критерій ![]() Покажемо, що для рекомендацій закупок молібдену згідно МДП, наведених у стовпцях 9-10 табл. 1, цей критерій дорівнює біля 68%. Проведемо разрахунки. pmin = 66,29, отже, Zmin = n pmin = 17 (міс) 66,29 ($/кг/міс) = 1126,93 ($/кг). Z0 = 1269,82 ($/кг), Zm,w = 1171,66 ($/кг) ![]() Нехай деякий завод щомісяця використовує Q = 20 тон молібдену. Якщо він застосовує прогноз цін за (β, γ)-методом (стовпець 4 таблиці 1) та відповідні рекомендації (стовпці 9, 10) для прийняття рішення про величину закупок для формування стратегічного запасу, то за період з жовтня 2005 по лютий 2007 (17 місяців) абсолютна економія цього заводу порівняно із щомісячними закупками за ринковими цінами (стовпець 3) склала б (Z0 – Zm,w) Q = (1269,82 – 1171,66) $/кг 20 000 кг = 98,16 20 000 $, що дорівнює 1 963 200 $, тобто майже два мільйони доларів. Посилання
Індуктивне моделювання складних систем, 2009 р |
![]() | Прогнозування цін Міжнародний науково-навчальний центр інформаційних технологій І систем нан та мон україни | ![]() | Модульна робота з дисципліни «Методи аналізу та прогнозування розвитку територіальної громади» Моделювання – один з ефективних підходів до рішення політичних проблем високого рівня складності, який заснований на комбінації кількісних... |
![]() | З досвіду прогнозування цін на метали та паливо Дзядик Юрій Владиславович, к ф-м н., с н. с Міжнародний науково-навчальний центр інформаційних технологій І систем нан та мон україни | ![]() | Положення про спеціалізований навчальний кабінет моделювання та прогнозування стану довкілля Матеріально-технічна база й методична система кабінету є комплексом спеціалізованого обладнання відповідно до вимог десту І типового... |
![]() | 3 8 Моделювання гідрометеорологічного режиму рослинного покриву Познати закономірності перетворень і біологічних трансформацій в системі та дію антропогенного впливу можна за допомогою математичного... | ![]() | 3 7 Моделювання розвитку хвороб та шкідників сільськогосподарських культур Метою курсу «Моделювання розвитку хвороб та шкідників сільськогосподарських культур» є освоєння студентами основних принципів моделювання... |
![]() | 2 2 Моніторинг забруднення ґрунтово-рослинного покриву Курс «Моніторинг забруднення ґрунтово-рослинного покриву» Курс є теоретичною основою для екологічної оптимізації агроландшафтів та моделювання, оцінки та прогнозування забруднення рослинницької... | ![]() | Закон україни про ціни І ціноутворення Закон введено в дію з 1 січня 1991 року Постановою Верховної Ради Української рср від 3 грудня 1990 року n 508-xii Україна згідно з Декларацією про державний суверенітет України та Законом України "Про економічну самостійність України" самостійно... |
![]() | Забезпечення якості навчання: моделювання та організація всіх учасників навчально-виховного процесу на позитивний результат У забезпеченні якості навчального моделювання покладено ідею підтримання й розвитку природної обдарованості, здібностей кожного учня... | ![]() | Удк 316. 334. 55: 338. 431. 2 Дослідження сучасного стану сільських територій: підходи, алгоритми, методи Акцентується увага на потенціалі застосування геоінформаційно-картографічного моделювання станів, масштабів і тенденцій змін сільських... |