Класифікація - це інфраструктура
Кожна система, що діє в умовах невизначеності, спирається на шар класифікації, який визначає, що вона взагалі може представити, а отже й зробити. Ці шари поводяться як інфраструктура - вбудовані, прозорі, конститутивні, стійкі до змін, - тож найважливіші проєктні рішення в інтелектуальних системах таксономічні, а не алгоритмічні.
Джейк Лоуренс · Незалежний дослідник · Позиційна стаття · STS / Архітектура систем
Категорії - це не риштування, а несучі стіни
Шар класифікації визначає, що система може представити, а отже як вона може поводитися. Покращувати алгоритм означає шукати лише в межах простору, який задала таксономія; розширити цей простір може тільки перегляд самої таксономії. Звідси центральне твердження: таксономічна прихильність - першокласне проєктне рішення зі структурними наслідками.
Бовкер і Стар у «Sorting Things Out» (1999) показали вісім властивостей інфраструктури: вбудованість, прозорість, охоплення, засвоєне членство, звʼязок із практикою, втілення стандартів, успадкована база і видимість при поломці. Класифікаційні шари мають їх усі - і саме тому вони водночас невидимі й заблоковані.
Три випадки, один патерн
Той самий структурний патерн зʼявляється у трьох радикально різних доменах. DSM - «тверда» інфраструктура: діагностичні категорії тримаються десятиліттями попри відому наукову неадекватність, бо вартість заміни суспільна (одна категорія депресії накриває 1030 унікальних профілів симптомів; поріг - пʼять із девʼяти симптомів за два тижні; DSM-III Спіцера 1980 року оптимізував надійність, а не валідність; кращі альтернативи - RDoC, HiTOP - не можуть витіснити встановлену базу).
LLM-QP - «мʼяка» інфраструктура: пʼять фізичних планів реалізують одну логічну операцію DecodeStep, і планувальник не може знайти оператор, якого немає в його решітці, хоч би яка досконала була модель вартості. SAGEN - «середня»: з 20 оцінених вимірів інформації 16 потребують явної архітектурної підтримки - жодне покращення базової моделі їх не дасть, якщо архітектура їх не представляє. Спектр твердості (мʼяка - середня - тверда) визначається інституційним зчепленням і ефектами петлі.
Парадокс інфраструктури
Класифікація проходить чотирифазний цикл: проєкт, встановлення, прозорість, реіфікація. Що краще таксономія працює, то важче побачити її як таксономію: прозорість породжує реіфікацію - інструмент стає невидимим, а світ, який він конструює, плутають зі світом, яким він є.
Це не провал пильності, а наслідок визначальної властивості інфраструктури: щоб працювати, вона має бути прозорою; щоб бути прозорою, має стати невидимою; щоб стати невидимою, має перестати відчуватися як вибір. Тут діє і «петля» Гекінга (interactive kinds): у доменах з людьми категорії і класифіковані співконституюють одне одного - DSM не лише описує розлади, а частково їх творить.
Що з цим робити: проєктування проти реіфікації
Якщо таксономія несуча, то ставитися до неї треба як до першокласного, задокументованого рішення. Будувати механізми проти реіфікації: модульні адаптери (домен-патерн SAGEN змушує явно обирати категорії), формальні докази еквівалентності (план-решітка LLM-QP робить свою умовність видимою), явні метадані впевненості.
Проєктувати шарувату таксономічну архітектуру, що відділяє глибоку інфраструктуру (важко переглянути) від поверхневого доменного вмісту (створеного, щоб його переглядали), і закладати «таксономічний борг» у бюджет так само, як технічний борг. Сенс не в тому, що краща таксономія розвʼязує важкі задачі, а в тому, що невпізнавання таксономій як таксономій лишає системи в пастці просторів, чиїх країв вони не бачать.
Категорії - не риштування, а несучі стіни. Перший крок до кращих систем - побачити стіни такими, якими вони є: визнати таксономію проєктним рішенням зі структурними наслідками, а не нейтральним описом.
Повний виклад восьми властивостей інфраструктури за Бовкером і Стар, три розгорнуті кейси (DSM, LLM-QP, SAGEN), кросс-кейсовий аналіз спектра твердості, інтерактивні демонстрації патерну і наслідки для проєктування доступні в англомовній версії.
Відкрити повну версію (англійською) →