,
,
?
Вы уверены? А насколько? Удобнее строить распознающий
алгоритм, вычисляющий для каждой точки пространства признаков
вероятности (в смысле: степень уверенности) того, что эта точка
принадлежит каждому из классов, т.е. реализующий отображение F из
пространства признаков Rd в единичный куб в пространстве
Rq. Желаемые значения F в точках пространства признаков,
соответствующих обучающему множеству, известны, так что остается
только построить в некотором смысле аппроксимирующее отображение.
Качество аппроксимации будет проверяться не на всей области
определения, а только на тестовом множестве.
Интерпретацией вычисленных вероятностей занимается отдельная от
распознавания процедура принятия решений, которая строится вручную
и не зависит ни от природы входных объектов, ни от пространства
признаков, ни от обучающих данных. Она зависит только от того, для
чего эта система распознавания предназначена. Например, если она
используется как безответственная гадалка, то она просто выдает
номер наиболее вероятного класса. Если она используется как
ответственная гадалка, то она выдает номер наиболее вероятного
класса, если его вероятность существенно больше вероятностей других
классов, и отвечает "не знаю" в противном случае. Если она
используется для генерации гипотез, то она выдает номера
нескольких (например, пяти) наиболее вероятных классов и их
вероятности.
В дальнейшем обсуждается только обучаемая часть системы
распознавания, т.е. отображение F.
Как правило отображение F ищут в каком-либо фиксированном, но
достаточно большом классе отображений, параметризованных некоторым
параметром, т.е. распознающий алгоритм - это вектор-функция двух
векторных
переменных Y=F(W,X), где X - d-мерный вектор признаков, Y -
q-мерный вектор вероятностей, а W - параметр. Как правило параметр
тоже является вектором в евклидовом пространстве, причем очень
многомерном (порядка тысяч), а функция F - непрерывна и даже
дифференцируема. Обучение распознающей системы - это (опять же, как
правило, но не всегда) подбор
хорошего значения параметра W. В каком смысле и в какой степени
хорошего - предмет многочисленных научных работ и экспериментов с
системами распознавания. Канонического универсального алгоритма
обучения нет.
Пусть X1,...,XN - d-мерные вектора признаков объектов
обучающего множества, Y1,...,YN - соответствующие им
q-мерные вектора вероятностей (обычно эти вектора -
базисные, т.е. все координаты каждого равны 0 кроме некоторой
одной, равной 1). Вектора признаков можно считать независимыми одинаково
распределенными случайными величинами. Распределение этих случайных величин
заранее неизвестно, но оно существует и позволяет говорить о вероятностях.
Хорошо бы, чтобы распознающая функция F(W,·) хорошо приближала
"правильное распознавание" X ® Y по вероятностной мере,
т.е. чтобы вероятность большого отклонения - достаточно большого, чтобы
получить неправильный ответ при распознавании, - F(W,·) от этого
заданного на обучающем множестве отображения была мала. Но обучать хорошему
приближению по неизвестной вероятностной мере довольно трудно, поэтому чаще
идут следующим более простым путем.
Пусть E - некоторая функция ошибки, т.е. неотрицательная
функция пары q-мерных векторов, равная нулю на парах равных векторов
(например, какое-либо расстояние между векторами или какая-то степень этого
расстояния). Тогда обучение распознающей системы - это поиск значения
Wm параметра W, минимизирующего среднюю ошибку на обучающем множестве
|
| (1) |
|
|
| (2) |
| (3) |
|
|
|
|
|
|
|
|
|
|
|
|
| (4) |
|
| (5) |
|
|
|
|
|
|
|
|
|
| |||||||||||||||
|
|
| |||||||||||||||
|
|
| |||||||||||||||
|
|
|
|
|
|
| (6) | |||||||||||||||||
|
|
| (7) | |||||||||||||||||
|
|
| (8) |
| (9) |
|
| (10) |
|
|
|
| |||||||
|
|
| |||||||
|
|
|
|
|
|
| (11) |
|
|
|
|
| (12) | ||||||||
|
|
|
|
|
|
| |||||||||
|
|
|
|
|
|
| |||||||||||||
|
| ||||||||||||||
|
|
|
|
| |||||||
|
| ||||||||
|
|
| |||||||
|
| ||||||||
|
|
| |||||||
|
|
|
|
|
| (13) | ||||||||||||
| ||||||||||||||
|
|
| (14) |
| (15) |
| (16) |
|
|
|
| (17) |
|
| (18) |
|
|
|
|
| (19) |
|
|
| (20) | ||||||||||
|
|
|
|
| ||||||||||
|
|
|
| (21) | ||||||||||
|
|
|
| (22) | ||||||||||||
| ||||||||||||||
|
|
|
| (23) | ||||||||||
|
|
|
|
| ||||||
|
|
|
| ||||||
| |||||||
|
|
|
| (24) | ||||||||
| ||||||||||
|
|
| (25) |
| (26) |
|
|
| (27) | ||||||||||
| ||||||||||||
|
|
| |||
|
|
|
| (28) |
| (29) |
| (30) |
|
|
| |||||||
|
| ||||||||
|
|
| |||||||
|
|
| (31) |
| (32) |
|
|
| |||||||
|
|
|
|
| (33) |
| (34) |
| (35) |
|
|
| |||||||
|
| ||||||||
|
|
| |||||||
|
| ||||||||
|
|
| |||||||
|
|
| |||||||
|
| ||||||||
|
|
|
|
|
|
| |||||||||||||||||
|
|
| (36) |
|
|
| |||||||||||||
|
| ||||||||||||||
|
| ||||||||||||||
|
| ||||||||||||||
|
| ||||||||||||||
|
| ||||||||||||||
|
|
|
|
|
|
|
| (37) | |||||||||||||||
|
|
| (38) | |||||||||||||||
|
|
| (39) |
|
|
| |||||||
|
|
| |||||||
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
| (40) |
|
| (41) |
| (42) |
|
|
| |||||||||||||||||||||||
|
| ||||||||||||||||||||||||
|
| ||||||||||||||||||||||||
|
|
|
|
|
|
| |||||||||||||||||||||||||
|
|
|
|
| (43) |
|