Производные скалярной, векторной и матричной функций по векторному аргументу
Рассмотрим скалярную (числовую) функцию нескольких переменных . Упорядоченный набор переменных будем называть векторным аргументом этой функции и обозначать . Первый дифференциал функции имеет вид:
(6.1)
Сумму в правой части можно представить как произведение строки на столбец , либо как произведение строки на столбец .
Матрица-строка или матрица-столбец определяют производную скалярной функции по векторному аргументу (градиент скалярной функции). Двойственность определения относится только к форме записи, поскольку векторный аргумент функции можно считать столбцом (в этом случае дифференциал — столбец) или понимать как строку. В любом случае для первого дифференциала получаем одно и то же выражение (6.1).
Второй дифференциал функции имеет вид
(6.2)
Обозначим через матрицу частных производных второго порядка (матрицу Гессе). Тогда правую часть (6.2) можно записать в виде произведения
Замечания 6.1
1. Для записи производных можно использовать символические векторы (столбцы или строки):
При этом дифференцирование функции формально записывается как умножение функции на символический вектор производных. Например, градиент функции есть произведение вектора на функцию , а матрица Гессе есть произведение символической матрицы
на функцию .
2. Определитель матрицы Гессе называется гессианом.
3. Свойства градиента функции и матрицы Гессе используются в методах поиска экстремума функции.
Пример 6.2. Найти первую и вторую производные сложной функции , применяя матричные обозначения.
Решение. Находим производные функции , заменяя суммирование операциями умножения соответствующих матриц:
Сравним матричную форму записи этих производных с производными в случае скалярной функции
Выражения для первой производной совпадают, а для второй производной -отличаются незначительно, причем полное совпадение будет, если учесть, что для скалярной величины .
Производные векторной функции по векторному аргументу
Пусть задан столбец функций нескольких переменных (говорят, что задана вектор-функция векторного аргумента). Первый дифференциал вектор-функции имеет вид:
Обозначим через матрицу частных производных первого порядка заданных функций (матрицу Якоби). Тогда выражение для первого дифференциала можно записать в виде , т.е. — производная вектор-функции векторного аргумента.
Как и в случае с аргументом , упорядоченный набор функций можно считать не матрицей-столбцом, а матрицей-строкой . Этот случай сводится к предыдущему, учитывая, что операции дифференцирования и транспонирования можно выполнять в любом порядке, так как (здесь и далее аргумент для упрощения записи опущен). Поэтому из равенства получаем
, где
— транспонированная матрица Якоби вектор-функции .
Заметим, что из равенства следует правило транспонирования производных вектор-функции: .
Правила дифференцирования по векторному аргументу
Векторный аргумент , его приращение считаем матрицами-столбцами размеров .
1. Первый дифференциал скалярной функции имеет вид:
где — градиент функции, а .
2. Второй дифференциал скалярной функции имеет вид
где — матрица Гессе.
3. Первый дифференциал вектор-функции {матрицы-столбца) имеет вид:
, где — матрица Якоби.
Первый дифференциал матрицы-строки: .
4. В частном случае, когда , получаем
, где — единичная матрица n-го порядка.
5. Числовую матрицу (соответствующих размеров) можно выносить за знак производной:
Последняя формула следует из правила транспонирования производных:
6. Производные суммы, разности и произведения вектор-функций и одинаковых размеров
Докажем, например, последнее равенство. Найдем частную производную скалярной функции по переменной
Тогда первый дифференциал функции имеет вид
Запишем это выражение, используя матричные обозначения
Сравнивая полученное выражение с , приходим к равенству , что и требовалось доказать.
7. Производная сложной функции , где и вычисляется по формуле:
или, опуская аргументы, .
Действительно, запишем первый дифференциал вектор-функции: . Заметим, что матрицы Якоби в правой части формулы согласованы: матрица имеет размеры , матрица . Найдем, используя обычные правила дифференцирования, частную производную . В правой части стоит произведение i-й строки матрицы на j-й столбец матрицы , что и требовалось показать.
Использование матричных обозначений позволяет записывать и применять правила дифференцирования по векторному аргументу аналогично правилам дифференцирования в скалярном случае. Например, правило 7 дифференцирования сложной вектор-функции формально совпадает с обычным "цепным" правилом дифференцирования скалярной сложной функции одной переменной. Разумеется, что формальное совпадение правил становится фактическим в скалярном случае, когда все матрицы имеют размеры .
Пример 6.3. Применяя правила дифференцирования по векторному аргументу, найти производные следующих функций:
а) ; б) ; в) ; г) ; д) ,
где — квадратная числовая матрица n-го порядка; — столбцы размеров , причем столбец числовой.
Решение. а) Вынося постоянный множитель (матрицу-строку) по правилу 5 и учитывая правило 4, получаем:
б) Учитывая, что величина скалярная, т.е. , получаем . Заметим, что .
в) По правилам 4 и 5 находим: .
г) По правилам 4 и 5 находим: .
д) Представляя скалярное выражение как произведение строки на столбец , по правилу 6 (где ) получаем
с учетом правила транспонирования производных
Учитывая результат п. "б", имеем .
Замечания 6.2
1. В некоторых областях прикладной математики, например, в методах оптимизации и теории управления, часто используются другие соглашения, совпадающие с изложенными с точностью до операции транспонирования. Производная (градиент функции ) считается матрицей-столбцом, а производная — матрицей-строкой:
Тогда соответствующие формулы дифференцирования, аналогичные полученным в примере 6.3, имеют вид:
2. Если матрица Якоби квадратная , то ее определитель называется якобианом.
3. След матрицы Якоби (при ) определяет
дивергенцию вектор-функции векторного аргумента .
Производные матричной функции по векторному аргументу
Рассмотрим функциональную матрицу , элементами которой служат функции векторного аргумента . Дифференциал этой функции имеет вид
где — частная производная матрицы по одной переменной. Совокупность частных производных (градиент функциональной матрицы) представляет объект, элементы которого нумеруются тремя индексами: номер строки, номер столбца и номер переменной дифференцирования. Поэтому заменить операцию суммирования в правой части формулы операцией умножения матриц в данном случае не представляется возможным. Необходимо вводить другие объекты — тензоры и операции над ними. Поясним формальную сторону получения удобных формул дифференцирования на примере функциональных матриц. Примем следующие правила индексирования:
1) элементы матрицы обозначаются , где — номер строки, а — номер столбца. В частности, — матрица-столбец (или просто столбец), а — матрица-строка (или просто строка);
2) частную производную функции (скалярной, векторной или матричной) по переменной будем обозначать, приписывая нижний индекс в скобках: ;
3) если в произведении одинаковые индексы встречаются сверху и снизу, то по ним производится суммирование (хотя знак суммы не указывается). Например, если — матрица размеров , — столбец размеров , — строка размеров , то
т.е. — i-й элемент столбца , — j-й элемент строки , — число .
Применяя эти соглашения, запишем дифференциалы:
— скалярной функции: ;
— вектор-функции (функции-столбца): ;
— функциональной матрицы , где — частная производная первого порядка элемента функциональной матрицы по переменной .
Одним из преимуществ принятых соглашений является получение простого вида формул. Другие преимущества раскрываются и используются в тензорном анализе.
Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.
|