Принцип наименьшего действия. "наименьшего действия принцип" в книгах

Принцип наименьшего действия.
Принцип наименьшего действия. "наименьшего действия принцип" в книгах

Знаете ли Вы, что такое мысленный эксперимент, gedanken experiment?
Это несуществующая практика, потусторонний опыт, воображение того, чего нет на самом деле. Мысленные эксперименты подобны снам наяву. Они рождают чудовищ. В отличие от физического эксперимента, который является опытной проверкой гипотез, "мысленный эксперимент" фокуснически подменяет экспериментальную проверку желаемыми, не проверенными на практике выводами, манипулируя логикообразными построениями, реально нарушающими саму логику путем использования недоказанных посылок в качестве доказанных, то есть путем подмены. Таким образом, основной задачей заявителей "мысленных экспериментов" является обман слушателя или читателя путем замены настоящего физического эксперимента его "куклой" - фиктивными рассуждениями под честное слово без самой физической проверки.
Заполнение физики воображаемыми, "мысленными экспериментами" привело к возникновению абсурдной сюрреалистической, спутанно-запутанной картины мира. Настоящий исследователь должен отличать такие "фантики" от настоящих ценностей.

Релятивисты и позитивисты утверждают, что "мысленный эксперимент" весьма полезный интрумент для проверки теорий (также возникающих в нашем уме) на непротиворечивость. В этом они обманывают людей, так как любая проверка может осуществляться только независимым от объекта проверки источником. Сам заявитель гипотезы не может быть проверкой своего же заявления, так как причина самого этого заявления есть отсутствие видимых для заявителя противоречий в заявлении.

Это мы видим на примере СТО и ОТО, превратившихся в своеобразный вид религии, управляющей наукой и общественным мнением. Никакое количество фактов, противоречащих им, не может преодолеть формулу Эйнштейна: "Если факт не соответствует теории - измените факт" (В другом варианте " - Факт не соответствует теории? - Тем хуже для факта").

Максимально, на что может претендовать "мысленный эксперимент" - это только на внутреннюю непротиворечивость гипотезы в рамках собственной, часто отнюдь не истинной логики заявителя. Соответсвие практике это не проверяет. Настоящая проверка может состояться только в действительном физическом эксперименте.

Эксперимент на то и эксперимент, что он есть не изощрение мысли, а проверка мысли. Непротиворечивая внутри себя мысль не может сама себя проверить. Это доказано Куртом Гёделем.

В мы кратко рассмотрели один из самых замечательных физических принципов - принцип наименьшего действия, и остановились на примере, который, казалось бы, ему противоречит. В данной статье мы разберемся с этим принципом немного подробнее и посмотрим, что происходит в данном примере.

На этот раз нам понадобится чуть больше математики. Однако основную часть статьи я опять постараюсь изложить на элементарном уровне. Чуть более строгие и сложные моменты я буду выделять цветом, их можно пропустить без ущерба для основного понимания статьи.

Граничные условия
Начнем мы с самого простого объекта – шара, свободно двигающегося в пространстве, на который не действуют никакие силы. Такой шар, как известно, двигается равномерно и прямолинейно. Для простоты, предположим, что он двигается вдоль оси

Чтобы точно описать его движение, как правило, задаются начальные условия. Например задается, что в начальный момент времени

шар находился в точке

с координатой

и имел скорость

Задав начальные условия в таком виде, мы однозначно определяем дальнейшее движение шара - он будет двигаться с постоянной скоростью, и его положение в момент времени

будет равно начальному положению плюс скорость, умноженная на прошедшее время:

Такой способ задания начальных условий очень естественен и интуитивно привычен. Мы задали всю необходимую информацию о движении шара в начальный момент времени, и дальше его движение определяется законами Ньютона.

Однако это не единственный способ задания движения шара. Другой альтернативный способ – это задать положение шара в два разных момента времени

Т.е. задать, что:
1) в момент времени

шар находился в точке

(с координатой

);
2) в момент времени

шар находился в точке

(с координатой

Выражение «находился в точке

» не означает, что шар покоился в точке

В момент времени

он мог пролетать через точку

Имеется ввиду, что его положение в момент времени

совпадало с точкой

То же самое относится и к точке

Эти два условия также однозначно определяют движение шара. Его движение легко вычислить. Чтобы удовлетворить обоим условиям, скорость шара, очевидно должна быть

Положение шара в момент времени

будет опять равно начальному положению плюс скорость, умноженная на прошедшее время:

Заметьте, что в условиях задачи нам не потребовалось задавать начальную скорость. Она однозначно определилась из условий 1) и 2).

Задание условий вторым способом выглядит непривычно. Возможно, непонятно зачем вообще может потребоваться задавать их в таком виде. Однако, в принципе наименьшего действия используются именно условия в виде 1) и 2), а не в виде задания начального положения и начальной скорости.

Траектория с наименьшим действием.
Теперь немного отвлечемся от реального свободного движения шара и рассмотрим следующую чисто математическую задачу. Допустим, у нас есть шар, который мы можем вручную перемещать каким угодно способом. При этом нам нужно выполнить условия 1) и 2). Т.е. в промежуток времени между

мы должны переместить его из точки

Это можно сделать совершенно разными способами. Каждый такой способ мы будем называть траекторией движения шара и он может быть описан функцией положения шара от времени

Отложим несколько таких траектории на графике зависимости положения шарика от времени:

Например, мы можем перемещать шарик с одной и той же скоростью, равной

(зеленая траектория). Или мы можем половину времени держать его в точке

А затем с двойной скоростью переместить в точку

(синяя траектория). Можно сперва двигать его в противоположную от

сторону, а затем уже переместить в

(коричневая траектория). Можно двигать его взад и вперед (красная траектория). В общем, можно передвигать его как угодно, лишь бы соблюдались условия 1) и 2).

Для каждой такой траектории мы можем сопоставить число. В нашем примере, т.е. в отсутствии каких-либо сил, действующих на шар, это число равняется общей накопленной кинетической энергии за все время его движения в промежуток времени между

и называется действием.

В данном случае слово «накопленная» кинетическая энергия не очень точно передает смысл. Реально кинетическая энергия нигде не накапливается, накопление используется лишь для вычисления действия для траектории. В математике для такого накопления имеется очень хорошее понятие - интеграл:

Действие обычно обозначается буквой

означает кинетическую энергию. Данный интеграл означает, что действие равно накопленной кинетической энергии шара за промежуток времени от

В качестве примера, давайте возьмем шар массой 1 кг., зададим какие-нибудь граничные условия и вычислим действие для двух разных траекторий. Пусть точка

находится на расстоянии 1 метр от точки

отстоит от времени

на 1 секунду. Т.е. мы должны переместить шар, который в начальный момент времени был в точке

За одну секунду на расстояние 1 м. вдоль оси

В первом примере (зеленая траектория) мы перемещали шар равномерно, т.е. с одинаковой скоростью, которая, очевидно, должна быть равна:

м/с. Кинетическая энергия шара в каждый момент времени равна:

1/2 Дж. За одну секунду накопится 1/2 Дж

с кинетической энергии. Т.е. действе для такой траектории равно:

Теперь давайте шар будем не сразу переносить из точки

А полсекунды придержим его в точке

А затем, за оставшееся время равномерно перенесем его в точку

В первые полсекунды шар покоится и его кинетическая энергия равна нулю. Поэтому вклад в действие этой части траектории также равен нулю. Вторые полсекунды мы переносим шар с двойной скоростью:

м/с. Кинетическая энергия при этом будет равна

2 Дж. Вклад этого промежутка времени в действие будет равен 2 Дж умножить на полсекунды, т.е. 1 Дж

с. Поэтому общее действие для такой траектории получается равно

Аналогично, любой другой траектории с заданными нами краевыми условиями 1) и 2) соответствует некоторое число, равное действию для данной траектории. Среди всех таких траекторий имеется траектория, у которой действие меньше всего. Можно доказать, что этой траекторией является зеленая траектория, т.е. равномерное движение шара. Для любой другой траектории, какой бы хитрой она не была, действие будет больше 1/2.

В математике такое сопоставление для каждой функции определенного числа называется функционалом. Достаточно часто в физике и математике возникают задачи подобные нашей, т.е. на отыскание такой функции, для которой значение определенного функционала минимально. Например, одна из задач, имевших большое историческое значение для развития математики – это задача о бахистохроне . Т.е. нахождение такой кривой, по которой шарик скатывается быстрее всего. Опять, каждую кривую можно представить функцией h(x), и каждой функции сопоставить число, в данном случае время скатывания шарика. Снова задача сводится к нахождению такой функции, для которой значение функционала минимально. Область математики, которая занимается такими задачами называется вариационным исчислением.

Принцип наименьшего действия.
В разобранных выше примерах у нас появились две особые траектории, полученные двумя разными способами.

Первая траектория получена из законов физики и соответствует реальной траектории свободного шара, на который не действуют никакие силы и для которого заданы граничные условия в виде 1) и 2).

Вторая траектория получена из математической задачи нахождения траектории с заданными граничными условиями 1) и 2), для которой действие минимально.

Принцип наименьшего действия утверждает, что эти две траектории должны совпадать. Другими словами, если известно, что шарик двигался так, что выполнялись граничные условия 1) и 2), то он обязательно двигался по траектории, для которой действие минимально по сравнению с любой другой траекторией с теми же самыми граничными условиями.

Можно было бы посчитать это простым совпадением. Мало ли задач, в которых появляются равномерные траектории и прямые линии. Однако принцип наименьшего действия оказывается очень общим принципом, справедливым и в других ситуациях, например, для движения шара в равномерном поле тяжести. Для этого только нужно заменить кинетическую энергию на разность кинетической и потенциальной энергии. Эту разность называют Лагранжианом или функцией Лагранжа и действие теперь становится равно общему накопленному Лагранжиану. Фактически, функция Лагранжа содержит всю необходимую информацию о динамических свойствах системы.

Если мы запустим шар в равномерном поле тяжести таким образом, чтобы он пролетел точку

в момент времени

и прилетел в точку

в момент времени

То он, согласно законам Ньютона полетит по параболе. Именно эта парабола совпадет с траекторий, для которой действие будет минимально.

Таким образом, для тела, двигающегося в потенциальном поле, например, в гравитационном поле Земли, функция Лагранжа равна:

Кинетическая энергия

зависит от скорости тела, а потенциальная - от его положения, т.е. координат

В аналитической механике всю совокупность координат, определяющих положение системы, обычно обозначают одной буквой

Для шара, свободно двигающегося в поле тяжести,

означает координаты

Для обозначения скорости изменения какой-либо величины, в физике очень часто просто ставят точку над этой величиной. Например,

обозначает скорость изменения координаты

Или, иными словами, скорость тела в направлении

Используя эти соглашения, скорость нашего шара в аналитической механике обозначается как

означает компоненты скорости

Поскольку функция Лагранжа зависит скорости и координат, а также может явно зависеть от времени (явно зависит от времени означает, что значение

в разные моменты времени разное, при одинаковых скоростях и положениях шара) то действие в общем виде записывается как

Не всегда минимальное
Однако в конце предыдущей части мы рассмотрели пример, когда принцип наименьшего действия явно не работает. Для этого мы опять взяли свободный шарик, на который не действуют никакие силы и поместили рядом с ним пружинящую стенку.

Граничные условия мы задали такими, что точки

совпадают. Т.е. и в момент времени

и в момент времени

шар должен оказаться в одной и той же точке

Одной из возможных траекторий будет являться стояние шара на месте. Т.е. весь промежуток времени между

он простоит в точке

Кинетическая и потенциальная энергия в этом случае будут равны нулю, поэтому действие для такой траектории также будет равно нулю.

Строго говоря, потенциальную энергию можно взять равной не нулю, а любому числу, поскольку важна разность потенциальной энергии в разных точках пространства. Однако изменение значения потенциальной энергии не влияет на отыскание траектории с минимальным действием. Просто для всех траекторий значение действия изменится на одно и то же число, и траектория с минимальным действием так и останется траекторией с минимальным действием. Для удобства, для нашего шара мы выберем потенциальную энергию равной нулю.

Другой возможной физической траекторией с теми же граничными условиями будет траектория при которой шарик сначала летит вправо, пролетая точку

в момент времени

Затем он сталкивается с пружиной, сжимает ее, пружина, распрямляясь, отталкивает шарик обратно, и он опять пролетает мимо точки

Можно подобрать скорость движения шара такой, чтобы он, отскочив от стенки, пролетел точку

точно в момент

Действие при такой траектории будет в основном равно накопленной кинетической энергии во время полета между точкой

и стенкой и обратно. Будет какой-то промежуток времени, когда шарик сожмет пружину и его потенциальная энергия увеличится, и в этот промежуток времени потенциальная энергия внесет отрицательный вклад в действие. Но такой промежуток времени будет не очень большим и сильно действие не уменьшит.

На рисунке нарисованы обе физически возможные траектории движения шара. Зеленая траектория соответствует покоящемуся шару, в то время как синяя соответствует шару, отскочившему от пружинящей стенки.

Однако минимальным действием обладает только одна из них, а именно первая! У второй траектории действие больше. Получается, что в данной задаче имеются две физически возможных траектории и всего одна с минимальным действием. Т.е. в данном случае принцип наименьшего действия не работает.

Стационарные точки.
Чтобы понять в чем тут дело, давайте отвлечемся пока от принципа наименьшего действия и займемся обычными функциями. Давайте возьмем какую-нибудь функцию

и нарисуем ее график:

На графике я отметил зеленым цветом четыре особенных точки. Что является общим для этих точек? Представим, что график функции – это реальная горка, по которой может катиться шарик. Четыре обозначенных точки особенны тем, что если установить шарик точно в данную точку, то он никуда не укатится. Во всех остальных точках, например, точке E он не сможет устоять на месте и начнет скатываться вниз. Такие точки называют стационарными. Нахождение таких точек является полезной задачей, поскольку любой максимум или минимум функции, если она не имеет резких изломов, обязательно должен являться стационарной точкой.

Если точнее классифицировать данные точки, то точка A является абсолютным минимумом функции, т.е. ее значение меньше, чем любое другое значение функции. Точка B – не является ни максимумом, ни минимумом и называется седловой точкой. Точка С называется локальным максимумом, т.е. значение в ней больше, чем в соседних точках функции. А точка D – локальным минимумом, т.е. значение в ней меньше, чем в соседних точках функции.

Поиском таких точек занимается раздел математики, называемый математическим анализом. По другому его еще иногда называют анализом бесконечно малых, поскольку он умеет работать с бесконечно малыми величинами. С точки зрения математического анализа стационарные точки обладают одним особенным свойством, благодаря которому их и находят. Чтобы понять, что это за свойство, нам нужно понять, как выглядит функция на очень малых расстояниях от этих точек. Для этого мы возьмем микроскоп и посмотрим в него на наши точки. На рисунке показано как выглядит функция в окрестности различных точек при различном увеличении.

Видно, что при очень большом увеличении (т.е. при очень малых отклонениях x) стационарные точки выглядят абсолютно одинаково и сильно отличаются от нестационарной точки. Легко понять в чем заключается это отличие – график функции в стационарной точке при увеличении становится строго горизонтальной линией, а в нестационарной – наклонной. Именно поэтому шарик, установленный в стационарной точке, не будет скатываться.

Горизонтальность функции в стационарной точке можно выразить по другому: функция в стационарной точке практически не меняется при очень малом изменении своего аргумента

Даже по сравнению с самим изменением аргумента. Функция же в нестационарной точке при малом изменении

меняется пропорционально изменению

И чем больше угол наклона функции, тем сильнее меняется функция при изменении

На самом деле, функция при увеличении становится все больше похожа на касательную к графику в рассматриваемой точке.

На строгом математическом языке выражение «функция практически не меняется в точке

при очень малом изменении

» означает, что отношение изменения функции и изменения ее аргумента

стремится к 0 при

стремящемся к 0:

$$display$$lim_{∆x to 0} frac {∆y(x_0)}{∆x} = lim_{x to 0} frac {y(x_0+∆x)-y(x_0)}{∆x} = 0$$display$$

Для нестационарной точки это отношение стремится к ненулевому числу, которое равно тангенсу угла наклона функции в этой точке. Это же число называют производной функции в данной точке. Производная функции показывает, насколько быстро меняется функция около данной точки при небольшом изменении ее аргумента

Таким образом, стационарные точки – это точки, в которых производная функции равна 0.

Стационарные траектории.
По аналогии со стационарными точками можно ввести понятие стационарных траекторий. Вспомним, что у нас каждой траектории соответствует определенное значение действия, т.е. какое-то число. Тогда может найтись такая траектория, что для близких к ней траекторий с теми же граничными условиями, соответствующие им значения действия практически не будут отличаться от действия для самой стационарной траектории. Такая траектория называется стационарной. Другими словами, любая траектория близкая к стационарной будет иметь значение действия, очень мало отличающееся от действия для этой стационарной траектории.

Опять, на математическом языке «мало отличающееся» имеет следующий точный смысл. Допустим, что у нас задан функционал

для функций с требуемыми граничными условиями 1) и 2), т.е.

Допустим, что траектория

– стационарна.

Мы можем взять любую другую функцию

Такую, что на концах она принимает нулевые значения, т.е.

0. Также возьмем переменную

Которую мы будем делать все меньше и меньше. Из этих двух функций и переменной

мы можем составить третью функцию

Которая также будет удовлетворять граничным условиям

При уменьшении

траектория, соответствующая функции

Будет все сильнее приближаться к траектории

При этом для стационарных траекторий при малых

значение функционала у траекторий

будет отличаться очень мало от значения функционала для

даже по сравнению с

$$display$$lim_{ε to 0} frac {S(x"(t))-S(x(t))}ε=lim_{ε to 0} frac {S(x(t)+εg(t))-S(x(t))}ε = 0$$display$$

При чем это должно быть справедливо для любой траектории

Удовлетворяющей граничным условиям

Изменение функционала при малом изменении функции (точнее, линейная часть изменения функционала, пропорциональная изменению функции) называется вариацией функционала и обозначается

От термина «вариация» и происходит название «вариационное исчисление».

Для стационарных траекторий вариация функционала

Метод нахождения стационарных функций (не только для принципа наименьшего действия, но и для многих других задач) нашли два математика - Эйлер и Лагранж. Оказывается, что стационарная функция, чей функционал выражается интегралом, подобным интегралу действия, должна удовлетворять определенному уравнению, которое теперь называется уравнением Эйлера-Лагранжа.

Принцип стационарного действия.
Ситуация с минимумом действия для траекторий аналогична ситуации с минимумом для функций. Чтобы траектория обладала наименьшим действием, она обязана быть стационарной траекторией. Однако не все стационарные траектории – это траектории с минимальным действием. Например, стационарная траектория может иметь минимальное действие локально. Т.е. у нее действие будет меньше, чем у любой другой соседней траектории. Однако где-то далеко могут находиться другие траектории, для которых действие будет еще меньше.

Оказывается, реальные тела могут двигаться не обязательно по траекториям с наименьшим действием. Они могут двигаться по более широкому набору особых траекторий, а именно -стационарным траекториям. Т.е. реальная траектория тела всегда будет стационарной. Поэтому принцип наименьшего действия правильнее назвать принципом стационарного действия. Однако по сложившейся традиции его часто называют принципом наименьшего действия, подразумевая по этим не только минимальность, но и стационарность траекторий.

Теперь мы можем записать принцип стационарного действия на математическом языке, как его обычно записывают в учебниках:

Это обобщенные координаты, т.е. набор чисел, однозначно задающий положение системы.

Скорости изменения обобщенных координат.

Функция Лагранжа, которая зависит от обобщенных координат, их скоростей и, возможно, времени.

Действие, которое зависит от конкретной траектории движения системы (т.е. от

Реальные траектории системы стационарны, т.е. для них вариация действия

Если вернуться к примеру с шаром и упругой стенкой, то объяснение этой ситуации теперь становится очень простым. При заданных граничных условиях, что шар должен и во время

и во время

оказаться в точке

существуют две стационарные траектории. И по любой из этих траекторий может реально двигаться шар. Чтобы явно выбрать одну из траекторий, можно на движение шара наложить дополнительное условие. Например, сказать, что шар должен отскочить от стенки. Тогда траектория определится однозначно.

Из принципа наименьшего (точнее стационарного) действия следуют некоторые замечательные следствия, о которых мы поговорим в следующей части.

P. Maupertuis ) в 1744 году , сразу же указав на его универсальную природу и считая его приложимым к оптике и механике. Из данного принципа он вывел законы отражения и преломления света.

Энциклопедичный YouTube

  • 1 / 5

    Математическое исследование и развитие принципа Ферма провёл Христиан Гюйгенс , после чего тему активно обсуждали крупнейшие учёные XVII века. Лейбниц в 1669 году ввёл в физику фундаментальное понятие действия : «Формальные действия движения пропорциональны… произведению количества материи, расстояний, на которые они передвигаются, и скорости».

    Параллельно с анализом основ механики развивались методы решения вариационных задач. Исаак Ньютон в своих «Математических началах натуральной философии » (1687 год) поставил и решил первую вариационную задачу: найти такую форму тела вращения, движущегося в сопротивляющейся среде вдоль своей оси, для которой испытываемое сопротивление было бы наименьшим. Почти одновременно появились и другие вариационные проблемы: задача о брахистохроне (1696), форма цепной линии и др.

    Решающие события произошли в 1744 году. Леонард Эйлер опубликовал первую общую работу по вариационному исчислению («Метод нахождения кривых, обладающих свойствами максимума либо минимума»), а Пьер Луи де Мопертюи в трактате «Согласование различных законов природы, которые до сих пор казались несовместимыми» дал первую формулировку принципа наименьшего действия: «путь, которого придерживается свет, является путём, для которого количество действия будет наименьшим». Он продемонстрировал выполнение этого закона как для отражения, так и для преломления света. В ответ на статью Мопертюи Эйлер опубликовал (в том же 1744 году) работу «Об определении движения брошенных тел в несопротивляющейся среде методом максимумов и минимумов», и в этом труде он придал принципу Мопертюи общемеханический характер: «Так как все явления природы следуют какому-нибудь закону максимума или минимума, то нет никакого сомнения, что и для кривых линий, которые описывают брошенные тела, когда на них действуют какие-нибудь силы, имеет место какое-то свойство максимума или минимума. Далее Эйлер сформулировал этот закон: траектория тела осуществляет минимум ∫ m v d s {\displaystyle \int mv\ ds} . Затем он применил его, выведя законы движения в однородном поле тяжести и в нескольких других случаях.

    В 1746 году Мопертюи в новой работе согласился с мнением Эйлера и провозгласил самую общую версию своего принципа: «Когда в природе происходит некоторое изменение, количество действия, необходимое для этого изменения, является наименьшим возможным. Количество действия есть произведение массы тел на их скорость и на расстояние, которое они пробегают». В развернувшейся широкой дискуссии Эйлер поддержал приоритет Мопертюи и аргументировал всеобщий характер нового закона: «вся динамика и гидродинамика могут быть с удивительной легкостью раскрыты посредством одного только метода максимумов и минимумов».

    Новый этап начался в 1760-1761 годах, когда Жозеф Луи Лагранж ввёл строгое понятие вариации функции, придал вариационному исчислению современный вид и распространил принцип наименьшего действия на произвольную механическую систему (то есть не только на свободные материальные точки). Тем самым было положено начало аналитической механике. Дальнейшее обобщение принципа осуществил Карл Густав Якоб Якоби в 1837 году - он рассмотрел проблему геометрически, как нахождение экстремалей вариационной задачи в конфигурационном пространстве с неевклидовой метрикой. В частности, Якоби указал, что при отсутствии внешних сил траектория системы представляет собой геодезическую линию в конфигурационном пространстве.

    Подход Гамильтона оказался универсальным и высокоэффективным в математических моделях физики, особенно для квантовой механики . Его эвристическая сила была подтверждена при создании Общей теории относительности , когда Давид Гильберт применил гамильтонов принцип для вывода окончательных уравнений гравитационного поля (1915 год).

    В классической механике

    Принцип наименьшего действия служит фундаментальной и стандартной основой лагранжевой и гамильтоновой формулировок механики.

    Вначале рассмотрим построение таким образом лагранжевой механики . На примере физической системы с одной степенью свободы , напомним, что действие - это функционал относительно (обобщённых) координат (в случае одной степени свободы - одной координаты ), то есть оно выражается через q (t) {\displaystyle q(t)} так, что каждому мыслимому варианту функции q (t) {\displaystyle q(t)} сопоставляется некоторое число - действие (в этом смысле можно сказать, что действие как функционал есть правило, позволяющее для любой заданной функции q (t) {\displaystyle q(t)} вычислить вполне определённое число - также называемое действием). Действие имеет вид:

    S [ q ] = ∫ L (q (t) , q ˙ (t) , t) d t , {\displaystyle S[q]=\int {\mathcal {L}}(q(t),{\dot {q}}(t),t)dt,}

    где L (q (t) , q ˙ (t) , t) {\displaystyle {\mathcal {L}}(q(t),{\dot {q}}(t),t)} есть лагранжиан системы, зависящий от обобщённой координаты q {\displaystyle q} , её первой производной по времени q ˙ {\displaystyle {\dot {q}}} , а также, возможно, и явным образом от времени t {\displaystyle t} . Если система имеет большее число степеней свободы n {\displaystyle n} , то лагранжиан зависит от большего числа обобщённых координат q i (t) , i = 1 , 2 , … , n {\displaystyle q_{i}(t),\ i=1,2,\dots ,n} и их первых производных по времени. Таким образом, действие является скалярным функционалом, зависящим от траектории тела.

    То, что действие является скаляром, позволяет легко записать его в любых обобщённых координатах, главное только, чтобы положение (конфигурация) системы однозначно ими характеризовалось (например, вместо декартовых это могут быть полярные координаты, расстояния между точками системы, углы или их функции и т. д.).

    Действие можно вычислить для совершенно произвольной траектории q (t) {\displaystyle q(t)} , какой бы «дикой» и «неестественной» она бы ни была. Однако в классической механике среди всего набора возможных траекторий существует одна-единственная, по которой тело действительно пойдёт. Принцип стационарности действия как раз и даёт ответ на вопрос, как действительно будет двигаться тело:

    Это значит, что если задан лагранжиан системы, то мы с помощью вариационного исчисления можем установить, как именно будет двигаться тело, сначала получив уравнения движения - уравнения Эйлера - Лагранжа , а затем решив их. Это позволяет не только серьёзно обобщить формулировку механики, но и выбирать наиболее удобные координаты для каждой определённой задачи, не ограничиваясь декартовыми, что может быть очень полезно для получения наиболее простых и легко решаемых уравнений.

    S [ p , q ] = ∫ (∑ i p i d q i − H (q , p , t) d t) = ∫ (∑ i p i q ˙ i − H (q , p , t)) d t , {\displaystyle S=\int {\big (}\sum _{i}p_{i}dq_{i}-{\mathcal {H}}(q,p,t)dt{\big)}=\int {\big (}\sum _{i}p_{i}{\dot {q}}_{i}-{\mathcal {H}}(q,p,t){\big)}dt,}

    где H (q , p , t) ≡ H (q 1 , q 2 , … , q N , p 1 , p 2 , … , p N , t) {\displaystyle {\mathcal {H}}(q,p,t)\equiv {\mathcal {H}}(q_{1},q_{2},\dots ,q_{N},p_{1},p_{2},\dots ,p_{N},t)} - функция Гамильтона данной системы; q ≡ q 1 , q 2 , … , q N {\displaystyle q\equiv q_{1},q_{2},\dots ,q_{N}} - (обобщённые) координаты, p ≡ p 1 , p 2 , … , p N {\displaystyle p\equiv p_{1},p_{2},\dots ,p_{N}} - сопряжённые им (обобщённые) импульсы, характеризующие вместе в каждый данный момент времени динамическое состояние системы и, являясь каждое функцией времени, характеризуя, таким образом, эволюцию (движение) системы. В этом случае для получения уравнений движения системы в форме канонических уравнений Гамильтона надо проварьировать записанное так действие независимо по всем q i {\displaystyle q_{i}} и p i {\displaystyle p_{i}} .

    Необходимо заметить, что если из условий задачи принципиально можно найти закон движения, то это автоматически не означает, что можно построить функционал, принимающий стационарное значение при истинном движении. Примером может служить совместное движение электрических зарядов и монополей - магнитных зарядов - в электромагнитном поле . Их уравнения движения невозможно вывести из принципа стационарности действия. Аналогично некоторые гамильтоновы системы имеют уравнения движения, не выводимые из этого принципа.

    Примеры

    Тривиальные примеры помогают оценивать использование принципа действия через уравнения Эйлера-Лагранжа. Свободная частица (масса m и скорость v ) в евклидовом пространстве перемещается по прямой линии. Используя уравнения Эйлера-Лагранжа, это можно показать в полярных координатах следующим образом. В отсутствие потенциала функция Лагранжа просто равна кинетической энергии

    1 2 m v 2 = 1 2 m (x ˙ 2 + y ˙ 2) {\displaystyle {\frac {1}{2}}mv^{2}={\frac {1}{2}}m\left({\dot {x}}^{2}+{\dot {y}}^{2}\right)} ψ = ∫ [ D x ] e (i S [ x ] / ℏ) . {\displaystyle \psi =\int e^{({iS[x]}/{\hbar })}\,.}

    Здесь ∫ [ D x ] {\displaystyle \int } - это условная запись бесконечнократного функционального интегрирования по всем траекториям x(t), а ℏ {\displaystyle \hbar } - постоянная Планка . Подчеркнём, что в принципе действие в экспоненте появляется (или может появляться) само, при изучении оператора эволюции в квантовой механике, однако для систем, имеющих точный классический (неквантовый) аналог, оно в точности равно обычному классическому действию.

    Математический анализ этого выражения в классическом пределе - при достаточно больших S / ℏ {\displaystyle S/\hbar } , то есть при очень быстрых осцилляциях мнимой экспоненты - показывает, что подавляющее большинство всевозможных траекторий в этом интеграле взаимосокращаются при этом в пределе (формально при S / ℏ → ∞ {\displaystyle S/\hbar \rightarrow \infty } ). Для почти любого пути найдется такой путь, на котором набег фазы будет в точности противоположным, и они в сумме дадут нулевой вклад. Не сокращаются лишь те траектории, для которых действие близко к экстремальному значению (для большинства систем - минимуму). Это - чисто математический факт из

    Когда я учился в школе, наш учитель физики, по фамилии Бадер, однажды зазвал меня к себе после урока и сказал: «У тебя вид такой, как будто тебе все страшно надоело; послушай-ка об одной интересной вещи». И он рассказал мне нечто, что мне показалось поистине захватывающим. Даже сейчас, хотя с тех пор прошла уже уйма времени, это продолжает меня увлекать. И всякий раз, когда я вспоминаю о сказанном, я вновь принимаюсь за работу. И на этот раз, готовясь к лекции, я поймал себя на том, что вновь анализирую все то же самое. И, вместо того чтобы готовиться к лекции, я взялся за решение новой задачи. Предмет, о котором я говорю, - это принцип наименьшего действия.

    Вот что сказал мне тогда мой учитель Бадер: «Пусть, к примеру, у тебя имеется частица в поле тяжести; эта частица, выйдя откуда-то, свободно движется куда-то в другую точку. Ты подбросил ее, скажем, кверху, а она взлетела, а потом упала.

    От исходного места к конечному она прошла за какое-то время. Попробуй теперь какое-то другое движение. Пусть для того, чтобы перейти «отсюда сюда», она двигалась уже не так, как раньше, а вот так:

    но все равно очутилась на нужном месте в тот же самый момент времени, что и раньше».

    «И вот,- продолжал учитель,- если ты подсчитаешь кинетическую энергию в каждый момент времени на пути частицы, вычтешь из нее потенциальную энергию и проинтегрируешь разность по всему тому времени, когда происходило движение, то увидишь, что число, которое получится, будет больше, чем при истинном движении частицы.

    Иными словами, законы Ньютона можно сформулировать не в виде , а вот как: средняя кинетическая энергия минус средняя потенциальная энергия достигает своего самого наименьшего значения на той траектории, по которой предмет двигается в действительности от одного места к другому.

    Попробую пояснить тебе это чуть понятнее.

    Если взять поле тяготения и обозначить траекторию частицы , где - высота над землей (обойдемся пока одним измерением; пусть траектория пролегает только вверх и вниз, а не в стороны), то кинетическая энергия будет , а потенциальная энергия в произвольный момент времени будет равна .

    Теперь я для какого-то момента движения по траектории беру разность кинетической и потенциальной энергий и интегрирую по всему времени от начала до конца. Пусть в начальный момент времени движение началось на какой-то высоте, а кончилось в момент на другой определенной высоте.

    Тогда интеграл равен

    .

    Истинное движение совершается по некоторой кривой (как функция времени она является параболой) и приводит к какому-то определенному значению интеграла. Но можно представить себе какое-то другое движение: сперва резкий подъем, а потом какие-то причудливые колебания.

    Давай проверим это. Для начала разберем такой случай: у свободной частицы вовсе нет потенциальной энергии. Тогда правило говорит, что при переходе от одной точки к другой за заданное время интеграл от кинетической энергии должен оказаться наименьшим. А это значит, что частица обязана двигаться равномерно. (И это правильно, мы же с тобой знаем, что скорость в таком движении постоянна.) А почему равномерно? Разберемся в этом. Если бы было иначе, то временами скорость частицы превысила бы среднюю, а временами была бы ниже ее, а средняя скорость была бы одинаковой, потому что частице надо было бы дойти «отсюда сюда» за условленное время. Например, если тебе нужно попасть из дому в школу на своей машине за определенное время, то сделать это можно по-разному: ты можешь сперва гнать, как сумасшедший, а в конце притормозить, или ехать с одинаковой скоростью, или сначала можешь даже отправиться в обратную сторону, а уж потом повернуть к школе, и т. д. Во всех случаях средняя скорость, конечно, должна быть одной и той же - частное от деления расстояния от дома до школы на время. Но и при данной средней скорости ты иногда двигался слишком быстро, а иногда чересчур медленно. А средний квадрат чего-то, что отклоняется от среднего, как известно, всегда больше квадрата среднего; значит, интеграл от кинетической энергии при колебаниях скорости движения всегда будет больше, нежели при движении с постоянной скоростью. Ты видишь, что интеграл достигнет минимума, когда скорость будет постоянной (при отсутствии сил). Правильный путь таков.

    Предмет же, подброшенный в поле тяжести вверх, сперва поднимается быстро, а потом все медленнее. Происходит это потому, что он обладает и потенциальной энергией, а наименьшего значения должна достигать разность между кинетической и потенциальной энергиями. Раз потенциальная энергия возрастает по мере подъема, то меньшая разность получится, если как можно быстрее достичь тех высот, где потенциальная энергия велика. Тогда, вычтя из кинетической энергии этот высокий потенциал, мы добьемся уменьшения среднего. Так что выгоднее такой путь, который идет вверх и поставляет добрый отрицательный кусок потенциальной энергии.

    Но, с другой стороны, нельзя ни двигаться слишком быстро, ни подняться слишком высоко, потому что на это потребуется чересчур много кинетической энергии. Надо двигаться достаточно быстро, чтобы подняться и спуститься за определенное время, имеющееся в твоем распоряжении. Так что не следует стараться взлететь слишком высоко, а просто надо достичь какого-то разумного уровня. В итоге оказывается, что решение есть своего рода равновесие между желанием раздобыть как можно больше потенциальной энергии и желанием как можно сильней уменьшить количество кинетической энергии - это стремление добиться максимального уменьшения разности кинетической и потенциальной энергий».

    Вот и все, что сказал мне мой учитель, потому что он был очень хороший учитель и знал, когда пора остановиться. Сам я, увы, не таков. Мне трудно остановиться вовремя. И поэтому вместо того, чтобы просто разжечь в вас интерес своим рассказом, я хочу запугать вас, хочу, чтобы вам стало тошно от сложности жизни, - попробую доказать то, о чем я рассказал. Математическая задача, которую мы будем решать, очень трудна и своеобразна. Имеется некоторая величина , называемая действием. Она равна кинетической энергии минус потенциальная, проинтегрированная по времени:

    .

    Не забудьте, что и п. э. и к. э. - обе функции времени. Для любого нового мыслимого пути это действие принимает свое определенное значение. Математическая задача состоит в том, чтобы определить, для какой кривой это число меньше, чем для других.

    Вы скажете: «О, это просто обычный пример на максимум и минимум. Надо подсчитать действие, продифференцировать его и найти минимум».

    Но погодите. Обычно у нас бывает функция какой-то переменной и нужно найти значение переменной, при котором функция становится наименьшей или наибольшей. Скажем, имеется стержень, нагретый посредине. По нему растекается тепло и в каждой точке стержня устанавливается своя температура. Нужно найти точку, где она выше всего. Но у нас речь идет совсем об ином - каждому пути в пространстве отвечает свое число, и предполагается найти тот путь, для которого это число минимально. Это совсем другая область математики. Это не обычное исчисление, а вариационное (так его называют).

    В этой области математики имеется много своих задач. Скажем, окружность обычно определяют как геометрическое место точек, расстояния которых от данной точки одинаковы, но окружность можно определить и иначе: это та из кривых данной длины, которая ограничивает собою наибольшую площадь. Любая другая кривая такого же периметра ограничивает площадь меньшую, чем окружность. Так что если поставить задачу: найти кривую данного периметра, ограничивающую наибольшую площадь, то перед нами будет задача из вариационного исчисления, а не из того исчисления, к которому вы привыкли.

    Итак, мы хотим взять интеграл по пути, пройденному телом. Сделаем это так. Все дело в том, чтобы вообразить себе, что существует истинный путь и что любая другая кривая, которую мы проведем, - не настоящий путь, так что если подсчитать для нее действие, то получится число, превышающее то, которое мы получим для действия, соответствующего настоящему пути.

    Итак, задача: найти истинный путь. Где он пролегает? Один из способов конечно, мог бы состоять в том, чтобы подсчитать действие для миллионов и миллионов путей и потом посмотреть, при каком пути это действие наименьшее. Вот тот путь, при котором действие минимально, и будет настоящим.

    Такой способ вполне возможен. Однако можно сделать проще. Если имеется величина, обладающая минимумом (из обычных функций, скажем, температура), то одно из свойств минимума состоит в том, что при удалении от него на расстояние первого порядка малости функция отклоняется от минимального своего значения только на величину второго порядка. А в любом другом месте кривой сдвиг на малое расстояние изменяет значение функции тоже на величину первого порядка малости. Но в минимуме легкие уходы в сторону в первом приближении не приводят к изменению функции.

    Это-то свойство мы и собираемся использовать для расчета настоящего пути.

    Если путь правильный, то кривая, чуть-чуть отличная от него, не приведет в первом приближении к изменению в величине действия. Все изменения, если это был действительно минимум, возникнут только во втором приближении.

    Это легко доказать. Если при каком-то отклонении от кривой возникают изменения в первом порядке, то эти изменения в действии пропорциональны отклонению. Они, по всей вероятности, увеличат действие; иначе это не был бы минимум. Но раз изменения пропорциональны отклонению, то перемена знака отклонения уменьшит действие. Выходит, что при отклонении в одну сторону действие возрастает, а при отклонении в обратную сторону - убывает. Единственная возможность того, чтобы это действительно был минимум, - это чтобы в первом приближении никаких изменений не происходило и изменения были бы пропорциональны квадрату отклонения от настоящего пути.

    Итак, мы пойдем по следующему пути: обозначим через (с чертой внизу) истинный путь - тот, который мы хотим найти. Возьмем некоторый пробный путь , отличающийся от искомого на небольшую величину, которую мы обозначим .

    Идея состоит в том, что если мы подсчитаем действие на пути , то разность между этим и тем действием, которое мы вычислили для пути (для простоты оно будет обозначено ), или разность между и , должна быть в первом приближении по нулем. Они могут отличаться во втором порядке, но в первом разность обязана быть нулем.

    И это должно соблюдаться для любой . Впрочем, не совсем для любой. Метод требует принимать во внимание только те пути, которые все начинаются и кончаются в одной и той же паре точек, т. е. всякий путь должен начинаться в определенной точке в момент и кончаться в другой определенной точке в момент . Эти точки и моменты фиксируются. Так что наша функция (отклонение) должна быть равна нулю на обоих концах: и . При этом условии наша математическая задача становится полностью определенной.

    Если бы вы не знали дифференциального исчисления, вы могли бы проделать такую же вещь для отыскания минимума обычной функции . Вы бы задумались над тем, что случится, если взять и прибавить к малую величину , и доказывали бы, что поправка к в первом порядке по должна в минимуме быть равна нулю. Вы бы подставили вместо и разложили бы с точностью до первой степени , словом, повторили бы все то, что мы намерены сделать с .

    Итак, идея наша заключается в том, что мы подставляем в формулу для действия

    ,

    где через обозначена потенциальная энергия. Производная - это, естественно, производная от плюс производная от , так что для действия я получаю такое выражение:

    .

    Теперь это нужно расписать подетальней. Для квадратичного слагаемого я получу

    .

    Но постойте-ка! Ведь мне не нужно заботиться о порядках выше первого. Я могу убрать все слагаемые, в которых есть и высшие степени, и ссыпать их в ящик под названием «второй и высшие порядки». Из этого выражения туда попадет только одна вторая степень, но из чего-то другого могут войти и высшие. Итак, часть, связанная с кинетической энергией, такова:

    Дальше нам нужен потенциал в точках . Я считаю малой и могу разложить в ряд Тэйлора. Приближенно это будет ; в следующем приближении (из-за того, что здесь стоят обычные производные) поправка равна , умноженной на скорость изменения по отношению к и т. д.:

    .

    Для экономии места я обозначил через производную по . Слагаемое с и все, стоящие за ним, попадают в категорию «второй и высшие порядки». И о них больше нечего беспокоиться. Объединим все, что осталось:

    Если мы теперь внимательно взглянем на это, то увидим, что два первых написанных здесь члена отвечают тому действию , которое я написал бы для искомого истинного пути . Я хочу сосредоточить ваше внимание на изменении , т. е. на разности между и тем , которое получилось бы для истинного пути. Эту разность мы будем записывать как и назовем ее вариацией . Отбрасывая «второй и высшие порядки», получаем для

    .

    Теперь задача выглядит так. Вот передо мной некоторый интеграл. Я не знаю еще, каково это , но я твердо знаю, что, какую я ни возьму, этот интеграл должен быть равен нулю. «Ну что ж,- подумаете вы,- единственная возможность для этого - это чтобы множитель при был равен нулю». Но как быть с первым слагаемым, где есть ? Вы скажете: «Если обращается в ничто, то и ее производная такое же ничто; значит, коэффициент при должен тоже быть нулем». Ну это не совсем верно. Это не совсем верно потому, что между отклонением и его производной имеется связь; они не полностью независимы, потому что должно быть нулем и при и при .

    При решении всех задач вариационного исчисления всегда пользуются одним и тем же общим принципом. Вы чуть сдвигаете то, что хотите варьировать (подобно тому, как это сделали мы, добавляя ), бросаете взгляд на члены первого порядка, затем расставляете все так, чтобы получился интеграл в таком виде: «сдвиг , умноженный на что получится», но чтобы в нем не было никаких производных от (никаких ). Непременно нужно так все преобразовать, чтобы осталось «нечто», умноженное на . Сейчас вы поймете, отчего это так важно. (Существуют формулы, которые подскажут вам, как в некоторых случаях можно это проделать без каких-либо выкладок; но они не так уж общи, чтобы стоило заучивать их; лучше всего проделывать выкладки так, как это делаем мы.)

    Как же я могу переделать член , чтобы в нем появилось ? Я могу добиться этого, интегрируя по частям. Оказывается, что в вариационном исчислении весь фокус в том и состоит, чтобы расписать вариацию и затем проинтегрировать по частям так, чтобы производные от исчезли. Во всех задачах, в которых появляются производные, проделывается такой же фокус.

    Припомните общий принцип интегрирования по частям. Если у вас есть произвольная функция , умноженная на и проинтегрированная по , то вы расписываете производную от :

    .

    В интересующем вас интеграле стоит как раз последнее слагаемое, так что

    .

    В нашей формуле для за функцию принимается произведение на ; поэтому я получаю для выражение

    В первый член должны быть подставлены пределы интегрирования и . Тогда я получу под интегралом член от интегрирования по частям и последний член, оставшийся при преобразовании неизменным.

    А теперь происходит то, что бывает всегда, - проинтегрированная часть исчезает. (А если не исчезает, то нужно переформулировать принцип, добавив условия, обеспечивающие такое исчезновение!) Мы уже говорили, что на концах пути должна быть равна нулю. Ведь в чем состоит наш принцип? В том, что действие минимально при условии, что варьируемая кривая начинается и кончается в избранных точках. Это значит, что и . Поэтому проинтегрированный член получается равным нулю. Мы собираем воедино остальные члены и пишем

    .

    Вариация теперь приобрела такой вид, какой мы хотели ей придать: что-то стоит в скобках (обозначим его ), и все это умножено на и проинтегрировано от до .

    У нас вышло, что интеграл от какого-то выражения, умноженного на , всегда равен нулю:

    .

    Стоит какая-то функция от ; умножаю ее на и интегрирую ее от начала до конца. И какова бы ни была , я получаю нуль. Это означает, что функция равна нулю. В общем-то это очевидно, но я на всякий случай покажу вам один из способов доказательства.

    Пусть в качестве я выберу нечто, что равно нулю всюду, при всех , кроме одного, заранее выбранного значения . Оно остается нулем, пока я не дойду до этого , затем оно подскакивает на мгновение и сразу же осаживает назад. Если вы берете интеграл от этой , умноженной на какую-то функцию , то единственное место, в котором вы получите что-то ненулевое, - это там, где подскакивало; и у вас получится значение в этом месте на интеграл по скачку. Сам по себе интеграл по скачку не равен нулю, но после умножения на он должен дать нуль. Значит, функция в том месте, где был скачок, должна оказаться нулем. Но ведь скачок можно было сделать в любом месте; значит, должна быть нулем всюду.

    Мы видим, что если наш интеграл равен нулю при какой угодно , то коэффициент при должен обратиться в нуль. Интеграл действия достигает минимума на том пути, который будет удовлетворять такому сложному дифференциальному уравнению:

    .

    На самом деле оно не так уж сложно; вы его уже встречали прежде. Это просто . Первый член - это масса, умноженная на ускорение; второй - это производная от потенциальной энергии, т. е. сила.

    Итак, мы показали (по крайней мере для консервативной системы), что принцип наименьшего действия приводит к правильному ответу; он утверждает, что путь, обладающий минимумом действия,- это путь, удовлетворяющий закону Ньютона.

    Нужно сделать еще одно замечание. Я не доказал, что это минимум. Может быть, это максимум. На самом деле это и не обязательно должен быть минимум. Здесь все так же, как в «принципе кратчайшего времени», который мы обсуждали, изучая оптику. Там тоже мы сперва говорили о «кратчайшем» времени. Однако выяснилось, что бывают положения, в которых это время не обязательно «кратчайшее». Фундаментальный принцип заключается в том, чтобы для любых отклонений первого порядка от оптического пути изменения во времени были бы равны нулю; здесь та же самая история. Под «минимумом» мы на самом деле подразумеваем, что в первом порядке малости изменения величины при отклонениях от пути должны быть равны нулю. И это не обязательно «минимум».

    Теперь я хочу перейти к некоторым обобщениям. В первую очередь всю эту историю можно было бы проделать и в трех измерениях. Вместо простого я тогда имел бы , и как функции , и действие выглядело бы посложнее. При трехмерном движении вы должны использовать полную кинетическую энергию: , умноженное на квадрат всей скорости. Иначе говоря,

    .

    Кроме того, потенциальная энергия теперь является функцией , и . А что можно сказать о пути? Путь есть некоторая кривая общего вида в пространстве; ее не так легко начертить, но идея остается прежней. А как обстоит дело с ? Что ж, и имеет три компоненты. Путь можно сдвигать и по , и по , и по , или во всех трех направлениях одновременно. Так что теперь вектор. От этого сильных усложнений не получается. Раз нулю должны быть равны лишь вариации первого порядка, то можно провести расчет последовательно с тремя сдвигами. Сперва можно сдвинуть только в направлении и сказать, что коэффициент должен обратиться в нуль. Получится одно уравнение. Потом мы сдвинем в направлении и получим второе. Затем сдвинем в направлении и получим третье. Можно все, если угодно, проделать в другом порядке. Как бы то ни было, возникает тройка уравнений. Но ведь закон Ньютона - это тоже три уравнения в трех измерениях, по одному для каждой компоненты. Вам предоставляется самим убедиться, что это все действует и в трех измерениях (работы здесь не так много). Между прочим, можно взять какую угодно систему координат, полярную, любую, и сразу получить законы Ньютона применительно к этой системе, рассматривая, что получится, когда произойдет сдвиг вдоль радиуса или по углу, и т. д.

    Метод может быть обобщен и на произвольное число частиц. Если, скажем, у вас есть две частицы и между ними действуют какие-то силы и имеется взаимная потенциальная энергия, то вы просто складываете их кинетические энергии и вычитаете из суммы потенциальную энергию взаимодействия. А что вы варьируете? Пути обеих частиц. Тогда для двух частиц, движущихся в трех измерениях, возникает шесть уравнений. Вы можете варьировать положение частицы 1 в направлении , в направлении и в направлении , и то же самое проделать с частицей 2, так что существует шесть уравнений. И так и должно быть. Три уравнения определяют ускорение частицы 1 через силу, действующую на нее, а три других - ускорение частицы 2 из-за силы, действующей на нее. Следуйте всегда тем же правилам игры, и вы получите закон Ньютона для произвольного числа частиц.

    Я сказал, что мы получим закон Ньютона. Это не совсем верно, потому что в закон Ньютона входят и неконсервативные силы, например трение. Ньютон утверждал, что равно всякой . Принцип же наименьшего действия справедлив только для консервативных систем, таких, где все силы могут быть получены из потенциальной функции. Но ведь вы знаете, что на микроскопическом уровне, т. е. на самом глубинном физическом уровне, неконсервативных сил не существует. Неконсервативные силы (такие, как трение) появляются только от того, что мы пренебрегаем микроскопическими сложными эффектами: просто слишком много частиц приходится анализировать. Фундаментальные же законы могут быть выражены в виде принципа наименьшего действия.

    Позвольте перейти к дальнейшим обобщениям. Положим, нас интересует, что будет, когда частица движется релятивистски. Пока мы не получили правильного релятивистского уравнения движения; верно только в нерелятивистских движениях. Встает вопрос: существует ли в релятивистском случае соответствующий принцип наименьшего действия? Да, существует. Формула в релятивистском случае такова:

    Первая часть интеграла действия - это произведение массы покоя на и на интеграл от функции скорости . Затем вместо того, чтобы вычитать потенциальную энергию, мы имеем интегралы от скалярного потенциала и от векторного потенциала , умноженного на . Конечно, здесь приняты во внимание только электромагнитные силы. Все электрические и магнитные поля выражены в терминах и . Такая функция действия дает полную теорию релятивистского движения отдельной частицы в электромагнитном поле.

    Конечно, вы должны понимать, что всюду, где я написал , прежде чем делать выкладки, следует подставить вместо и т. д. Кроме того, там, где я писал просто , , , вы должны представить себе точки в момент : , , . Собственно, только после таких подстановок и замен у вас получится формула для действия релятивистской частицы. Пусть самые умелые из вас попытаются доказать, что эта формула для действия действительно дает правильные уравнения движения теории относительности. Позвольте лишь посоветовать для начала отбросить , т. е. обойтись пока без магнитных полей. Тогда вы должны будете получить компоненты уравнения движения , где, как вы, вероятно, помните, .

    Включить в рассмотрение векторный потенциал намного труднее. Вариации тогда становятся несравненно более сложными. Но в конце сила оказывается равной тому, чему следует: . Но позабавьтесь с этим сами.

    Мне хотелось бы подчеркнуть, что в общем случае (к примеру, в релятивистской формуле) под интегралом в действии уже не стоит разность кинетической и потенциальной энергий. Это годилось только в нерелятивистском приближении. Например, член - это не то, что называют кинетической энергией. Вопрос о том, каким должно быть действие для произвольного частного случая, может быть решен после некоторого числа проб и ошибок. Это задача того же типа, что и определение, каковы должны быть уравнения движения. Вы просто должны поиграть с известными вам уравнениями и посмотреть, можно ли их написать в виде принципа наименьшего действия.

    Еще одно замечание по поводу терминологии. Ту функцию, которую интегрируют по времени, чтобы получить действие , называют лагранжианом . Это функция, зависящая только от скоростей и положений частиц. Так что принцип наименьшего действия записывается также в виде

    ,

    где под и подразумеваются все компоненты координат и скоростей. Если вы когда-нибудь услышите, что кто-то говорит о «лагранжиане», знайте, что речь идет о функции, применяемой для получения . Для релятивистского движения в электромагнитном поле

    .

    Кроме того, я должен отметить, что самые дотошные и педантичные люди не называют действием. Его именуют «первой главной функцией Гамильтона». Но читать лекцию о «принципе наименьшей первой главной функции Гамильтона» было свыше моих сил. Я назвал это «действием». Да к тому же все больше и больше людей называют это «действием». Видите ли, исторически действием было названо нечто другое, не столь полезное для науки, но я думаю, что разумнее изменить определение. Теперь и вы начнете именовать новую функцию действием, а вскоре и все вообще станут называть ее этим простым именем.

    Теперь я хочу сообщить вам по поводу нашей темы кое-что, похожее на те рассуждения, которые я вел по поводу принципа кратчайшего времени. Существует разница в самом существе закона, утверждающего, что некоторый интеграл, взятый от одной точки до другой, имеет минимум, - закона, который сообщает нам что-то обо всем пути сразу, и закона, который говорит, что когда вы двигаетесь, то, значит, есть сила, приводящая к ускорению. Второй подход докладывает вам о каждом вашем шаге, он прослеживает ваш путь пядь за пядью, а первый выдает сразу какое-то общее утверждение обо всем пройденном пути. Толкуя о свете, мы говорили о связи этих двух подходов. Теперь я хочу объяснить вам, отчего должны существовать дифференциальные законы, если имеется такой принцип - принцип наименьшего действия. Причина вот в чем: рассмотрим действительно пройденный в пространстве и времени путь. Как и прежде, обойдемся одним измерением, так что можно будет начертить график зависимости от . Вдоль истинного пути достигает минимума. Положим, что у нас есть этот путь и что он проходит через некоторую точку пространства и времени и через другую соседнюю точку .

    Теперь, если весь интеграл от до достиг минимума, необходимо, чтобы интеграл вдоль маленького участочка от до тоже был минимальным. Не может быть, чтобы часть от до хоть чуточку превосходила минимум. Иначе вы могли бы подвигать туда-сюда кривую на этом участочке и снизить немного значение всего интеграла.

    Значит, любая часть пути тоже должна давать минимум. И это справедливо для каких-угодно маленьких долек пути. Поэтому тот принцип, что весь путь должен давать минимум, можно сформулировать, сказав, что бесконечно малая долька пути - это тоже такая кривая, на которой действие минимально. И если мы возьмем достаточно короткий отрезок пути - между очень близкими друг к другу точками и , - то уже неважно, как меняется потенциал от точки к точке вдали от этого места, потому что, проходя весь ваш коротенький отрезочек, вы почти не сходите с места. Единственное, что вам нужно учитывать, - это изменение первого порядка малости в потенциале. Ответ может зависеть только от производной потенциала, а не от потенциала в других местах. Так, утверждение о свойстве всего пути в целом становится утверждением о том, что происходит на коротком участке пути, т. е. дифференциальным утверждением. И эта дифференциальная формулировка включает производные от потенциала, т. е. силу в данной точке. Таково качественное объяснение связи между законом в целом и дифференциальным законом.

    Когда мы говорили о свете, то обсуждали также вопрос: как все-таки частица находит правильный путь? С дифференциальной точки зрения это понять легко. В каждый момент частица испытывает ускорение и знает только то, что ей положено делать в это мгновение. Но все ваши инстинкты причин и следствий встают на дыбы, когда вы слышите, что частица «решает», какой ей выбрать путь, стремясь к минимуму действия. Уж не «обнюхивает» ли она соседние пути, прикидывая, к чему они приведут - к большему или к меньшему действию? Когда мы на пути света ставили экран так, чтобы фотоны не могли перепробовать все пути, мы выяснили, что они не могут решить, каким путем идти, и получили явление дифракции.

    Но верно ли это и для механики? Правда ли, что частица не просто «идет верным путем», а пересматривает все другие мыслимые траектории? И что если, ставя преграды на ее пути, мы не дадим ей заглядывать вперед, то мы получим некий аналог явления дифракции? Самое чудесное во всем этом - то, что все действительно обстоит так. Именно это утверждают законы квантовой механики. Так что наш принцип наименьшего действия сформулирован не полностью. Он состоит не в том, что частица избирает путь наименьшего действия, а в том, что она «чует» все соседние пути и выбирает тот, вдоль которого действие минимально, и способ этого выбора сходен с тем, каким свет отбирает кратчайшее время. Вы помните, что способ, каким свет отбирает кратчайшее время, таков: если свет пойдет по пути, требующему другого времени, то придет он с другой фазой. А полная амплитуда в некоторой точке есть сумма вкладов амплитуд для всех путей, по которым свет может ее достичь. Все те пути, у которых фазы резко различаются, ничего после сложения не дают. Но если вам удалось найти всю последовательность путей, фазы которых почти одинаковы, то мелкие вклады сложатся, и в точке прибытия полная амплитуда получит заметное значение. Важнейшим путем становится тот, возле которого имеется множество близких путей, дающих ту же фазу.

    В точности то же происходит и в квантовой механике. Законченная квантовая механика (нерелятивистская и пренебрегающая спином электрона) работает так: вероятность того, что частица, выйдя из точки 1 в момент , достигнет точки 2 в момент , равна квадрату амплитуды вероятности. Полная амплитуда может быть записана в виде суммы амплитуд для всех возможных путей - для любого пути прибытия. Для любого , которое могло бы возникнуть для любой мыслимой воображаемой траектории, нужно подсчитать амплитуду. Затем их все нужно сложить. Что же мы примем за амплитуду вероятности некоторого пути? Наш интеграл действия говорит нам, какой обязана быть амплитуда отдельного пути. Амплитуда пропорциональна , где - действие на этом пути. Это значит, что если мы представим фазу амплитуды в виде комплексного числа, то фазовый угол будет равен . Действие имеет размерность энергии на время, и у постоянной Планка размерность такая же. Это постоянная, которая определяет, когда нужна квантовая механика.

    И вот как все это срабатывает. Пусть для всех путей действие будет весьма большим по сравнению с числом . Пусть какой-то путь привел к некоторой величине амплитуды. Фаза рядом проложенного пути окажется совершенно другой, потому что при огромном даже незначительные изменения резко меняют фазу (ведь чрезвычайно мало). Значит, рядом лежащие пути при сложении обычно гасят свои вклады. И только в одной области это не так - в той, где и путь и его сосед - оба в первом приближении обладают одной и той же фазой (или, точнее, почти одним и тем же действием, меняющимся в пределах ). Только такие пути и принимаются в расчет. А в предельном случае, когда постоянная Планка стремится к нулю, правильные квантовомеханические законы можно подытожить, сказав: «Забудьте обо всех этих амплитудах вероятностей. Частица и впрямь движется по особому пути - именно по тому, по которому в первом приближении не меняется». Такова связь между принципом наименьшего действия и квантовой механикой. То обстоятельство, что таким способом можно сформулировать квантовую механику, было открыто в 1942 г. учеником того же самого учителя, мистера Бадера, о котором я вам рассказывал. [Первоначально квантовая механика была сформулирована при помощи дифференциального уравнения для амплитуды (Шредингер), а также при помощи некоторой матричной математики (Гейзенберг).]

    Теперь я хочу потолковать о других принципах минимума в физике. Есть очень много интересных принципов такого рода. Я не буду их все перечислять, а назову еще только один. Позже, когда мы доберемся до одного физического явления, для которого существует превосходный принцип минимума, я расскажу вам о нем. А сейчас я хочу показать, что необязательно описывать электростатику при помощи дифференциального уравнения для поля; можно вместо этого потребовать, чтобы некоторый интеграл обладал максимумом или минимумом. Для начала возьмем случай, когда плотность зарядов известна повсюду, а нужно найти потенциал в любой точке пространства. Вы уже знаете, что ответ должен быть такой:

    Другой способ утверждать то же самое заключается в следующем: надо вычислить интеграл

    ;

    это объемный интеграл. Он берется по всему пространству. При правильном распределении потенциала это выражение достигает минимума.

    Мы можем показать, что оба эти утверждения относительно электростатики эквивалентны. Предположим, что мы выбрали произвольную функцию . Мы хотим показать, что когда в качестве мы возьмем правильное значение потенциала плюс малое отклонение , то в первом порядке малости изменение в будет равно нулю. Так что мы пишем

    здесь - это то, что мы ищем; но мы проварьируем , чтобы увидеть, каким он должен быть для того, чтобы вариация оказалась первого порядка малости. В первом члене нам нужно написать

    Единственный член первого порядка, который будет меняться, таков:

    Во втором члене подынтегральное выражение примет вид

    изменяющаяся часть здесь равна . Оставляя только меняющиеся члены, получим интеграл

    .

    Это нужно проинтегрировать по , и по . И здесь напрашивается тот же фокус: чтобы избавиться от , мы проинтегрируем по по частям. Это приведет к добавочному дифференцированию по . Это та же основная идея, с помощью которой мы избавились от производных по . Мы пользуемся равенством

    .

    Проинтегрированный член равен нулю, так как мы считаем равным нулю на бесконечности. (Это отвечает обращению в нуль при и . Так что наш принцип более точно формулируется следующим образом: для правильного меньше, чем для любого другого , обладающего теми же значениями на бесконечности.) Затем мы проделаем то же с и с . Наш интеграл обратится в

    .

    Чтобы эта вариация была равна нулю при любом произвольном , коэффициент при должен быть равен нулю. Значит,

    Мы вернулись к нашему старому уравнению. Значит, наше «минимальное» предложение верно. Его можно обобщить, если слегка изменить выкладки. Вернемся назад и проинтегрируем по частям, но расписывая все покомпонентно. Начнем с того, что напишем следующее равенство:

    Продифференцировав левую часть, я могу показать, что она в точности равна правой. Это уравнение подходит для того, чтобы провести интегрирование по частям. В нашем интеграле мы заменяем на и затем интегрируем это по объему. Член с дивергенцией после интегрирования по объему заменяется интегралом по поверхности:

    А поскольку мы интегрируем по всему пространству, то поверхность в этом интеграле лежит на бесконечности. Значит, , и мы получаем прежний результат.

    Только теперь мы начинаем понимать, как решать задачи, в которых мы не знаем, где расположены все заряды. Пусть мы имеем проводники, на которых как-то распределены заряды. Если потенциалы на всех проводниках зафиксированы, то наш принцип минимума все еще разрешается применять. Интегрирование в мы проведем только по области, лежащей снаружи всех проводников. Но раз мы не можем на проводниках менять , то на их поверхности , и поверхностный интеграл

    тоже равен нулю. Остающееся объемное интегрирование

    нужно проделывать только в промежутках между проводниками. И мы, конечно, снова получаем уравнение Пуассона

    Мы, стало быть, показали, что наш первоначальный интеграл достигает минимума и тогда, когда он вычисляется в пространстве между проводниками, каждый из которых находится при фиксированном потенциале [это значит, что каждая пробная функция должна равняться заданному потенциалу проводника, когда - точки поверхности проводника].

    Существует интересный частный случай, когда заряды расположены только на проводниках. Тогда

    и наш принцип минимума говорит нам, что в случае, когда у каждого проводника есть свой заранее заданный потенциал, потенциалы в промежутках между ними пригоняются так, что интеграл оказывается как можно меньше. А что это за интеграл? Член - это электрическое поле. Значит, интеграл - это электростатическая энергия. Правильное поло и есть то единственное, которое из всех полей, получаемых как градиент потенциала, отличается наименьшей полной энергией.

    Я хотел бы воспользоваться этим результатом, чтобы решить какую-нибудь частную задачу и показать вам, что все эти вещи имеют реальное практическое значение. Предположим, что я взял два проводника в форме цилиндрического конденсатора.

    Ему подчиняются, в связи с чем этот принцип является одним из ключевых положений современной физики. Получаемые с его помощью уравнения движения имеют название уравнений Эйлера - Лагранжа .

    Первую формулировку принципа дал П. Мопертюи (P. Maupertuis) в году, сразу же указав на его универсальную природу, считая его приложимым к оптике и механике. Из данного принципа он вывел законы отражения и преломления света.

    История

    Мопертюи пришёл к этому принципу из ощущения, что совершенство Вселенной требует определенной экономии в природе и противоречит любым бесполезным расходам энергии. Естественное движение должно быть таким, чтобы сделать некоторую величину минимальной. Нужно было только найти эту величину, что он и продолжал делать. Она являлась произведением продолжительности (время) движения в пределах системы на удвоенную величину, которую мы теперь называем кинетической энергией системы.

    Эйлер (в «Réflexions sur quelques loix générales de la nature» , 1748) принимает принцип наименьшего количества действия, называя действие «усилием». Его выражение в статике соответствует тому, что мы теперь назвали бы потенциальной энергией , так что его утверждение наименьшего действия в статике эквивалентно условию минимума потенциальной энергии для конфигурации равновесия.

    В классической механике

    Принцип наименьшего действия служит фундаментальной и стандартной основой лагранжевой и гамильтоновой формулировок механики.

    Вначале рассмотрим построение таким образом лагранжевой механики . На примере физической системы с одной степенью свободы , напомним, что действие - это функционал относительно (обобщенных) координат (в случае одной степени свободы - одной координаты ), то есть выражается через так, что каждому мыслимому варианту функции сопоставляется некоторое число - действие (в этом смысле можно сказать, что действие как функционал есть правило, позволяющее для любой заданной функции вычислить вполне определенной число - также называемое действием). Действие имеет вид:

    где есть лагранжиан системы, зависящий от обобщённой координаты , её первой производной по времени , а также, возможно, и явным образом от времени . Если система имеет большее число степеней свободы , то лагранжиан зависит от большего числа обобщённых координат и их первых производных по времени. Таким образом, действие является скалярным функционалом, зависящим от траектории тела.

    То, что действие является скаляром, позволяет легко записать его в любых обобщенных координатах, главное только, чтобы положение (конфигурация) системы однозначно ими характеризовалось (например, вместо декартовых это могут быть полярные координаты, расстояния между точками системы, углы или их функции и т. д.).

    Действие можно вычислить для совершенно произвольной траектории , какой бы «дикой» и «неестественной» она бы ни была. Однако в классической механике среди всего набора возможных траекторий существует одна-единственная, по которой тело действительно пойдёт. Принцип стационарности действия как раз и даёт ответ на вопрос, как действительно будет двигаться тело:

    Это значит, что если задан лагранжиан системы, то мы с помощью вариационного исчисления можем установить, как именно будет двигаться тело, сначала получив уравнения движения - уравнения Эйлера - Лагранжа , а затем решив их. Это позволяет не только серьёзно обобщить формулировку механики, но и выбирать наиболее удобные координаты для каждой определенной задачи, не ограничиваясь декартовыми, что может быть очень полезно для получения наиболее простых и легко решаемых уравнений.

    где - функция Гамильтона данной системы; - (обобщенные) координаты, - сопряженные им (обобщенные) импульсы, характеризующие вместе в каждый данный момент времени динамическое состояние системы и, являясь каждое функцией времени, характеризуя, таким образом, эволюцию (движение) системы. В этом случае для получения уравнений движения системы в форме канонических уравнений Гамильтона надо проварьировать записанное так действие независимо по всем и .

    Необходимо заметить, что если из условий задачи принципиально можно найти закон движения, то это автоматически не означает, что можно построить функционал, принимающий стационарное значение при истинном движении. Примером может служить совместное движение электрических зарядов и монополей - магнитных зарядов - в электромагнитном поле . Их уравнения движения невозможно вывести из принципа стационарности действия. Аналогично некоторые гамильтоновы системы имеют уравнения движения, не выводимые из этого принципа.

    Примеры

    Тривиальные примеры помогают оценивать использование принципа действия через уравнения Эйлера-Лагранжа. Свободная частица (масса m и скорость v ) в Евклидовом пространстве перемещается по прямой линии. Используя уравнения Эйлера-Лагранжа, это можно показать в полярных координатах следующим образом. В отсутствие потенциала функция Лагранжа просто равна кинетической энергии

    в ортогональной системе координат .

    В полярных координатах кинетическая энергия, и следовательно, функция Лагранжа становится

    Радиальная и угловая компонента уравнений становятся, соответственно:

    Решение этих двух уравнений

    Здесь - это условная запись бесконечнократного функционального интегрирования по всем траекториям x(t), а - постоянная Планка . Подчеркнём, что в принципе действие в экспоненте появляется (или может появляться) само, при изучении оператора эволюции в квантовой механике, однако для систем, имеющих точный классический (неквантовый) аналог, оно в точности равно обычному классическому действию.

    Математический анализ этого выражения в классическом пределе - при достаточно больших , то есть при очень быстрых осцилляциях мнимой экспоненты - показывает, что подавляющее большинство всевозможных траекторий в этом интеграле взаимосокращаются при этом в пределе (формально при ). Для почти любого пути найдется такой путь, на котором набег фазы будет в точности противоположным, и они в сумме дадут нулевой вклад. Не сокращаются лишь те траектории, для которых действие близко к экстремальному значению (для большинства систем - минимуму). Это - чисто математический факт из теории функций комплексного переменного ; на нём, например, основан метод стационарной фазы .

    В результате частица в полном согласии с законами квантовой механики движется одновременно по всем траекториям, но в обычных условиях в наблюдаемые значения дают вклад только траектории, близкие к стационарным (то есть классическим). Поскольку квантовая механика переходит в классическую в пределе больших энергий, то можно считать, что это - квантовомеханический вывод классического принципа стационарности действия .

    В квантовой теории поля

    В квантовой теории поля принцип стационарности действия также успешно применяется. В лагранжеву плотность здесь входят операторы соответствующих квантовых полей. Хотя правильнее тут в сущности (за исключением классического предела и отчасти квазиклассики) говорить не о принципе стационарности действия, а о фейнмановском интегрировании по траекториям в конфигурационном или фазовом пространстве этих полей - с использованием упомянутой только что лагранжевой плотности.

    Дальнейшие обобщения

    Более широко, под действием понимают функционал, задающий отображение из конфигурационного пространства на множество вещественных чисел и, в общем, он не обязан быть интегралом, потому что нелокальные действия в принципе возможны, по крайней мере, теоретически. Более того, конфигурационное пространство не обязательно является функциональным пространством, потому что может иметь некоммутативную геометрию.