Преобразования лоренца кратко для экзамена

Ранее мы уже изучили формулы, называемые классическими преобразованиями Галилея, однако они несовместимы с постулатами специальной теории относительности (СТО). Поэтому в данном случае нам нужно использовать другие положения. Благодаря новым преобразованиям мы сможем установить, какая связь существует между некоторым моментом события t, наблюдаемого в системе отсчета K в точке с координатами (x, y, z) и показателями того же события, которое наблюдается в системе отсчета K’.

Определение 1

Преобразования Лоренца представляют собой кинематические формулы, с помощью которых происходит преобразование координат и времени в специальной теории относительности.

Они были впервые сформулированы еще в 1904 году в качестве преобразований, относительно которых были инвариантны уравнения электродинамики.

Обозначим основные системы K и K’, скорость их движения – υ, а ось, вдоль которой они движутся – x. В таком случае преобразования Лоренца примут следующий вид:

K’→Kx=x’+υt’1-β2,y=y’,z=z’,t=t’+υx’/c21-β2. K→K’x’=x-υt1-β2,y’=y,z’=z,t’=t-υx/c21-β2.

β=υc.

Используя эти формулы, мы можем вывести из них множество следствий. Так, именно из системы преобразований Лоренца следует лоренцево сокращение длины и релятивистский эффект замедления времени.

Пример 1

Возьмем случай, когда в системе K’ происходит некий процесс, длительность которого составляет τ0 = t’2 – t’1 (по собственному времени). Здесь t’1 и t’2 – это время на часах в начале данного процесса и в его конце. Чтобы вычислить его общую продолжительность в точке x, необходимо взять для расчета следующую формулу:

τ=t2-t1=t’2+υx’/c21-β2-t’1+υx’/c21-β2=t’2-t’11-β2=τ01-β2.

Формула релятивистского сокращения длины выводится из преобразований Лоренца точно таким же образом.

Принцип относительности одновременности

Еще одно важное следствие, которое необходимо знать, – это положение о том, что любая одновременность относительна.

Пример 2

Например, если в системе отсчета K’ взять две разные точки, в которых некий процесс будет протекать одновременно (с позиции стороннего наблюдателя), то в системе наблюдатель будет иметь следующее:

x1=x’1+υt’1-β2, x2=x’2+υt’1-β2⇒x1≠x2,t1=t’+υx’1/c21-β2, t2=t’+υx’2/c21-β2⇒t1≠t2.

Из этого вытекает пространственная разобщенность данных событий в системе K, следовательно, они не могут считаться одновременными. Нельзя сразу сказать, какое событие будет происходить первым, а какое вторым, поскольку это определяется особенностями системы отсчета – знак разности будет определен знаком выражения υ(x’2–x’1).

Если между событиями имеется причинно-следственная связь, то данный вывод специальной теории относительности для них использовать нельзя. Однако мы можем показать, что при этом не нарушается принцип причинности, и события следуют в нужном порядке в любой инерциальной системе отсчета.

Разберем пример, показывающий, что одновременность разобщенных в пространстве событий является относительной.

Пример 3

Возьмем систему отсчета K’ и расположим в ней длинный жесткий стержень. Его положение будет неподвижным и ориентированным вдоль оси абсцисс. Установим на оба его конца часы, синхронизированные между собой, а в центр поместим импульсную лампу. Также у нас будет система K’, совершающая движение вдоль оси x в системе K.

В определенный момент времени лампа включится и пошлет световые сигналы в направлении обоих концов жесткого стержня. Поскольку она находится точно в центре, эти сигналы должны дойти до концов в одно и то же время t, которое должно быть зафиксировано расположенными на них часами. Однако концы стержня движутся относительно системы K так, что один конец стремится навстречу световому сигналу, а другой конец свету приходится догонять. Скорость света, распространяющегося в оба направления, одинакова, но сторонний наблюдатель скажет, что до левого конца свет дошел быстрее, чем до правого.

Принцип относительности одновременности

Рисунок 4.4.1. Иллюстрация принципа относительности одновременности: достижение световым импульсом концов стержня в системе K’ в одно и то же время и в системе K в разное.

Инвариантные величины в СТО

Данные преобразования нужны нам для выражения относительного характера временных промежутков и промежутков расстояний. Вместе с тем в специальной теории относительности помимо утверждения относительного характера времени и пространства очень важно установить инвариантные физические величины, не изменяющиеся при смене системы отсчета. Подобной величиной является скорость света в вакууме, чей характер в рамках СТО становится абсолютным. Также важна такая величина, как интервал между событиями, поскольку именно она выражает абсолютность пространственно-временной связи.

Для вычисления пространственно-временного интервала необходимо использовать следующую формулу:

s12=c2t122-l122.

В ней с помощью параметра l12 выражено расстояние между точками одной системы, где совершаются события, а t12 – это временной промежуток между теми же самыми событиями. Если местом одного из событий является начало координат, т.е. x1=y1=z1=0 и (t1=0), а второе происходит в точке с координатами x, y, z в некоторое время t, то формула вычисления пространственно-временного интервала между ними записывается так:

s=c2t2-x2-y2-z2.

Преобразования Лоренца дают нам возможность доказать неизменность пространственно-временного интервала между событиями при смене инерциальной системы.

Определение 2

Если величина интервала не зависит от того, какая система отсчета используется, т.е. является объективной при любых относительных расстояниях и временных промежутках, то такой интервал называется инвариантным.

Пример 4

Допустим, что у нас есть событие (вспышка света), которое произошло в точке начала координат в некоторой системе во время, равное 0, а потом свет переместился в другую точку с координатами x, y, z во время t. Тогда мы можем записать следующее:

x2+y2+z2=c2t2.

У нас получилось, что интервал этой пары событий будет равен нулю. Если мы поменяем систему координат и возьмем другое время для второго события, то результаты окажутся точно такими же, поскольку:

x2+y2+z2=c2t2

Иначе говоря, любые два события, которые связывает между собой световой сигнал, будут иметь нулевой пространственно-временной интервал.

Также формулы Лоренца для времени и координат можно использовать для выведения релятивистского закона сложения скоростей.

Пример 5

Например, у нас есть частица, которая находится в системе отсчета K’ и движется в ней вдоль оси абсцисс со скоростью u’x=dx’dt’. Параметры скорости u’x и u’ равны 0. В системе K, соответственно, скорость будет равна ux=dxdt.

Применим к одной из формул преобразования Лоренца операцию дифференцирования и получим следующее:

ux=u’x+υ1+υc2u’x, uy=0, uz=0.

Данные отношения являются выражением релятивистского закона сложения скоростей. Он применим в случае движения частицы параллельно относительной скорости υ→ в системах отсчета K и K’.

Если υ≪c, то релятивистские отношения могут быть преобразованы в формулы классической механики:

ux=u’x+υ, uy=0, uz=0.

Если мы имеем дело со световым импульсом, распространяющимся в системе K’ вдоль оси x’ со скоростью u’x=c, то в этом случае применима следующая формула:

ux=c+υ1+υ/c=c, uy=0, uz=0.

Иначе говоря, скорость распространения светового импульса в системе K вдоль оси x также будет равна c, что соответствует постулату об инвариантности скорости света.

Преобразования Лоренца

Преобразова́ния
Ло́ренца
— линейные (или аффинные)
преобразования векторного (соответственно,
аффинного) псевдоевклидова
пространства
, сохраняющее длины
или, что эквивалентно, скалярное
произведение
векторов.

Преобразования
Лоренца псевдоевклидова пространства
сигнатуры
(n-1,1) находят широкое применение в физике,
в частности, в специальной
теории относительности (СТО)
,
где в качестве аффинного псевдоевклидова
пространства
выступает
четырёхмерный пространственно-временной
континуум (пространство
Минковского
).

Преобразования Лоренца в физике

Преобразованиями
Лоренца в физике, в частности, в специальной
теории относительности (СТО)
,
называются преобразования, которым
подвергаются пространственно-временные
координаты (x,y,z,t) каждого
события при переходе от одной инерциальной
системы отсчета (ИСО)
к другой.
Аналогично, преобразованиям Лоренца
при таком переходе подвергаются
координаты любого 4-вектора.

Чтобы
явно различить преобразования Лоренца
со сдвигами начала отсчёта и без сдвигов,
когда это необходимо, говорят о
неоднородных и однородных
преобразованиях Лоренца.

Преобразования
Лоренца без сдвигов начала отсчёта
образуют группу
Лоренца
, со сдвигами — группу
Пуанкаре
, иначе называемую
неоднородной группой Лоренца.

С
математической точки зрения преобразования
Лоренца — это преобразования,
сохраняющие неизменной метрику
Минковского
, то есть, в частности,
последняя сохраняет при них простейший
вид при переходе от одной инерциальной
системы отсчёта к другой (другими словами
преобразования Лоренца — это аналог
для метрики Минковского ортогональных
преобразований, осуществляющих переход
от одного ортонормированного базиса к
другому, то есть аналог поворота
координатных осей для пространства-времени).
В математике или теоретической физике
преобразования Лоренца могут относиться
к любой размерности пространства.

Именно
преобразования Лоренца, смешивающие —
в отличие от преобразований
Галилея
 — пространственные
координаты и время, исторически стали
основой для формирования концепции
единого пространства-времени.

  • Следует заметить, что лоренц-ковариантны
    не только фундаментальные уравнения
    (такие, как уравнения Максвелла,
    описывающее электромагнитное поле,
    уравнение Дирака, описывающее электрон
    и другие фермионы), но и такие
    макроскопические уравнения, как волновое
    уравнение, описывающее (приближенно)
    звук, колебания струн и мембран, и
    некоторые другие (только тогда уже в
    формулах преобразований Лоренца под
    c следует иметь в виду не скорость
    света, а какую-то другую константу,
    например скорость звука). Поэтому
    преобразования Лоренца могут быть
    плодотворно использованы и в связи с
    такими уравнениями (хотя и в довольно
    формальном смысле, впрочем, мало
    отличающемся — в своих рамках —
    от их применения в фундаментальной
    физике).

Вид преобразований при коллинеарных (параллельных) пространственных осях

Если
ИСО K‘ движется относительно ИСО K
с постоянной скоростью v вдоль оси
x, а начала
пространственных координат

совпадают в начальный момент времени
в обеих системах, то преобразования
Лоренца (прямые) имеют вид:

где
cскорость
света
, величины со штрихами
измерены в системе K‘, без штрихов —
в K.

Эта
форма преобразования (то есть при выборе
коллинеарных осей), называемая иногда
бустом (англ. boost)
или лоренцевским бустом (особенно
в англоязычной литературе), несмотря
на свою простоту, включает, по сути, всё
специфическое физическое содержание
преобразований Лоренца, так как
пространственные оси всегда можно
выбрать таким образом, а при желании
добавить пространственные повороты не
представляет трудности (см. это в явном
развёрнутом виде ниже), хотя и делает
формулы более громоздкими.

  • Формулы, выражающие обратное
    преобразование, то есть выражающие
    x‘,y‘,z‘,t‘ через x,y,z,t
    можно получить просто заменой v на
    v (абсолютная величина относительной
    скорости движения систем отсчёта | v
    | одинакова при измерении её в обеих
    системах отсчёта, поэтому можно при
    желании снабдить v штрихом, только
    при этом надо внимательно следить за
    тем, чтобы знак и определение
    соответствовали друг другу) и взаимной
    заменой штрихованных x и t с
    нештрихованными. Или решая систему
    уравнений (1) относительно x‘,y‘,z‘,t‘.

  • Надо иметь
    в виду, что в литературе преобразования
    Лоренца часто записывается для упрощения
    в системе единиц, где c = 1, что
    действительно делает их вид более
    изящным.

  • Видно,
    что при преобразованиях Лоренца события,
    одновременные
    в одной системе отсчёта, не являются
    одновременными в другой (относительность
    одновременности), кроме того, у движущегося
    тела сокращается продольный размер по
    сравнению с тем, какой оно имеет в
    сопутствующей ему системе отсчёта
    (лоренцево
    сокращение
    ), а ход движущихся
    часов замедляется, если наблюдать их
    из «неподвижной» системы отсчёта
    (релятивистское
    замедление времени
    ).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Преобразованиями Лоренца в физике, в частности в специальной теории относительности (СТО), называются преобразования, которым подвергаются пространственно-временные координаты (x,y,z,t) каждого события при переходе от одной инерциальной системы отсчета (ИСО) к другой. Аналогично преобразованиям Лоренца при таком переходе подвергаются координаты любого 4-вектора.

Чтобы явно различить преобразования Лоренца со сдвигами начала отсчёта и без сдвигов, когда это необходимо, говорят о неоднородных и однородных преобразованиях Лоренца.

Преобразования Лоренца без сдвигов начала отсчёта образуют группу Лоренца, со сдвигами — группу Пуанкаре, иначе называемую неоднородной группой Лоренца.

С математической точки зрения преобразования Лоренца — это преобразования, сохраняющие неизменной метрику Минковского, то есть, в частности, последняя сохраняет при них простейший вид при переходе от одной инерциальной системы отсчёта к другой (другими словами преобразования Лоренца — это аналог для метрики Минковского ортогональных преобразований, осуществляющих переход от одного ортонормированного базиса к другому, то есть аналог поворота координатных осей для пространства-времени). В математике или теоретической физике преобразования Лоренца могут относиться к любой размерности пространства.

Именно преобразования Лоренца, смешивающие — в отличие от преобразований Галилея — пространственные координаты и время, исторически стали основой для формирования концепции единого пространства-времени.

  • Следует заметить, что лоренц-ковариантны не только фундаментальные уравнения (такие, как уравнения Максвелла, описывающее электромагнитное поле, уравнение Дирака, описывающее электрон и другие фермионы), но и такие макроскопические уравнения, как волновое уравнение, описывающее (приближенно) звук, колебания струн и мембран, и некоторые другие (только тогда уже в формулах преобразований Лоренца под c следует иметь в виду не скорость света, а какую-то другую константу, например скорость звука). Поэтому преобразования Лоренца могут быть плодотворно использованы и в связи с такими уравнениями (хотя и в довольно формальном смысле, впрочем, мало отличающемся — в своих рамках — от их применения в фундаментальной физике).

Содержание

  • 1 Вид преобразований при коллинеарных (параллельных) пространственных осях
  • 2 Вывод преобразований
    • 2.1 Алгебраический вывод
    • 2.2 Группа симметрий уравнений Максвелла
    • 2.3 Наглядный вывод преобразований Лоренца
      • 2.3.1 Преобразование для поперечных осей (п.1)
      • 2.3.2 Замедление времени (п.2)
      • 2.3.3 Относительность одновременности (п.3)
      • 2.3.4 Лоренцевское сокращение длины (п.4)
  • 3 Разные формы записи преобразований
    • 3.1 Вид преобразований при произвольной ориентации осей
    • 3.2 Преобразования Лоренца в матричном виде
  • 4 Свойства преобразований Лоренца
  • 5 Связанные определения
  • 6 История
  • 7 Примечания
  • 8 Литература
  • 9 См. также

Вид преобразований при коллинеарных (параллельных) пространственных осях

Если ИСО K движется относительно ИСО K с постоянной скоростью V вдоль оси x, а начала пространственных координат совпадают в начальный момент времени в обеих системах, то преобразования Лоренца (прямые) имеют вид:

 x'=frac{x-Vt}{sqrt{1-V^2/c^2}},
 y'=y,
 z'=z,
 t'=frac{t-(V/c^2)x}{sqrt{1-V^2/c^2}},

где c — скорость света в вакууме, величины со штрихами измерены в системе K, без штрихов — в K.

Эта форма преобразования (то есть при выборе коллинеарных осей), называемое иногда бустом (англ. boost) или лоренцевским бустом (особенно в англоязычной литературе), несмотря на свою простоту включает, по сути, всё специфическое физическое содержание преобразований Лоренца, так как пространственные оси всегда можно выбрать таким образом, а при желании добавить пространственные повороты не представляет трудности (см. это в явном развёрнутом виде ниже), хотя и делает формулы более громоздкими.

  • Формулы, выражающие обратное преобразование, то есть выражающие x‘,y‘,z‘,t через x,y,z,tможно получить просто заменой V на V (абсолютная величина относительной скорости движения систем отсчёта | V | одинакова при измерении её в обеих системах отсчёта, поэтому можно при желании снабдить V штрихом, только при этом надо внимательно следить за тем, чтобы знак и определение соответствовали друг другу) и взаимной заменой штрихованных x и t с нештрихованными. Или решая систему уравнений (1) относительно x’, y’, z’, t’.
  • Надо иметь ввиду, что в литературе преобразования Лоренца часто записывается для упрощения в системе единиц, где c = 1, что действительно делает их вид более изящным.
  • Видно, что при преобразованиях Лоренца события, одновременные в одной системе отсчёта, не являются одновременными в другой (относительность одновременности), кроме того у движущегося тела сокращается продольный размер по сравнению с тем, какой оно имеет в сопутствующей ему системе отсчёта (лоренцево сокращение), а ход движущихся часов замедляется, если наблюдать их из «неподвижной» системы отсчёта (релятивистское замедление времени).

Вывод преобразований

Преобразования Лоренца могут быть получены абстрактно, из групповых соображений (в этом случае они получаются с неопределённым c), как обобщение преобразований Галилея (что было проделано Пуанкаре — см. ниже). Однако впервые были получены как преобразования, относительно которых ковариантны уравнения Максвелла (то есть по сути — которые не меняют законов электродинамики и оптики). Могут также быть получены из предположения линейности преобразований и постулата одинаковости скорости света во всех системах отсчёта (являющегося упрощённой формулировкой требования ковариантности электродинамики относительно искомых преобразований, и распространением принципа равноправия инерциальных систем отсчёта — принципа относительности — на электродинамику), как это делается в специальной теории относительности (СТО) (при этом c в преобразованиях Лоренца получается определённым и совпадает со скоростью света).

Надо заметить, что если не ограничивать класс преобразований координат линейными, то первый закон Ньютона выполняется не только для преобразований Лоренца, а для более широкого класса дробно-линейных преобразований (однако этот более широкий класс преобразований — за исключением, конечно, частного случая преобразований Лоренца — не сохраняет метрику постоянной).

Алгебраический вывод

На основании нескольких естественных предположений (основным из которых является предположение о существовании принципиально максимальной скорости распространения взаимодействий) можно показать, что при смене ИСО должна сохраняться величина

ds2 = c2dt2dx2dy2dz2,

называемая интервалом. Из этой теоремы напрямую следует общий вид преобразований Лоренца (см. ниже). Здесь рассмотрим лишь частный случай. Для наглядности при переходе в ИСО K, движущуюся со скоростью v, выберем в исходной системе K ось X сонаправленной с v, а оси Y и Z расположим перпендикулярно оси X. Оси ИСО K выберем сонаправленными с осями ИСО K. При таком преобразовании

y' = y, ~~ z' = z, ~~ c^2 t'^2 - x'^2 = c^2 t^2 - x^2

Мы будем искать линейные преобразования Лоренца, так как при бесконечно малых преобразованиях координат дифференциалы новых координат линейно зависят от дифференциалов старых координат, а в силу однородности пространства и времени коэффициенты не могут зависеть от координат, только от взаимной ориентации и скорости ИСО.

То, что поперечные координаты не могут меняться, ясно из соображений изотропности пространства. Действительно, величина y не может изменяться и при этом не зависеть от x (кроме как при вращении вокруг v, которое мы исключаем из рассмотрения), в чём легко убедиться подстановкой таких линейных преобразований в выражение для интервала. Но если она зависит от x, то точка с координатой (0,x,0,0) будет иметь ненулевую координату y, что противоречит наличию симметрии вращения системы относительно v и изотропии пространства. Аналогично для z.

Наиболее общий вид таких преобразований:

y' = y, ~~ z' = z, ~~ c t' = c t ,operatorname{ch},alpha - x ,operatorname{sh},alpha, ~~ x' = x ,operatorname{ch},alpha - c t ,operatorname{sh},alpha

где α — некоторый параметр, называемый быстротой. Обратные преобразования имеют вид

y = y', ~~ z = z', ~~ c t = c t', operatorname{ch},alpha + x' ,operatorname{sh},alpha, ~~ x =  x',operatorname{ch},alpha + c t',operatorname{sh},alpha

Ясно, что точка, покоящаяся в ИСО K, должна будет двигаться в ИСО K со скоростью v. С другой стороны, если точка покоится, то

dx = 0 = dx',operatorname{ch},alpha + c,dt',operatorname{sh},alpha
frac{dx'}{c,dt'} = -frac{v}{c} = - operatorname{th},alpha ~ Rightarrow ~
operatorname{th},alpha = frac{v}{c}

Учитывая, что при смене ИСО не должна меняться ориентация пространства, получим что

operatorname{ch},alpha geqslant 0

Следовательно, уравнение для быстроты однозначно разрешимо:

operatorname{ch},alpha = frac{1}{sqrt{1-frac{v^2}{c^2}}}, ~~
operatorname{sh},alpha = frac{v}{c sqrt{1-frac{v^2}{c^2}}}

а преобразования Лоренца имеют вид

 x' = gamma (x - vt)
 t' = gamma (t - frac{v}{c^2} x)
gamma = operatorname{ch},alpha = frac{1}{sqrt{1-frac{v^2}{c^2}}}

Параметр γ называется лоренц-фактором.

Группа симметрий уравнений Максвелла

Наглядный вывод преобразований Лоренца

Примем постулаты СТО, сводящиеся к расширенному принципу относительности, утверждающему, что все физические процессы протекают в точности одинаково во всех инерциальных системах отсчета (уточняющий его принцип постоянства скорости света в СТО означает расширение принципа относительности на электродинамику вместе с уточняющим утверждением о том, что нет никакой фундаментальной физической среды (эфира), которая выделяла бы одну из систем отсчета на опыте — то есть если даже эфир и есть, то его наличие не должно никак нарушать принципа относительности на практике). Кроме того, полезно явно подчеркнуть, что принцип постоянства скорости света означает наличие именно конечной скорости (скорости света), заложенной в фундаментальные законы (уравнения), одной и той же для всех инерциальных систем отсчета, причём и в каждой системе отсчета величина скорости света одинакова для любых направлений его распространения (это используется ниже).

Преобразование для поперечных осей (п.1)

Пусть есть две бесконечные плоскости, перпендикулярные оси y. Расстояние между этими плоскостями очевидно не должно зависеть от скорости движения плоскостей вдоль самих себя (то есть переходя в себя же), а значит — не зависит от выбора системы отсчета среди движущихся вдоль оси x. (Чтобы быть совсем уверенным в этом, можно провести мысленный эксперимент, заключающийся в измерении времени, требующегося лучу света, движущемуся вдоль y в каждой такой системе отсчета, для того, чтобы, стартовав на одной плоскости, достичь второй, и увидеть, что такое время очевидно будет одинаковым, если верны постулаты СТО).

То же самое, конечно, верно и для оси z. Поэтому, исключив для простоты физически неинтересный случай поворота координат второй системы относительно первой на постоянный (независящий от времени) угол, получаем:

y = y‘,z = z

Замедление времени (п.2)

Показать, что любые процессы (например ход часов) выглядит медленнее из системы отсчета где носитель этого процесса (например часы) движется, чем в его собственной системе отсчета (в которой он неподвижен), и найти количественно фактор такого замедления, можно, рассмотрев мысленный эксперимент со «световыми часами», представляющими собой источник и приемник света, удаленные друг от друга на известное фиксированное расстояние L, и отмеряющие, таким образом, интервал времени L/c, соответствующий времени прохождения света от источника до приемника (это можно непрерывно повторять). Все другие часы, из принципу относительности, должны идти точно так же.

Для более прямого соответствия формы полученного результата формуле прямого преобразования Лоренца, будем считать, что наши световые часы покоятся в нештрихованой системе отсчета K, штрихованая же система отсчета K’ пусть движется для определенности вправо вдоль оси x со скоростью V. Источник и приемник расположим вдоль оси y при x=0. Это частный случай, который позволит нам получить сперва отдельно частное и более простое преобразование для времени.

Поместим источник в начальный момент времени в начало координат, обозначив его A (см. рисунок, там он изображен красной точкой), а приемник обозначим B (синяя точка). В нештрихованой системе отсчета (на рисунке слева) импульс света летит точно по оси y (B, как и A в этой системе неподвижны). Таким образом, от излучения до поглощения света в этой системе проходит время ~t = L/c.

В штрихованой же системе отсчета точки A и B движутся влево со скоростью V. Особенно нас интересует движение точки B, обозначенное на рисунке пунктиром. Из-за этого ее смещения, равного ~-Vt', свету в этой системе отсчета приходится пройти не расстояние L, а большее (на рисунке путь света от A к B изображен зеленой линией). Это расстояние нетрудно выразить с помощью теоремы Пифагора, и оно же равно ct’, откуда:

(ct‘)2 = L2 + (Vt‘)2,

а учитывая упомянутые чуть выше L = ct и выражая t’ через t, имеем:

t' = t / sqrt{1 - V^2/c^2},

что и является преобразованием Лоренца для времени для условия x = 0.

(по сути же это есть замедление времени при наблюдении часов — или любого другого процесса с локальным носителем — из системы отсчета, движущейся относительно него: мы видим, что t’ > t).

Относительность одновременности (п.3)

Кроме замедления времени в движущейся системе отсчета (замедления хода всех часов движущейся лаборатории при наблюдении их из неподвижной), оказывается, что начало отсчета времени в движущейся системе отсчета также не совпадает с таковым в неподвижной, причем сдвиг этого начала отсчета — разный в разных точках — зависит от x (часы, выглядящие синхронными в своей собственной системе отсчета, выглядят идущими с разным опережением-отставанием, зависящим от их пространственного расположения, если на них смотреть из другой системы отсчета, такой, в которой их собственная система отсчета движется).

Чтобы стало понятным само существо проблемы, придется так или иначе обдумать вопрос, а что значит, что часы в разных удаленных друг от друга точках пространства (например, в разных городах) идут одинаково (синхронно), как в этом можно убедиться, или как (с помощью какой процедуры) можно синхронизировать часы в разных местах, если изначально они не были синхронны.

Уже простейший способ синхронизации, заключающийся в том, что все часы синхронизируют в одном месте, а затем переносят в разные точки, позволяет качественно убедиться в том, что часы, синхронизированные в одной системе отсчета, будут выглядеть показывающими разное время из другой системы отсчета. Дело в том, что для часов, которые мы переносим вправо по оси x и влево по оси x, — время будет замедляться по-разному, так как их скорость будет обязательно различной в этой другой системе отсчета.

Это можно было бы аккуратно рассмотреть количественно, получив так искомый здесь результат. Но более просто этого достичь позволяет рассмотрение синхронизации с помощью световых сигналов (а принцип относительности говорит, что любой корректный способ синхронизации должен дать один и тот же результат, в чём, впрочем, при желании можно убедиться и явно).

Итак, рассмотрим синхронизацию с помощью световых сигналов. Этот процесс может заключаться, например, в обмене световыми сигналами между двумя удаленными хронометрами: если сигналы испущены в одно и то же время, то до получения сигнала по каждым часам пройдет одно и то же время. Но еще проще несколько другой (эквивалентный этому) способ: можно точно в середине отрезка, соединяющего хронометры, произвести вспышку света, и утверждать, что свет придет к обоим хронометрам одновременно.

В собственной системе отсчета (в которой хронометры неподвижны) картина симметрична. Однако в любой другой системе отсчета оба хронометра движутся (для определенности будем считать, что вправо), и тогда свету от середины отрезка, соединяющего их в начальный момент, потребуется меньше времени, чтобы дойти до левого хронометра (движущегося навстречу свету), чем до правого (который импульс света должен догонять).

Таким образом, хронометры, синхронные в своей собственной системе отсчета, по часам другой системы отсчета выглядят несинхронными. А это и означает, что события, одновременные в одной системе отсчета, неодновременны в другой. Это и называется относительностью одновременности.

Несложные геометрические выкладки позволяют (изобразив движение световых импульсов и хронометров на плоскости xt), получить выражение для сдвига начала отсчета времени:

Vx / c2
  • (для упрощения мы здесь рассматривали только часы, разнесенные вдоль оси x, но, конечно, всё может быть рассчитано и для общего случая).

Таким образом, сводя вместе результаты пунктов 1 и 2, получаем для преобразования времени

t' = frac{t - Vx/c^2}{sqrt{1-V^2/c^2}}.

Лоренцевское сокращение длины (п.4)

Рассмотрев движение светового импульса вдоль оси x (а не вдоль y, как было в п.1), и потребовав (на основании постулата одинаковости скорости света во всех инерциальных системах отсчёта), чтобы расстояние между двумя точками было всегда равно времени, за которое свет идёт от одной точки до другой, делённому на (константу) скорость света, можно получить фактор сокращения расстояний вдоль оси x, а учитывая, что смещение начала отсчёта Vt очевидно, можно получить и преобразование для x:

x' = frac{x - Vt}{sqrt{1-V^2/c^2}}.

Однако ещё проще теперь понять, что x выражается именно таким образом, заметив, что в плоскости xct график движения[1] импульса света должен быть прямой, наклонённой под 45° (из-за того, что скорость света — всегда c), а значит и масштаб по x и по ct должен быть одинаковым, а выражения в системе единиц c = 1 — симметричными.

  • Таким образом достаточно наглядно получаются преобразования Лоренца при коллинеарных пространственных осях. Конечно, возможен и обратный порядок рассуждений: можно сначала получить преобразования Лоренца каким-то более абстрактным способом, например — одним из упомянутых в статье выше, а потом получить все эффекты, разобранные в этапах данного наглядного доказательства, в качестве простого формального следствия преобразований Лоренца.

Разные формы записи преобразований

Вид преобразований при произвольной ориентации осей

В силу произвольности введения осей координат, многие задачи можно свести к указанному случаю. Если же задача требует иного расположения осей, то можно воспользоваться формулами преобразований в более общем случае. Для этого радиус-вектор точки

mathbf{r'} = mathbf{i}x' + mathbf{j}y' + mathbf{k}z' ,

где mathbf{i}, mathbf{j}, mathbf{k} — орты, надо разбить на составляющую mathbf{r'_|} параллельную скорости и составляющую mathbf{r'_perp} ей перпендикулярную

mathbf{r'} = mathbf{r'_|} + mathbf{r'_perp}.

Тогда преобразования получат вид

mathbf{r_|}=frac{mathbf{r'_|}+mathbf{v}t'}{sqrt{1-v^2/c^2}}, mathbf{r_perp}=mathbf{r'_perp},~~ t=frac{t'+(v/c^2)r_|}{sqrt{1-v^2/c^2}},

где v = V = left| mathbf{v} right| — абсолютная величина скорости, r_| = left| mathbf{r_|} right| — абсолютная величина продольной составляющей радиус-вектора.

Эти формулы для случая параллельных осей, но с произвольно направленной скоростью, можно преобразовать к виду, впервые полученному Герглоцем:

mathbf{r} = mathbf{r'} + frac{1}{v^2}left( frac{1-sqrt{1-v^2/c^2}}{sqrt{1-v^2/c^2}} right)(mathbf{r'v})mathbf{v} + frac{mathbf{v}t'}{sqrt{1-v^2/c^2}}
t=frac{t'+mathbf{r'v}/c^2}{sqrt{1-V^2/c^2}}.

Обратите внимание, что самый общий случай, когда начала координат не совпадают в нулевой момент времени, здесь не приведён с целью экономии места. Его можно получить, добавив к преобразованиям Лоренца трансляцию (смещение начала координат).

Преобразования Лоренца в матричном виде

Для случая коллинеарных осей преобразования Лоренца записываются в виде


begin{bmatrix}
c t \x \y \z
end{bmatrix}
=
begin{bmatrix}
gamma&-frac{v}{c} gamma&0&0\
-frac{v}{c} gamma&gamma&0&0\
0&0&1&0\
0&0&0&1\
end{bmatrix}
begin{bmatrix}
c t'\x'\y'\z'
end{bmatrix}
,

где gamma equiv frac{1}{sqrt{1 - v^2/c^2}}.

При произвольной ориентации осей, в форме 4-векторов это преобразование записывается как:

begin{bmatrix} c t \ vec r end{bmatrix} = begin{bmatrix}
gamma & -frac{vec v}{c} gamma \
-frac{vec v}{c} gamma & E + frac{vec v otimes vec v}{v^2}(gamma -1) 
end{bmatrix} begin{bmatrix} c t \ vec r end{bmatrix}
gamma = frac{1}{sqrt{1-frac{v^2}{c^2}}}

где E — единичная матрица 3times3, otimes — тензорное умножение трехмерных векторов.

Надо иметь ввиду, что в литературе матрица преобразований Лоренца часто записывается для упрощения в системе единиц, где c = 1.

Произвольное однородное преобразование Лоренца можно представить как некоторую композицию вращений пространства и элементарных преобразований Лоренца, затрагивающих только время и одну из координат. Это следует из алгебраической теоремы о разложении произвольного вращения на простые.

Свойства преобразований Лоренца

  • Можно заметить, что в случае, когда crightarrowinfty, преобразования Лоренца переходят в преобразования Галилея. То же самое происходит в случае, когда v/crightarrow0. Это говорит о том, что специальная теория относительности совпадает с механикой Ньютона либо в мире с бесконечной скоростью света, либо при скоростях, малых по сравнению со скоростью света. Последее объясняет, каким образом сочетаются эти две теории — первая является обобщением и уточнением второй, а вторая — предельным случаем первой, оставаясь в этом качестве верной приближенно (с некоторой точностью, на практике часто очень и очень большой) при достаточно малых (по сравнению со скоростью света) скоростях движений.
  • Преобразования Лоренца сохраняют инвариантным интервал для любой пары событий (точек пространства-времени) — то есть любой пары точек пространства — времени:
 s = sqrt{c^2 (Delta t)^2- (Delta x)^2 - (Delta y)^2 - (Delta z)^2}

(убедиться в этом нетрудно, например, убедившись явно в том, что матрица преобразования Лоренца L — ортогональна в смысле метрики, определяемой таким выражением, то есть если sum_{j,k}L^i_j eta_{ik} L^k_m = delta_{jm}, что проще всего проверить для буста, для трехмерных же вращений это очевидно, следовательно, верно и для любых их композиций; как только мы узнали, что преобразования ортогональны, значит расстояние, вычисленное в такой метрике, неизменно в любой системе координат — по свойству ортогональных преобразований).

  • В частности, инвариантность интервала имеет место и для случая s = 0, а значит — гиперповерхность в пространстве-времени, которая определяется равенством нулю интервала до заданной точки — световой конус — является неподвижной при преобразованиях Лоренца (что является проявлением инвариантности скорости света). Внутреность двух полостей конуса соответствует времениподобным — вещественным — интервалам от их точек до вершины, внешняя область — пространственноподобным — чисто мнимым (в принятой в этой статье сигнатуре интервала).
  • Другие инвариантные гиперповерхности однородных преобразований Лоренца (аналоги сферы для пространства Минковского) — гиперболоиды: двуполостный гиперболоид для времениподобных интервалов относительно начала координат, и однополостный — для пространственноподобных интервалов.
  • Матрицу преобразования Лоренца при коллинеарных пространственных осях (в системе единиц c=1) можно представить как:
    
begin{bmatrix}
mathop{rm ch} theta & -mathop{rm sh} theta & 0 & 0\
-mathop{rm sh} theta & mathop{rm ch} theta & 0 & 0\
0 & 0 & 1 & 0\
0 & 0 & 0 & 1\
end{bmatrix}
где theta = mathop{rm Arth} (V/c) . В этом легко убедиться, учитывая  mathop{rm ch}^2 theta - mathop{rm sh}^2 theta = 1  и проверив выполнение соответствущего тождества для матрицы преобразования Лоренца в обычном виде.

Связанные определения

Лоренц-инвариантность — свойство физических законов записываться одинаково во всех инерциальных системах отсчета(с учетом преобразований Лоренца). Принято считать, что этим свойством должны обладать все физические законы, и экспериментальных отклонений от него не обнаружено. Однако некоторые теории пока не удаётся построить так, чтобы выполнялась Лоренц-инвариантность.

История

Преобразования названы в честь их первооткрывателя — Х. А. Лоренца, который впервые ввел их (вместо преобразований Галилея) в качестве преобразований, связывающих геометрические величины (длины, углы), измеренных в разных инерциальных системах отсчета, чтобы устранить противоречия между электродинамикой и механикой, которые имелись в ньютоновской формулировке, включающей преобразования Галилея, что в конечном итоге привело к успеху при существенной модификации механики.

Сначала было обнаружено, что уравнения Максвелла инвариантны относительно этих преобразований (В. Фогтом в 1887 г.). Это же было повторено Лармором в 1900 г..

В 1892 г. Лоренц ввёл теорию сокращения, предполагающую сокращение длин всех твёрдых тел в направлении движения, количественно совпадающее с тем, что понимается сейчас под лоренцевым сокращением.

Преобразования Лоренца были впервые опубликованы в 1904 г. но в то время их форма была несовершенна. К современному, полностью самосогласованному виду их привёл французский математик А. Пуанкаре. Только в 1905 г. Пуанкаре и затем Эйнштейн в своей теории относительности пришёл к широко популярной впоследствии формально-аксиоматической трактовке этих преобразований. Пуанкаре же ввел термины «преобразования Лоренца» и «группа Лоренца», показал, исходя из эфирной модели, невозможность обнаружить движение относительно абсолютной системы отсчета (системы, в который эфир неподвижен), модифицировав таким образом принцип относительности Галилея. Ему же принадлежит групповой вывод явного вида преобразований Лоренца (с неопределенным c) без независимого постулата инвариантности скорости света.

Примечания

  1. Минковский назвал такой график движения мировой линией; однако в этом параграфе мы не будем углубляться в связь преобразований Лоренца с понятием пространства Минковского в полном его объёме, прежде всего — чтобы не усложнять и не прерывать элементарный вывод, который удобнее считать независимым от каких-либо дополнительных специальных понятий, ограничившись только элементарными геометрическими и алгебраическими понятиями лишь настолько, насколько они необходимы. По сути, речь идёт именно о преобразовании координат в пространстве Минковского, причём в данном параграфе, исходя из постулата постоянства скорости света, как раз и выясняются определённые свойства этого пространства, как и преобразований Лоренца — в качестве удобных преобразований координат в нём. Но ещё раз для ясности подчеркнем, что для самого вывода не нужно знать ничего кроме того, что явно сказано в основном тексте параграфа.

Литература

  • Ландау, Л. Д., Лифшиц, Е. М. Теория поля. — Издание 7-е, исправленное. — М.: Наука, 1988. — 512 с. — («Теоретическая физика», том II). — ISBN 5-02-014420-7
  • Физическая энциклопедия, т.2 — М.:Большая Российская Энциклопедия стр.608 и стр.609.
  • Ф. И. Фёдоров Группа Лоренца. — М.: Наука, 1979. 384 с.
  • Гельфанд И. М., Минлос Р. А., Шапиро З. Я. Представление группы вращений и группы Лоренца. М., 1958.

См. также

  • Сложное движение (формула преобразования скорости, согласованная с преобразованиями Лоренца)

Wikimedia Foundation.
2010.

A visualisation of the Lorentz transformation (full animation). Only one space coordinate is considered. The thin solid lines crossing at right angles depict the time and distance coordinates of an observer at rest with respect to that frame; the skewed solid straight lines depict the coordinate grid of an observer moving with respect to that same frame.

In physics, the Lorentz transformation describes how, according to the theory of special relativity, two observers’ varying measurements of space and time can be converted into each other’s frames of reference. It is named after the Dutch physicist Hendrik Lorentz. It reflects the surprising fact that observers moving at different velocities may measure different distances, elapsed times, and even different orderings of events.

The Lorentz transformation was originally the result of attempts by Lorentz and others to explain how the speed of light was observed to be independent of the reference frame, and to understand the symmetries of the laws of electromagnetism. Albert Einstein later re-derived the transformation from his postulates of special relativity. The Lorentz transformation supersedes the Galilean transformation of Newtonian physics, which assumes an absolute space and time (see Galilean relativity). According to special relativity, this is a good approximation only at relative speeds much smaller than the speed of light.

If space is homogeneous, then the Lorentz transformation must be a linear transformation. Also, since relativity postulates that the speed of light is the same for all observers, it must preserve the spacetime interval between any two events in Minkowski space. The Lorentz transformation describes only the transformations in which the spacetime event at the origin is left fixed, so they can be considered as a hyperbolic rotation of Minkowski space. The more general set of transformations that also includes translations is known as the Poincaré group.

Lorentz transformation for frames in standard configuration

Standard configuration of coordinate systems for Lorentz transformations.

Assume there are two observers O and Q, each using their own Cartesian coordinate system to measure space and time intervals. O uses {displaystyle (t,x,y,z)} and Q uses {displaystyle (t',x',y',z')}. Assume further that the coordinate systems are oriented so that the x-axis and the x’ -axis are collinear, the y-axis is parallel to the y’ -axis, as are the z-axis and the z’ -axis. The relative velocity between the two observers is v along the common x-axis. Also assume that the origins of both coordinate systems are the same. If all these hold, then the coordinate systems are said to be in standard configuration. A
symmetric presentation
between the forward Lorentz Transformation and the inverse Lorentz Transformation
can be achieved if coordinate systems are in
symmetric configuration.
The symmetric form highlights that all physical laws should be of such a kind that
they remain unchanged under a Lorentz transformation.

The Lorentz transformation for frames in standard configuration can be shown to be:

{displaystyle {begin{cases}t'&=gamma left(t-vx/c^{2}right)\x'&=gamma left(x-vtright)\y'&=y\z'&=zend{cases}}}

where {displaystyle  gamma ={frac {1}{sqrt {1-{frac {v^{2}}{c^{2}}}}}}} is called the Lorentz factor.

Matrix form

This Lorentz transformation is called a «boost» in the x-direction and is often expressed in matrix form as

{displaystyle {begin{bmatrix}ct'\x'\y'\z'end{bmatrix}}={begin{bmatrix}gamma &-beta gamma &0&0\-beta gamma &gamma &0&0\0&0&1&0\0&0&0&1\end{bmatrix}}{begin{bmatrix}c,t\x\y\zend{bmatrix}} .}

This transformation matrix is universal for all four-vectors.

More generally for a boost in any arbitrary direction {displaystyle (beta _{x},beta _{y},beta _{z})},

{displaystyle {begin{bmatrix}c,t'\x'\y'\z'end{bmatrix}}={begin{bmatrix}gamma &-beta _{x},gamma &-beta _{y},gamma &-beta _{z},gamma \-beta _{x},gamma &1+(gamma -1){dfrac {beta _{x}^{2}}{beta ^{2}}}&(gamma -1){dfrac {beta _{x}beta _{y}}{beta ^{2}}}&(gamma -1){dfrac {beta _{x}beta _{z}}{beta ^{2}}}\-beta _{y},gamma &(gamma -1){dfrac {beta _{y}beta _{x}}{beta ^{2}}}&1+(gamma -1){dfrac {beta _{y}^{2}}{beta ^{2}}}&(gamma -1){dfrac {beta _{y}beta _{z}}{beta ^{2}}}\-beta _{z},gamma &(gamma -1){dfrac {beta _{z}beta _{x}}{beta ^{2}}}&(gamma -1){dfrac {beta _{z}beta _{y}}{beta ^{2}}}&1+(gamma -1){dfrac {beta _{z}^{2}}{beta ^{2}}}\end{bmatrix}}{begin{bmatrix}c,t\x\y\zend{bmatrix}} ,}

where {displaystyle beta ={frac {v}{c}}={frac {|{vec {v}}|}{c}}} and {displaystyle gamma ={frac {1}{sqrt {1-beta ^{2}}}}}.

Note that this transformation is only the «boost,» i.e., a transformation between two frames whose {displaystyle x,y}, and {displaystyle z} axis are parallel and whose spacetime origins coincide (see The «Standard configuration» Figure). The most general proper Lorentz transformation also contains a rotation of the three axes, because the composition of two boosts is not a pure boost but is a boost followed by a rotation. The rotation gives rise to Thomas precession. The boost is given by a symmetric matrix, but the general Lorentz transformation matrix need not be symmetric.

The composition of two Lorentz boosts B(u) and B(v) of velocities u and v is given by:

{displaystyle B(mathbf {u} )B(mathbf {v} )=B(mathbf {u} oplus mathbf {v} )Gyr[mathbf {u} ,mathbf {v} ]=Gyr[mathbf {u} ,mathbf {v} ]B(mathbf {v} oplus mathbf {u} )},

where u{displaystyle oplus }v is the velocity-addition, and Gyr[u,v] is the rotation arising from the composition, gyr being the gyrovector space abstraction of the gyroscopic Thomas precession, and B(v) is the 4×4 matrix that uses the components of v, i.e. v1, v2, v3 in the entries of the matrix, or rather the components of v/c in the representation that is used above.

The composition of two Lorentz transformations L(u,U) and L(v,V) which include rotations U and V is given by:

{displaystyle L(mathbf {u} ,U)L(mathbf {u} ,V)=L(mathbf {u} oplus Umathbf {v} ,gyr[mathbf {u} ,Umathbf {v} ]UV)}

If the 3×3 matrix form of the rotation applied to spatial coordinates is given by gyr[u,v], then the 4×4 matrix rotation applied to 4-coordinates is given by:

{displaystyle Gyr[mathbf {u} ,mathbf {v} ]={begin{pmatrix}1&0\0&gyr[mathbf {u} ,mathbf {v} ]end{pmatrix}}}.

Views of spacetime along the world line of a rapidly accelerating observer (center) moving in a 1-dimensional (straight line) «universe». The vertical direction indicates time, while the horizontal indicates distance, the dashed line is the spacetime trajectory («world line») of the observer. The small dots are specific events in spacetime. If one imagines these events to be the flashing of a light, then the events that pass the two diagonal lines in the bottom half of the image (the past light cone of the observer in the origin) are the events visible to the observer. The slope of the world line (deviation from being vertical) gives the relative velocity to the observer. Note how the view of spacetime changes when the observer accelerates.

For a boost in an arbitrary direction with velocity {displaystyle {vec {v}}}, it is convenient to decompose the spatial vector {displaystyle {vec {r}}} into components perpendicular and parallel to the velocity {displaystyle {vec {v}}}: {displaystyle {vec {r}}={vec {r}}_{perp }+{vec {r}}_{|}}. Then only the component {displaystyle {vec {r}}_{|}} in the direction of {displaystyle {vec {v}}} is ‘warped’ by the gamma factor:

{displaystyle {begin{cases}t'=gamma left(t-{frac {{vec {r}}cdot {vec {v}}}{c^{2}}}right)\{vec {r'}}={vec {r}}_{perp }+gamma ({vec {r}}_{|}-{vec {v}}t)end{cases}}}

where now {displaystyle gamma equiv {frac {1}{sqrt {1-{vec {v}}cdot {vec {v}}/c^{2}}}}}. The second of these can be written as:

{displaystyle {vec {r'}}={vec {r}}+left({frac {gamma -1}{v^{2}}}({vec {r}}cdot {vec {v}})-gamma tright){vec {v}}.}

These equations can be expressed in matrix form as

{displaystyle {begin{bmatrix}ct'\mathbf {r'} end{bmatrix}}={begin{bmatrix}gamma &-gamma {dfrac {mathbf {v} ^{mathrm {T} }}{c}}\-displaystyle {frac {gamma mathbf {v} }{c}}&mathbf {I} +(gamma -1){mathbf {hat {v}} mathbf {hat {v}} ^{mathrm {T} }}\end{bmatrix}}{begin{bmatrix}ct\mathbf {r} end{bmatrix}}{text{,}}}

where I is the identity matrix, v is velocity written as a column vector, vT is its transpose (a row vector) and {displaystyle mathbf {hat {v}} } is its versor.

Rapidity

The Lorentz transformation can be cast into another useful form by defining a parameter {displaystyle scriptstyle {boldsymbol {phi }}} called the rapidity (an instance of hyperbolic angle) such that

{displaystyle e^{phi }=gamma (1+beta )=gamma left(1+{frac {v}{c}}right)={sqrt {frac {1+v/c}{1-v/c}}},}

so that

{displaystyle e^{-phi }=gamma (1-beta )=gamma left(1-{frac {v}{c}}right)={sqrt {frac {1-v/c}{1+v/c}}}.}

Equivalently:

{displaystyle phi =ln left[gamma (1+beta )right]=-ln left[gamma (1-beta )right],}

Then the Lorentz transformation in standard configuration is:

{displaystyle {begin{cases}ct-x=e^{-phi }(ct'-x')\ct+x=e^{phi }(ct'+x')\y=y'\z=z'.end{cases}}}

Hyperbolic trigonometric expressions

From the above expressions for eφ and e−φ

{displaystyle gamma =cosh phi ={e^{phi }+e^{-phi } over 2},}
{displaystyle beta gamma =sinh phi ={e^{phi }-e^{-phi } over 2},}

and therefore,

{displaystyle beta =tanh phi ={e^{phi }-e^{-phi } over e^{phi }+e^{-phi }}.}

Hyperbolic rotation of coordinates

Substituting these expressions into the matrix form of the transformation, we have:

{displaystyle {begin{bmatrix}ct'\x'\y'\z'end{bmatrix}}={begin{bmatrix}cosh phi &-sinh phi &0&0\-sinh phi &cosh phi &0&0\0&0&1&0\0&0&0&1\end{bmatrix}}{begin{bmatrix}ct\x\y\zend{bmatrix}} .}

Thus, the Lorentz transformation can be seen as a hyperbolic rotation of coordinates in Minkowski space, where the rapidity {displaystyle phi } represents the hyperbolic angle of rotation, often referred to as rapidity.

Lorentz transformation of the electromagnetic field

The fact that the electromagnetic field shows relativistic effects becomes clear by carrying out a simple thought experiment:

  • Consider an observer looking at a charge being at rest. The observer will find out that there is an electric field. Since there is no electric current, however, he will state not seing any magnetic field.
  • If the observer moves toward or away from the charge with a certain velocity {displaystyle v}, he will notice that the electric field changes its value as a result of motion. This means, that he will measure different electric fields at the same place, depending on whether he is at motion or not. On the other hand, the observer will interpret the charge at motion as an electric current having a magnetic field around it.

This shows that electromagnetic field quantities need to undergo a Lorentz transformation when changing the frame of reference.
For the electric and magnetic field quantities, the following transformations apply :

{displaystyle {begin{aligned}&{vec {E}}'=gamma left({vec {E}}+{vec {v}}times {vec {B}}right)+(1-gamma ){frac {{vec {E}}cdot {vec {v}}cdot }{{v}^{2}}}{vec {v}}\&{vec {B}}'=gamma left({vec {B}}-{frac {1}{{c}^{2}}}{vec {v}}times {vec {E}}right)+(1-gamma ){frac {{vec {B}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {D}}'=gamma left({vec {D}}+{frac {1}{{c}^{2}}}{vec {v}}times {vec {H}}right)+(1-gamma ){frac {{vec {D}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {H}}'=gamma left({vec {H}}-{vec {v}}times {vec {D}}right)+(1-gamma ){frac {{vec {H}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {j}}'={vec {j}}-{frac {rho cdot {vec {v}}}{gamma }}+left({frac {1}{gamma }}-1right){frac {{vec {j}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{rho }'={frac {1}{gamma }}cdot left(rho -{frac {1}{{c}^{2}}}{vec {j}}cdot {vec {v}}right)\end{aligned}}}

In non-relativistic approximation, i. e. for speeds {displaystyle vll c}, the relativistic factor {displaystyle gamma } equals {displaystyle gamma approx 1}, so that there is no need to distinguish between the spatial and temporal coordinates in Maxwell’s equations. This yields the following transformations:

{displaystyle {begin{aligned}&{vec {E}}'={vec {E}}+{vec {v}}times {vec {B}}\&{vec {B}}'={vec {B}}-1/{{c}^{2}}{vec {v}}times {vec {E}}approx {vec {B}}\&{vec {E}}={vec {E}}'-{vec {v}}times {vec {B}}'\&{vec {B}}={vec {B}}'+1/{{c}^{2}}{vec {v}}times {vec {E}}'approx {B}'\end{aligned}}}

The electric and magnetic fields transform differently from space and time, but exactly the same way as relativistic angular momentum and the boost vector.

The electromagnetic field strength tensor is given by

{displaystyle F^{mu nu }={begin{bmatrix}0&-{frac {1}{c}}E_{x}&-{frac {1}{c}}E_{y}&-{frac {1}{c}}E_{z}\{frac {1}{c}}E_{x}&0&-B_{z}&B_{y}\{frac {1}{c}}E_{y}&B_{z}&0&-B_{x}\{frac {1}{c}}E_{z}&-B_{y}&B_{x}&0end{bmatrix}}{text{(SI units, signature }}(+,-,-,-){text{)}}.}

in SI units. In relativity, the Gaussian system of units is often preferred over SI units, even in texts whose main choice of units is SI units, because in it the electric field E and the magnetic induction B have the same units making the appearance of the electromagnetic field tensor more natural. Consider a Lorentz boost in the x-direction. It is given by

{displaystyle {Lambda ^{mu }}_{nu }={begin{bmatrix}gamma &-gamma beta &0&0\-gamma beta &gamma &0&0\0&0&1&0\0&0&0&1\end{bmatrix}},qquad F^{mu nu }={begin{bmatrix}0&E_{x}&E_{y}&E_{z}\-E_{x}&0&B_{z}&-B_{y}\-E_{y}&-B_{z}&0&B_{x}\-E_{z}&B_{y}&-B_{x}&0end{bmatrix}}{text{(Gaussian units, signature }}(-,+,+,+){text{)}},}

where the field tensor is displayed side by side for easiest possible reference in the manipulations below.

The general transformation law (T3) becomes

{displaystyle F^{mu 'nu '}={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }.}

For the magnetic field one obtains

{displaystyle {begin{aligned}B_{x'}&=F^{2'3'}={Lambda ^{2}}_{mu }{Lambda ^{3}}_{nu }F^{mu nu }={Lambda ^{2}}_{2}{Lambda ^{3}}_{3}F^{23}=1times 1times B_{x}\&=B_{x},\B_{y'}&=F^{3'1'}={Lambda ^{3}}_{mu }{Lambda ^{1}}_{nu }F^{mu nu }={Lambda ^{3}}_{3}{Lambda ^{1}}_{nu }F^{3nu }={Lambda ^{3}}_{3}{Lambda ^{1}}_{0}F^{30}+{Lambda ^{3}}_{3}{Lambda ^{1}}_{1}F^{31}\&=1times (-beta gamma )(-E_{z})+1times gamma B_{y}=gamma B_{y}+beta gamma E_{z}\&=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{y}\B_{z'}&=F^{1'2'}={Lambda ^{1}}_{mu }{Lambda ^{2}}_{nu }F^{mu nu }={Lambda ^{1}}_{mu }{Lambda ^{2}}_{2}F^{mu 2}={Lambda ^{1}}_{0}{Lambda ^{2}}_{2}F^{02}+{Lambda ^{1}}_{1}{Lambda ^{2}}_{2}F^{12}\&=(-gamma beta )times 1times E_{y}+gamma times 1times B_{z}=gamma B_{z}-beta gamma E_{y}\&=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{z}end{aligned}}}

For the electric field results

{displaystyle {begin{aligned}E_{x'}&=F^{0'1'}={Lambda ^{0}}_{mu }{Lambda ^{1}}_{nu }F^{mu nu }={Lambda ^{0}}_{1}{Lambda ^{1}}_{0}F^{10}+{Lambda ^{0}}_{0}{Lambda ^{1}}_{1}F^{01}\&=(-gamma beta )(-gamma beta )(-E_{x})+gamma gamma E_{x}=-gamma ^{2}beta ^{2}(E_{x})+gamma ^{2}E_{x}=E_{x}(1-beta ^{2})gamma ^{2}\&=E_{x},\E_{y'}&=F^{0'2'}={Lambda ^{0}}_{mu }{Lambda ^{2}}_{nu }F^{mu nu }={Lambda ^{0}}_{mu }{Lambda ^{2}}_{2}F^{mu 2}={Lambda ^{0}}_{0}{Lambda ^{2}}_{2}F^{02}+{Lambda ^{0}}_{1}{Lambda ^{2}}_{2}F^{12}\&=gamma times 1times E_{y}+(-beta gamma )times 1times B_{z}=gamma E_{y}-beta gamma B_{z}\&=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{y}\E_{z'}&=F^{0'3'}={Lambda ^{0}}_{mu }{Lambda ^{3}}_{nu }F^{mu nu }={Lambda ^{0}}_{mu }{Lambda ^{3}}_{3}F^{mu 3}={Lambda ^{0}}_{0}{Lambda ^{3}}_{3}F^{03}+{Lambda ^{0}}_{1}{Lambda ^{3}}_{3}F^{13}\&=gamma times 1times E_{z}-beta gamma times 1times (-B_{y})=gamma E_{z}+beta gamma B_{y}\&=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{z}.end{aligned}}}

Here, β = (β, 0, 0) is used. These results can be summarized by

{displaystyle {begin{aligned}mathbf {E} _{parallel '}&=mathbf {E} _{parallel }\mathbf {B} _{parallel '}&=mathbf {B} _{parallel }\mathbf {E} _{bot '}&=gamma left(mathbf {E} _{bot }+{boldsymbol {beta }}times mathbf {B} _{bot }right)=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{bot },\mathbf {B} _{bot '}&=gamma left(mathbf {B} _{bot }-{boldsymbol {beta }}times mathbf {E} _{bot }right)=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{bot },end{aligned}}}

and are independent of the metric signature. For SI units, substitute E → ​Ec. Misner, Thorne & Wheeler (1973) refer to this last form as the 3 + 1 view as opposed to the geometric view represented by the tensor expression

{displaystyle F^{mu 'nu '}={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu },}

and make a strong point of the ease with which results that are difficult to achieve using the 3 + 1 view can be obtained and understood. Only objects that have well defined Lorentz transformation properties (in fact under any smooth coordinate transformation) are geometric objects. In the geometric view, the electromagnetic field is a six-dimensional geometric object in spacetime as opposed to two interdependent, but separate, 3-vector fields in space and time. The fields E (alone) and B (alone) do not have well defined Lorentz transformation properties. The mathematical underpinnings are equations (T1) and (T2) that immediately yield (T3). One should note that the primed and unprimed tensors refer to the same event in spacetime. Thus the complete equation with spacetime dependence is

{displaystyle F^{mu 'nu '}left(x'right)={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }left(Lambda ^{-1}x'right)={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }(x).}

Length contraction has an effect on charge density ρ and current density J, and time dilation has an effect on the rate of flow of charge (current), so charge and current distributions must transform in a related way under a boost. It turns out they transform exactly like the space-time and energy-momentum four-vectors,

{displaystyle {begin{aligned}mathbf {j} '&=mathbf {j} -gamma rho vmathbf {n} +left(gamma -1right)(mathbf {j} cdot mathbf {n} )mathbf {n} \rho '&=gamma left(rho -mathbf {j} cdot {frac {vmathbf {n} }{c^{2}}}right),end{aligned}}}

or, in the simpler geometric view,

{displaystyle j^{mu ^{prime }}={Lambda ^{mu '}}_{mu }j^{mu }.}

Spacetime interval

In a given coordinate system ({displaystyle x^{mu }}), if two events {displaystyle A} and {displaystyle B} are separated by

{displaystyle (Delta t,Delta x,Delta y,Delta z)=(t_{B}-t_{A},x_{B}-x_{A},y_{B}-y_{A},z_{B}-z_{A}) ,}

the spacetime interval between them is given by

{displaystyle s^{2}=-c^{2}(Delta t)^{2}+(Delta x)^{2}+(Delta y)^{2}+(Delta z)^{2} .}

This can be written in another form using the Minkowski metric. In this coordinate system,

{displaystyle eta _{mu nu }={begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}} .}

Then, we can write

{displaystyle s^{2}={begin{bmatrix}cDelta t&Delta x&Delta y&Delta zend{bmatrix}}{begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}}{begin{bmatrix}cDelta t\Delta x\Delta y\Delta zend{bmatrix}}}

or, using the Einstein summation convention,

{displaystyle s^{2}=eta _{mu nu }x^{mu }x^{nu } .}

Now suppose that we make a coordinate transformation {displaystyle x^{mu }rightarrow x'^{mu }}. Then, the interval in this coordinate system is given by

{displaystyle s'^{2}={begin{bmatrix}cDelta t'&Delta x'&Delta y'&Delta z'end{bmatrix}}{begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}}{begin{bmatrix}cDelta t'\Delta x'\Delta y'\Delta z'end{bmatrix}}}

or

{displaystyle s'^{2}=eta _{mu nu }x'^{mu }x'^{nu } .}

It is a result of special relativity that the interval is an invariant. That is, {displaystyle s^{2}=s'^{2} }. It can be shown that this requires the coordinate transformation to be of the form

{displaystyle x'^{mu }=x^{nu }Lambda _{nu }^{mu }+C^{mu } .}

Here, {displaystyle C^{mu } } is a constant vector and {displaystyle {Lambda ^{mu }}_{nu }} a constant matrix, where we require that

{displaystyle eta _{mu nu }Lambda _{alpha }^{mu }Lambda _{beta }^{nu }=eta _{alpha beta } .}

Such a transformation is called a Poincaré transformation or an inhomogeneous Lorentz transformation. The {displaystyle C^{a}} represents a spacetime translation. When {displaystyle C^{a},=0}, the transformation is called an homogeneous Lorentz transformation, or simply a Lorentz transformation.

Taking the determinant of {displaystyle eta _{mu nu }{Lambda ^{mu }}_{alpha }{Lambda ^{nu }}_{beta }=eta _{alpha beta }} gives us

{displaystyle det(Lambda _{b}^{a})=pm 1 .}

Lorentz transformations with {displaystyle det({Lambda ^{mu }}_{nu })=+1} form a subgroup called proper Lorentz transformations which is the special orthogonal group {displaystyle SO(1,3)}. Those with {displaystyle det({Lambda ^{mu }}_{nu })=-1} are called improper Lorentz transformations which is not a subgroup, as the product of any two improper Lorentz transformations will be a proper Lorentz transformation. From the above definition of {displaystyle Lambda } it can be shown that {displaystyle ({Lambda ^{0}}_{0})^{2}geq 1}, so either {displaystyle {Lambda ^{0}}_{0}geq 1} or {displaystyle {Lambda ^{0}}_{0}leq -1}, called orthochronous and non-orthochronous respectively. An important subgroup of the proper Lorentz transformations are the proper orthochronous Lorentz transformations which consist purely of boosts and rotations. Any Lorentz transform can be written as a proper orthochronous, together with one or both of the two discrete transformations; space inversion ({displaystyle P}) and time reversal ({displaystyle T}), whose non-zero elements are:

{displaystyle P_{0}^{0}=1,P_{1}^{1}=P_{2}^{2}=P_{3}^{3}=-1}
{displaystyle T_{0}^{0}=-1,T_{1}^{1}=T_{2}^{2}=T_{3}^{3}=1}

The set of Poincaré transformations satisfies the properties of a group and is called the Poincaré group. Under the Erlangen program, Minkowski space can be viewed as the geometry defined by the Poincaré group, which combines Lorentz transformations with translations. In a similar way, the set of all Lorentz transformations forms a group, called the Lorentz group.

A quantity invariant under Lorentz transformations is known as a Lorentz scalar.

Special relativity

One of the most astounding consequences of Einstein’s clock-setting method is the idea that time is relative. In essence, each observer’s frame of reference is associated with a unique set of clocks, the result being that time passes at different rates for different observers. This was a direct result of the Lorentz transformations and is called time dilation. We can also clearly see from the Lorentz «local time» transformation that the concept of the relativity of simultaneity and of the relativity of length contraction are also consequences of that clock-setting hypothesis.

Lorentz transformations can also be used to prove that magnetic and electric fields are simply different aspects of the same force — the electromagnetic force. If we have one charge or a collection of charges which are all stationary with respect to each other, we can observe the system in a frame in which there is no motion of the charges. In this frame, there is only an «electric field». If we switch to a moving frame, the Lorentz transformation will predict that a «magnetic field» is present. This field was initially unified in Maxwell’s concept of the «electromagnetic field».

The correspondence principle

For relative speeds much less than the speed of light, the Lorentz transformations reduce to the Galilean transformation in accordance with the correspondence principle.

The correspondence limit is usually stated mathematically as: as {displaystyle vrightarrow 0}, {displaystyle crightarrow infty }. In words: as velocity approaches 0, the speed of light (seems to) approach infinity. Hence, it is sometimes said that nonrelativistic physics is a physics of «instant action at a distance».

History

See also History of Lorentz transformations.

Many physicists, including George FitzGerald, Joseph Larmor, Hendrik Lorentz and Woldemar Voigt, had been discussing the physics behind these equations since 1887.
Larmor and Lorentz, who believed the luminiferous ether hypothesis, were seeking the transformation under which Maxwell’s equations were invariant when transformed from the ether to a moving frame. Early in 1889, Oliver Heaviside had shown from Maxwell’s equations that the electric field surrounding a spherical distribution of charge should cease to have spherical symmetry once the charge is in motion relative to the ether. FitzGerald then conjectured that Heaviside’s distortion result might be applied to a theory of intermolecular forces. Some months later, FitzGerald published his conjecture in Science to explain the baffling outcome of the 1887 ether-wind experiment of Michelson and Morley. This idea was extended by Lorentz
and Larmor
over several years, and became known as the FitzGerald-Lorentz explanation of the Michelson-Morley null result, known early on through the writings of Lodge, Lorentz, Larmor, and FitzGerald.
Their explanation was widely known before 1905.
Larmor is also credited to have been the first to understand the crucial time dilation property inherent in his equations.

In 1905, Henri Poincaré was the first to recognize that the transformation has the properties of a mathematical group,
and named it after Lorentz.
Later in the same year Einstein derived the Lorentz transformation under the assumptions of the principle of relativity and the constancy of the speed of light in any inertial reference frame,
obtaining results that were algebraically equivalent to
Larmor’s (1897) and Lorentz’s (1899, 1904), but with a different interpretation.

Paul Langevin (1911) said of the transformation:

«It is the great merit of H. A. Lorentz to have seen that the fundamental equations of electromagnetism admit a group of transformations which enables them to have the same form when one passes from one frame of reference to another; this new transformation has the most profound implications for the transformations of space and time».

Derivation

The usual treatment is based on the invariance of the speed of light, as seen by the Michelson-Morley experiment. However, this is not necessarily the starting point: indeed (as is exposed, for example, in the second volume of the Course of Theoretical Physics by Landau and Lifshitz), what is really at stake is the locality of interactions: one supposes that the influence that one particle, say, exerts on another can not be transmitted instantaneously. Hence, there exists a theoretical maximal speed of information transmission which must be invariant, and it turns out that this speed coincides with the speed of light in vacuum. The need for locality in physical theories was already noted by Newton (see Koestler’s The Sleepwalkers), who considered the notion of an action at a distance «philosophically absurd» and believed that gravity must be transmitted by an agent (such as an interstellar aether) which obeys certain physical laws.

Michelson and Morley in 1887 designed an experiment, employing an interferometer and a half-silvered mirror, that was accurate enough to detect aether flow. The mirror system reflected the light back into the interferometer. If there were an aether drift, it would produce a phase shift and a change in the interference that would be detected. However, no phase shift was ever found. The negative outcome of the Michelson-Morley experiment left the concept of aether (or its drift) undermined. There was consequent perplexity as to why light evidently behaves like a wave, without any detectable medium through which wave activity might propagate.

In a 1964 paper, Erik Christopher Zeeman showed that the causality preserving property, a condition that is weaker in a mathematical sense than the invariance of the speed of light, is enough to assure that the coordinate transformations are the Lorentz transformations.

From group postulates

Following is a classical derivation (see, e.g., [1] and references therein) based on group postulates and isotropy of the space.

Coordinate transformations as a group

The coordinate transformations between inertial frames form a group (called the proper Lorentz group) with the group operation being the composition of transformations (performing one transformation after another). Indeed the four group axioms are satisfied:

  1. Closure: the composition of two transformations is a transformation: consider a composition of transformations from the inertial frame {displaystyle K} to inertial frame {displaystyle K'}, (denoted as {displaystyle [Kto K']}), and then from {displaystyle K'} to inertial frame {displaystyle K''}, {displaystyle [K'to K'']}, there exists a transformation, {displaystyle [Kto K'']}, directly from an inertial frame {displaystyle K} to inertial frame {displaystyle K''}.
  2. Associativity: the result of {displaystyle {big (}[Kto K'][K'to K'']{big )}[K''to K''']} and {displaystyle [Kto K']{big (}[K'to K''][K''to K''']{big )}} is the same, {displaystyle Kto K'''}.
  3. Identity element: there is an identity element, a transformation {displaystyle Kto K}.
  4. Inverse element: for any transformation {displaystyle Kto K'} there exists an inverse transformation {displaystyle K'to K}.

Transformation matrices consistent with group axioms

Let us consider two inertial frames, K and K’, the latter moving with velocity {displaystyle {vec {v}}} with respect to the former. By rotations and shifts we can choose the z and z’ axes along the relative velocity vector and also that the events (t=0,z=0) and (t’=0,z’=0) coincide. Since the velocity boost is along the z (and z’) axes nothing happens to the perpendicular coordinates and we can just omit them for brevity. Now since the transformation we are looking after connects two inertial frames, it has to transform a linear motion in (t,z) into a linear motion in (t’,z’) coordinates. Therefore it must be a linear transformation. The general form of a linear transformation is

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}},}

where {displaystyle alpha ,beta ,gamma ,} and {displaystyle delta } are some yet unknown functions of the relative velocity {displaystyle v}.

Let us now consider the motion of the origin of the frame K’. In the K’ frame it has coordinates (t’,z’=0), while in the K frame it has coordinates (t,z=vt). These two points are connected by our transformation

{displaystyle {begin{bmatrix}t'\0end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\vtend{bmatrix}},}

from which we get

{displaystyle beta =-valpha ,}.

Analogously, considering the motion of the origin of the frame K, we get

{displaystyle {begin{bmatrix}t'\-vt'end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\0end{bmatrix}},}

from which we get

{displaystyle beta =-vgamma ,}.

Combining these two gives {displaystyle alpha =gamma } and the transformation matrix has simplified a bit,

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}gamma &delta \-vgamma &gamma end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}},}

Now let us consider the group postulate inverse element. There are two ways we can go from the {displaystyle K'} coordinate system to the {displaystyle K} coordinate system. The first is to apply the inverse of the transform matrix to the {displaystyle K'} coordinates:

{displaystyle {begin{bmatrix}t\zend{bmatrix}}={frac {1}{gamma ^{2}+vdelta gamma }}{begin{bmatrix}gamma &-delta \vgamma &gamma end{bmatrix}}{begin{bmatrix}t'\z'end{bmatrix}}.}

The second is, considering that the {displaystyle K'} coordinate system is moving at a velocity {displaystyle v} relative to the {displaystyle K} coordinate system, the {displaystyle K} coordinate system must be moving at a velocity {displaystyle -v} relative to the {displaystyle K'} coordinate system. Replacing {displaystyle v} with {displaystyle -v} in the transformation matrix gives:

{displaystyle {begin{bmatrix}t\zend{bmatrix}}={begin{bmatrix}gamma (-v)&delta (-v)\vgamma (-v)&gamma (-v)end{bmatrix}}{begin{bmatrix}t'\z'end{bmatrix}},}

Now the function {displaystyle gamma } can not depend upon the direction of {displaystyle v} because it is apparently the factor which defines the relativistic contraction and time dilation. These two (in an isotropic world of ours) cannot depend upon the direction of {displaystyle v}. Thus, {displaystyle gamma (-v)=gamma (v)} and comparing the two matrices, we get

{displaystyle gamma ^{2}+vdelta gamma =1.,}

According to the closure group postulate a composition of two coordinate transformations is also a coordinate transformation, thus the product of two of our matrices should also be a matrix of the same form. Transforming {displaystyle K} to {displaystyle K'} and from {displaystyle K'} to {displaystyle K''} gives the following transformation matrix to go from {displaystyle K} to {displaystyle K''}:

{displaystyle {begin{aligned}{begin{bmatrix}t''\z''end{bmatrix}}&={begin{bmatrix}gamma (v')&delta (v')\-v'gamma (v')&gamma (v')end{bmatrix}}{begin{bmatrix}gamma (v)&delta (v)\-vgamma (v)&gamma (v)end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}\&={begin{bmatrix}gamma (v')gamma (v)-vdelta (v')gamma (v)&gamma (v')delta (v)+delta (v')gamma (v)\-(v'+v)gamma (v')gamma (v)&-v'gamma (v')delta (v)+gamma (v')gamma (v)end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}.end{aligned}}}

In the original transform matrix, the main diagonal elements are both equal to {displaystyle gamma }, hence, for the combined transform matrix above to be of the same form as the original transform matrix, the main diagonal elements must also be equal. Equating these elements and rearranging gives:

{displaystyle gamma (v')gamma (v)-vdelta (v')gamma (v)=-v'gamma (v')delta (v)+gamma (v')gamma (v),}
{displaystyle vdelta (v')gamma (v)=v'gamma (v')delta (v),}
{displaystyle {frac {delta (v)}{vgamma (v)}}={frac {delta (v')}{v'gamma (v')}}.,}

The denominator will be nonzero for nonzero v as {displaystyle {gamma (v)}} is always nonzero, as {displaystyle gamma ^{2}+vdelta gamma =1}. If v=0 we have the identity matrix which coincides with putting v=0 in the matrix we get at the end of this derivation for the other values of v, making the final matrix valid for all nonnegative v.

For the nonzero v, this combination of function must be a universal constant, one and the same for all inertial frames. Let’s define this constant as {displaystyle {frac {delta (v)}{vgamma (v)}},=,kappa ,} where {displaystyle kappa ,} has the dimension of {displaystyle 1/v^{2}}. Solving

{displaystyle 1=gamma ^{2}+vdelta gamma =gamma ^{2}(1+kappa v^{2}),}

we finally get {displaystyle gamma =1/{sqrt {1+kappa v^{2}}}} and thus the transformation matrix, consistent with the group axioms, is given by

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={frac {1}{sqrt {1+kappa v^{2}}}}{begin{bmatrix}1&kappa v\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}.}

If {displaystyle kappa ,} were positive, then there would be transformations (with {displaystyle kappa v^{2}gg 1}) which transform time into a spatial coordinate and vice versa. We exclude this on physical grounds, because time can only run in the positive direction. Thus two types of transformation matrices are consistent with group postulates: i) with the universal constant {displaystyle kappa =0} and ii) with {displaystyle kappa <0}.

Galilean transformations

If {displaystyle kappa ,=,0,,} then we get the Galilean-Newtonian kinematics with the Galilean transformation,

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}1&0\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}};,}

where time is absolute, {displaystyle t'=t}, and the relative velocity {displaystyle v} of two inertial frames is not limited.

Lorentz transformations

If {displaystyle kappa ,} is negative, then we set {displaystyle c,=,{frac {1}{sqrt {-kappa }}},} which becomes the invariant speed, the speed of light in vacuum. This yields {displaystyle kappa ={-1 over c^{2}},} and thus we get special relativity with Lorentz transformation

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={frac {1}{sqrt {1-{v^{2} over c^{2}}}}}{begin{bmatrix}1&{-v over c^{2}}\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}};,}

where the speed of light is a finite universal constant determining the highest possible relative velocity between inertial frames.

If {displaystyle vll c} the Galilean transformation is a good approximation to the Lorentz transformation.

Only experiment can answer the question which of the two possibilities, {displaystyle kappa =0} or {displaystyle kappa <0}, is realised in our world. The experiments measuring the speed of light, first performed by a Danish physicist Ole Rømer, show that it is finite, and the Michelson–Morley experiment showed that it is an absolute speed, and thus that {displaystyle kappa <0}.

From physical principles

The problem is usually restricted to two dimensions by using a velocity along the x axis such that the y and z coordinates do not intervene. It is similar to that of Einstein. More details may be found in
As in the Galilean transformation, the Lorentz transformation is linear : the relative velocity of the reference frames is constant. They are called inertial or Galilean reference frames. According to relativity no Galilean reference frame is privileged. Another condition is that the speed of light must be independent of the reference frame, in practice of the velocity of the light source.

Galilean reference frames

In classical kinematics, the total displacement x in the R frame is the sum of the relative displacement x′ in frame R’ and of the distance between the two origins x-x’. If v is the relative velocity of R’ relative to R, we have v: x = x′ + vt or x′ = x − vt. This relationship is linear for a constant v, that is when R and R’ are Galilean frames of reference.

In Einstein’s relativity, the main difference with Galilean relativity is that space is a function of time and vice-versa: t ≠ t′. The most general linear relationship is obtained with four constant coefficients, α, β, γ and v:

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=beta left(t+alpha xright).}

The Lorentz transformation becomes the Galilean transformation when β = γ = 1 and α = 0.

Speed of light independent of the velocity of the source

Light being independent of the reference frame as was shown by Michelson, we need to have x = ct if x′ = ct′. In other words, light moves at velocity c in both frames. Replacing x and x′ in the preceding equations, one has:

{displaystyle ct'=gamma left(c-vright)t}
{displaystyle t'=beta left(1+alpha cright)t.}

Replacing t′ with the help of the second equation, the first one writes:

{displaystyle cbeta left(1+alpha cright)t=gamma left(c-vright)t.}

After simplification by t and dividing by cβ, one obtains:

{displaystyle 1+alpha c={frac {gamma }{beta }}left(1-{frac {v}{c}}right).}

Principle of relativity

According to the principle of relativity, there is no privileged Galilean frame of reference. One has to find the same Lorentz transformation from frame R to R’ or from R’ to R. As in the Galilean transformation, the transport velocity has to be changed from v to -v when passing from one frame to the other.

The following derivation uses only the principle of relativity which is independent of light velocity constancy.

The inverse transformation of

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=beta left(t+alpha xright)}

is given by

{displaystyle x={frac {1}{1+alpha v}}left({frac {x'}{gamma }}+{frac {vt'}{beta }}right)}
{displaystyle t={frac {1}{1+alpha v}}left({frac {t'}{beta }}-{frac {alpha x'}{gamma }}right)}.

In accordance with the principle of relativity, the expressions of x and t are

{displaystyle x=gamma left(x'+vt'right)}
{displaystyle t=beta left(t'-alpha x'right)}.

As the right hand sides have to be identical to those obtained by inverting the transformation, we have the identities, valid for any x’ and t’ :

{displaystyle gamma left(x'+vt'right)={frac {1}{1+alpha v}}left({frac {x'}{gamma }}+{frac {vt'}{beta }}right)}
{displaystyle beta left(t'-alpha x'right)={frac {1}{1+alpha v}}left({frac {t'}{beta }}-{frac {alpha x'}{gamma }}right).}

Substituting x’=1 and t’=0 in the first identity and x’=0 and t’=1 in the second, we immediately get the equalities

{displaystyle beta =gamma ={frac {1}{sqrt {1+alpha v}}}.}

Expression of the Lorentz transformation

Using the earlier obtained relation

{displaystyle 1+alpha c={frac {gamma }{beta }}(1-{frac {v}{c}}),}

one has

{displaystyle alpha =-{frac {v}{c^{2}}}}

and, finally

{displaystyle beta =gamma ={frac {1}{sqrt {1-{frac {v^{2}}{c^{2}}}}}}.}

We now have all the coefficients needed and, therefore, the Lorentz transformation

{displaystyle x={frac {x'+vt'}{sqrt[{}]{1-{frac {v^{2}}{c^{2}}}}}}}
{displaystyle t={frac {t'+{frac {vx'}{c^{2}}}}{sqrt[{}]{1-{frac {v^{2}}{c^{2}}}}}}},

or, using the Lorentz factor γ,

{displaystyle x=gamma left(x'+vt'right)}
{displaystyle t=gamma left(t'+{frac {vx'}{c^{2}}}right),}

and its inverse:

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=gamma left(t-{frac {vx}{c^{2}}}right).}

See also

  • Electromagnetic field
  • Galilean transformation
  • Hyperbolic rotation
  • Invariance mechanics
  • Lorentz group
  • Principle of relativity
  • Velocity-addition formula
  • Algebra of physical space
  • Relativistic aberration

References

  • From Lorentz transformation
This page uses content that though originally imported from the Wikipedia article Lorentz transformation might have been very heavily modified, perhaps even to the point of disagreeing completely with the original wikipedia article.
The list of authors can be seen in the page history. The text of Wikipedia is available under the Creative Commons Licence.

A visualisation of the Lorentz transformation (full animation). Only one space coordinate is considered. The thin solid lines crossing at right angles depict the time and distance coordinates of an observer at rest with respect to that frame; the skewed solid straight lines depict the coordinate grid of an observer moving with respect to that same frame.

In physics, the Lorentz transformation describes how, according to the theory of special relativity, two observers’ varying measurements of space and time can be converted into each other’s frames of reference. It is named after the Dutch physicist Hendrik Lorentz. It reflects the surprising fact that observers moving at different velocities may measure different distances, elapsed times, and even different orderings of events.

The Lorentz transformation was originally the result of attempts by Lorentz and others to explain how the speed of light was observed to be independent of the reference frame, and to understand the symmetries of the laws of electromagnetism. Albert Einstein later re-derived the transformation from his postulates of special relativity. The Lorentz transformation supersedes the Galilean transformation of Newtonian physics, which assumes an absolute space and time (see Galilean relativity). According to special relativity, this is a good approximation only at relative speeds much smaller than the speed of light.

If space is homogeneous, then the Lorentz transformation must be a linear transformation. Also, since relativity postulates that the speed of light is the same for all observers, it must preserve the spacetime interval between any two events in Minkowski space. The Lorentz transformation describes only the transformations in which the spacetime event at the origin is left fixed, so they can be considered as a hyperbolic rotation of Minkowski space. The more general set of transformations that also includes translations is known as the Poincaré group.

Lorentz transformation for frames in standard configuration

Standard configuration of coordinate systems for Lorentz transformations.

Assume there are two observers O and Q, each using their own Cartesian coordinate system to measure space and time intervals. O uses {displaystyle (t,x,y,z)} and Q uses {displaystyle (t',x',y',z')}. Assume further that the coordinate systems are oriented so that the x-axis and the x’ -axis are collinear, the y-axis is parallel to the y’ -axis, as are the z-axis and the z’ -axis. The relative velocity between the two observers is v along the common x-axis. Also assume that the origins of both coordinate systems are the same. If all these hold, then the coordinate systems are said to be in standard configuration. A
symmetric presentation
between the forward Lorentz Transformation and the inverse Lorentz Transformation
can be achieved if coordinate systems are in
symmetric configuration.
The symmetric form highlights that all physical laws should be of such a kind that
they remain unchanged under a Lorentz transformation.

The Lorentz transformation for frames in standard configuration can be shown to be:

{displaystyle {begin{cases}t'&=gamma left(t-vx/c^{2}right)\x'&=gamma left(x-vtright)\y'&=y\z'&=zend{cases}}}

where {displaystyle  gamma ={frac {1}{sqrt {1-{frac {v^{2}}{c^{2}}}}}}} is called the Lorentz factor.

Matrix form

This Lorentz transformation is called a «boost» in the x-direction and is often expressed in matrix form as

{displaystyle {begin{bmatrix}ct'\x'\y'\z'end{bmatrix}}={begin{bmatrix}gamma &-beta gamma &0&0\-beta gamma &gamma &0&0\0&0&1&0\0&0&0&1\end{bmatrix}}{begin{bmatrix}c,t\x\y\zend{bmatrix}} .}

This transformation matrix is universal for all four-vectors.

More generally for a boost in any arbitrary direction {displaystyle (beta _{x},beta _{y},beta _{z})},

{displaystyle {begin{bmatrix}c,t'\x'\y'\z'end{bmatrix}}={begin{bmatrix}gamma &-beta _{x},gamma &-beta _{y},gamma &-beta _{z},gamma \-beta _{x},gamma &1+(gamma -1){dfrac {beta _{x}^{2}}{beta ^{2}}}&(gamma -1){dfrac {beta _{x}beta _{y}}{beta ^{2}}}&(gamma -1){dfrac {beta _{x}beta _{z}}{beta ^{2}}}\-beta _{y},gamma &(gamma -1){dfrac {beta _{y}beta _{x}}{beta ^{2}}}&1+(gamma -1){dfrac {beta _{y}^{2}}{beta ^{2}}}&(gamma -1){dfrac {beta _{y}beta _{z}}{beta ^{2}}}\-beta _{z},gamma &(gamma -1){dfrac {beta _{z}beta _{x}}{beta ^{2}}}&(gamma -1){dfrac {beta _{z}beta _{y}}{beta ^{2}}}&1+(gamma -1){dfrac {beta _{z}^{2}}{beta ^{2}}}\end{bmatrix}}{begin{bmatrix}c,t\x\y\zend{bmatrix}} ,}

where {displaystyle beta ={frac {v}{c}}={frac {|{vec {v}}|}{c}}} and {displaystyle gamma ={frac {1}{sqrt {1-beta ^{2}}}}}.

Note that this transformation is only the «boost,» i.e., a transformation between two frames whose {displaystyle x,y}, and {displaystyle z} axis are parallel and whose spacetime origins coincide (see The «Standard configuration» Figure). The most general proper Lorentz transformation also contains a rotation of the three axes, because the composition of two boosts is not a pure boost but is a boost followed by a rotation. The rotation gives rise to Thomas precession. The boost is given by a symmetric matrix, but the general Lorentz transformation matrix need not be symmetric.

The composition of two Lorentz boosts B(u) and B(v) of velocities u and v is given by:

{displaystyle B(mathbf {u} )B(mathbf {v} )=B(mathbf {u} oplus mathbf {v} )Gyr[mathbf {u} ,mathbf {v} ]=Gyr[mathbf {u} ,mathbf {v} ]B(mathbf {v} oplus mathbf {u} )},

where u{displaystyle oplus }v is the velocity-addition, and Gyr[u,v] is the rotation arising from the composition, gyr being the gyrovector space abstraction of the gyroscopic Thomas precession, and B(v) is the 4×4 matrix that uses the components of v, i.e. v1, v2, v3 in the entries of the matrix, or rather the components of v/c in the representation that is used above.

The composition of two Lorentz transformations L(u,U) and L(v,V) which include rotations U and V is given by:

{displaystyle L(mathbf {u} ,U)L(mathbf {u} ,V)=L(mathbf {u} oplus Umathbf {v} ,gyr[mathbf {u} ,Umathbf {v} ]UV)}

If the 3×3 matrix form of the rotation applied to spatial coordinates is given by gyr[u,v], then the 4×4 matrix rotation applied to 4-coordinates is given by:

{displaystyle Gyr[mathbf {u} ,mathbf {v} ]={begin{pmatrix}1&0\0&gyr[mathbf {u} ,mathbf {v} ]end{pmatrix}}}.

Views of spacetime along the world line of a rapidly accelerating observer (center) moving in a 1-dimensional (straight line) «universe». The vertical direction indicates time, while the horizontal indicates distance, the dashed line is the spacetime trajectory («world line») of the observer. The small dots are specific events in spacetime. If one imagines these events to be the flashing of a light, then the events that pass the two diagonal lines in the bottom half of the image (the past light cone of the observer in the origin) are the events visible to the observer. The slope of the world line (deviation from being vertical) gives the relative velocity to the observer. Note how the view of spacetime changes when the observer accelerates.

For a boost in an arbitrary direction with velocity {displaystyle {vec {v}}}, it is convenient to decompose the spatial vector {displaystyle {vec {r}}} into components perpendicular and parallel to the velocity {displaystyle {vec {v}}}: {displaystyle {vec {r}}={vec {r}}_{perp }+{vec {r}}_{|}}. Then only the component {displaystyle {vec {r}}_{|}} in the direction of {displaystyle {vec {v}}} is ‘warped’ by the gamma factor:

{displaystyle {begin{cases}t'=gamma left(t-{frac {{vec {r}}cdot {vec {v}}}{c^{2}}}right)\{vec {r'}}={vec {r}}_{perp }+gamma ({vec {r}}_{|}-{vec {v}}t)end{cases}}}

where now {displaystyle gamma equiv {frac {1}{sqrt {1-{vec {v}}cdot {vec {v}}/c^{2}}}}}. The second of these can be written as:

{displaystyle {vec {r'}}={vec {r}}+left({frac {gamma -1}{v^{2}}}({vec {r}}cdot {vec {v}})-gamma tright){vec {v}}.}

These equations can be expressed in matrix form as

{displaystyle {begin{bmatrix}ct'\mathbf {r'} end{bmatrix}}={begin{bmatrix}gamma &-gamma {dfrac {mathbf {v} ^{mathrm {T} }}{c}}\-displaystyle {frac {gamma mathbf {v} }{c}}&mathbf {I} +(gamma -1){mathbf {hat {v}} mathbf {hat {v}} ^{mathrm {T} }}\end{bmatrix}}{begin{bmatrix}ct\mathbf {r} end{bmatrix}}{text{,}}}

where I is the identity matrix, v is velocity written as a column vector, vT is its transpose (a row vector) and {displaystyle mathbf {hat {v}} } is its versor.

Rapidity

The Lorentz transformation can be cast into another useful form by defining a parameter {displaystyle scriptstyle {boldsymbol {phi }}} called the rapidity (an instance of hyperbolic angle) such that

{displaystyle e^{phi }=gamma (1+beta )=gamma left(1+{frac {v}{c}}right)={sqrt {frac {1+v/c}{1-v/c}}},}

so that

{displaystyle e^{-phi }=gamma (1-beta )=gamma left(1-{frac {v}{c}}right)={sqrt {frac {1-v/c}{1+v/c}}}.}

Equivalently:

{displaystyle phi =ln left[gamma (1+beta )right]=-ln left[gamma (1-beta )right],}

Then the Lorentz transformation in standard configuration is:

{displaystyle {begin{cases}ct-x=e^{-phi }(ct'-x')\ct+x=e^{phi }(ct'+x')\y=y'\z=z'.end{cases}}}

Hyperbolic trigonometric expressions

From the above expressions for eφ and e−φ

{displaystyle gamma =cosh phi ={e^{phi }+e^{-phi } over 2},}
{displaystyle beta gamma =sinh phi ={e^{phi }-e^{-phi } over 2},}

and therefore,

{displaystyle beta =tanh phi ={e^{phi }-e^{-phi } over e^{phi }+e^{-phi }}.}

Hyperbolic rotation of coordinates

Substituting these expressions into the matrix form of the transformation, we have:

{displaystyle {begin{bmatrix}ct'\x'\y'\z'end{bmatrix}}={begin{bmatrix}cosh phi &-sinh phi &0&0\-sinh phi &cosh phi &0&0\0&0&1&0\0&0&0&1\end{bmatrix}}{begin{bmatrix}ct\x\y\zend{bmatrix}} .}

Thus, the Lorentz transformation can be seen as a hyperbolic rotation of coordinates in Minkowski space, where the rapidity {displaystyle phi } represents the hyperbolic angle of rotation, often referred to as rapidity.

Lorentz transformation of the electromagnetic field

The fact that the electromagnetic field shows relativistic effects becomes clear by carrying out a simple thought experiment:

  • Consider an observer looking at a charge being at rest. The observer will find out that there is an electric field. Since there is no electric current, however, he will state not seing any magnetic field.
  • If the observer moves toward or away from the charge with a certain velocity {displaystyle v}, he will notice that the electric field changes its value as a result of motion. This means, that he will measure different electric fields at the same place, depending on whether he is at motion or not. On the other hand, the observer will interpret the charge at motion as an electric current having a magnetic field around it.

This shows that electromagnetic field quantities need to undergo a Lorentz transformation when changing the frame of reference.
For the electric and magnetic field quantities, the following transformations apply :

{displaystyle {begin{aligned}&{vec {E}}'=gamma left({vec {E}}+{vec {v}}times {vec {B}}right)+(1-gamma ){frac {{vec {E}}cdot {vec {v}}cdot }{{v}^{2}}}{vec {v}}\&{vec {B}}'=gamma left({vec {B}}-{frac {1}{{c}^{2}}}{vec {v}}times {vec {E}}right)+(1-gamma ){frac {{vec {B}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {D}}'=gamma left({vec {D}}+{frac {1}{{c}^{2}}}{vec {v}}times {vec {H}}right)+(1-gamma ){frac {{vec {D}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {H}}'=gamma left({vec {H}}-{vec {v}}times {vec {D}}right)+(1-gamma ){frac {{vec {H}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{vec {j}}'={vec {j}}-{frac {rho cdot {vec {v}}}{gamma }}+left({frac {1}{gamma }}-1right){frac {{vec {j}}cdot {vec {v}}}{{v}^{2}}}{vec {v}}\&{rho }'={frac {1}{gamma }}cdot left(rho -{frac {1}{{c}^{2}}}{vec {j}}cdot {vec {v}}right)\end{aligned}}}

In non-relativistic approximation, i. e. for speeds {displaystyle vll c}, the relativistic factor {displaystyle gamma } equals {displaystyle gamma approx 1}, so that there is no need to distinguish between the spatial and temporal coordinates in Maxwell’s equations. This yields the following transformations:

{displaystyle {begin{aligned}&{vec {E}}'={vec {E}}+{vec {v}}times {vec {B}}\&{vec {B}}'={vec {B}}-1/{{c}^{2}}{vec {v}}times {vec {E}}approx {vec {B}}\&{vec {E}}={vec {E}}'-{vec {v}}times {vec {B}}'\&{vec {B}}={vec {B}}'+1/{{c}^{2}}{vec {v}}times {vec {E}}'approx {B}'\end{aligned}}}

The electric and magnetic fields transform differently from space and time, but exactly the same way as relativistic angular momentum and the boost vector.

The electromagnetic field strength tensor is given by

{displaystyle F^{mu nu }={begin{bmatrix}0&-{frac {1}{c}}E_{x}&-{frac {1}{c}}E_{y}&-{frac {1}{c}}E_{z}\{frac {1}{c}}E_{x}&0&-B_{z}&B_{y}\{frac {1}{c}}E_{y}&B_{z}&0&-B_{x}\{frac {1}{c}}E_{z}&-B_{y}&B_{x}&0end{bmatrix}}{text{(SI units, signature }}(+,-,-,-){text{)}}.}

in SI units. In relativity, the Gaussian system of units is often preferred over SI units, even in texts whose main choice of units is SI units, because in it the electric field E and the magnetic induction B have the same units making the appearance of the electromagnetic field tensor more natural. Consider a Lorentz boost in the x-direction. It is given by

{displaystyle {Lambda ^{mu }}_{nu }={begin{bmatrix}gamma &-gamma beta &0&0\-gamma beta &gamma &0&0\0&0&1&0\0&0&0&1\end{bmatrix}},qquad F^{mu nu }={begin{bmatrix}0&E_{x}&E_{y}&E_{z}\-E_{x}&0&B_{z}&-B_{y}\-E_{y}&-B_{z}&0&B_{x}\-E_{z}&B_{y}&-B_{x}&0end{bmatrix}}{text{(Gaussian units, signature }}(-,+,+,+){text{)}},}

where the field tensor is displayed side by side for easiest possible reference in the manipulations below.

The general transformation law (T3) becomes

{displaystyle F^{mu 'nu '}={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }.}

For the magnetic field one obtains

{displaystyle {begin{aligned}B_{x'}&=F^{2'3'}={Lambda ^{2}}_{mu }{Lambda ^{3}}_{nu }F^{mu nu }={Lambda ^{2}}_{2}{Lambda ^{3}}_{3}F^{23}=1times 1times B_{x}\&=B_{x},\B_{y'}&=F^{3'1'}={Lambda ^{3}}_{mu }{Lambda ^{1}}_{nu }F^{mu nu }={Lambda ^{3}}_{3}{Lambda ^{1}}_{nu }F^{3nu }={Lambda ^{3}}_{3}{Lambda ^{1}}_{0}F^{30}+{Lambda ^{3}}_{3}{Lambda ^{1}}_{1}F^{31}\&=1times (-beta gamma )(-E_{z})+1times gamma B_{y}=gamma B_{y}+beta gamma E_{z}\&=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{y}\B_{z'}&=F^{1'2'}={Lambda ^{1}}_{mu }{Lambda ^{2}}_{nu }F^{mu nu }={Lambda ^{1}}_{mu }{Lambda ^{2}}_{2}F^{mu 2}={Lambda ^{1}}_{0}{Lambda ^{2}}_{2}F^{02}+{Lambda ^{1}}_{1}{Lambda ^{2}}_{2}F^{12}\&=(-gamma beta )times 1times E_{y}+gamma times 1times B_{z}=gamma B_{z}-beta gamma E_{y}\&=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{z}end{aligned}}}

For the electric field results

{displaystyle {begin{aligned}E_{x'}&=F^{0'1'}={Lambda ^{0}}_{mu }{Lambda ^{1}}_{nu }F^{mu nu }={Lambda ^{0}}_{1}{Lambda ^{1}}_{0}F^{10}+{Lambda ^{0}}_{0}{Lambda ^{1}}_{1}F^{01}\&=(-gamma beta )(-gamma beta )(-E_{x})+gamma gamma E_{x}=-gamma ^{2}beta ^{2}(E_{x})+gamma ^{2}E_{x}=E_{x}(1-beta ^{2})gamma ^{2}\&=E_{x},\E_{y'}&=F^{0'2'}={Lambda ^{0}}_{mu }{Lambda ^{2}}_{nu }F^{mu nu }={Lambda ^{0}}_{mu }{Lambda ^{2}}_{2}F^{mu 2}={Lambda ^{0}}_{0}{Lambda ^{2}}_{2}F^{02}+{Lambda ^{0}}_{1}{Lambda ^{2}}_{2}F^{12}\&=gamma times 1times E_{y}+(-beta gamma )times 1times B_{z}=gamma E_{y}-beta gamma B_{z}\&=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{y}\E_{z'}&=F^{0'3'}={Lambda ^{0}}_{mu }{Lambda ^{3}}_{nu }F^{mu nu }={Lambda ^{0}}_{mu }{Lambda ^{3}}_{3}F^{mu 3}={Lambda ^{0}}_{0}{Lambda ^{3}}_{3}F^{03}+{Lambda ^{0}}_{1}{Lambda ^{3}}_{3}F^{13}\&=gamma times 1times E_{z}-beta gamma times 1times (-B_{y})=gamma E_{z}+beta gamma B_{y}\&=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{z}.end{aligned}}}

Here, β = (β, 0, 0) is used. These results can be summarized by

{displaystyle {begin{aligned}mathbf {E} _{parallel '}&=mathbf {E} _{parallel }\mathbf {B} _{parallel '}&=mathbf {B} _{parallel }\mathbf {E} _{bot '}&=gamma left(mathbf {E} _{bot }+{boldsymbol {beta }}times mathbf {B} _{bot }right)=gamma left(mathbf {E} +{boldsymbol {beta }}times mathbf {B} right)_{bot },\mathbf {B} _{bot '}&=gamma left(mathbf {B} _{bot }-{boldsymbol {beta }}times mathbf {E} _{bot }right)=gamma left(mathbf {B} -{boldsymbol {beta }}times mathbf {E} right)_{bot },end{aligned}}}

and are independent of the metric signature. For SI units, substitute E → ​Ec. Misner, Thorne & Wheeler (1973) refer to this last form as the 3 + 1 view as opposed to the geometric view represented by the tensor expression

{displaystyle F^{mu 'nu '}={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu },}

and make a strong point of the ease with which results that are difficult to achieve using the 3 + 1 view can be obtained and understood. Only objects that have well defined Lorentz transformation properties (in fact under any smooth coordinate transformation) are geometric objects. In the geometric view, the electromagnetic field is a six-dimensional geometric object in spacetime as opposed to two interdependent, but separate, 3-vector fields in space and time. The fields E (alone) and B (alone) do not have well defined Lorentz transformation properties. The mathematical underpinnings are equations (T1) and (T2) that immediately yield (T3). One should note that the primed and unprimed tensors refer to the same event in spacetime. Thus the complete equation with spacetime dependence is

{displaystyle F^{mu 'nu '}left(x'right)={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }left(Lambda ^{-1}x'right)={Lambda ^{mu '}}_{mu }{Lambda ^{nu '}}_{nu }F^{mu nu }(x).}

Length contraction has an effect on charge density ρ and current density J, and time dilation has an effect on the rate of flow of charge (current), so charge and current distributions must transform in a related way under a boost. It turns out they transform exactly like the space-time and energy-momentum four-vectors,

{displaystyle {begin{aligned}mathbf {j} '&=mathbf {j} -gamma rho vmathbf {n} +left(gamma -1right)(mathbf {j} cdot mathbf {n} )mathbf {n} \rho '&=gamma left(rho -mathbf {j} cdot {frac {vmathbf {n} }{c^{2}}}right),end{aligned}}}

or, in the simpler geometric view,

{displaystyle j^{mu ^{prime }}={Lambda ^{mu '}}_{mu }j^{mu }.}

Spacetime interval

In a given coordinate system ({displaystyle x^{mu }}), if two events {displaystyle A} and {displaystyle B} are separated by

{displaystyle (Delta t,Delta x,Delta y,Delta z)=(t_{B}-t_{A},x_{B}-x_{A},y_{B}-y_{A},z_{B}-z_{A}) ,}

the spacetime interval between them is given by

{displaystyle s^{2}=-c^{2}(Delta t)^{2}+(Delta x)^{2}+(Delta y)^{2}+(Delta z)^{2} .}

This can be written in another form using the Minkowski metric. In this coordinate system,

{displaystyle eta _{mu nu }={begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}} .}

Then, we can write

{displaystyle s^{2}={begin{bmatrix}cDelta t&Delta x&Delta y&Delta zend{bmatrix}}{begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}}{begin{bmatrix}cDelta t\Delta x\Delta y\Delta zend{bmatrix}}}

or, using the Einstein summation convention,

{displaystyle s^{2}=eta _{mu nu }x^{mu }x^{nu } .}

Now suppose that we make a coordinate transformation {displaystyle x^{mu }rightarrow x'^{mu }}. Then, the interval in this coordinate system is given by

{displaystyle s'^{2}={begin{bmatrix}cDelta t'&Delta x'&Delta y'&Delta z'end{bmatrix}}{begin{bmatrix}-1&0&0&0\0&1&0&0\0&0&1&0\0&0&0&1end{bmatrix}}{begin{bmatrix}cDelta t'\Delta x'\Delta y'\Delta z'end{bmatrix}}}

or

{displaystyle s'^{2}=eta _{mu nu }x'^{mu }x'^{nu } .}

It is a result of special relativity that the interval is an invariant. That is, {displaystyle s^{2}=s'^{2} }. It can be shown that this requires the coordinate transformation to be of the form

{displaystyle x'^{mu }=x^{nu }Lambda _{nu }^{mu }+C^{mu } .}

Here, {displaystyle C^{mu } } is a constant vector and {displaystyle {Lambda ^{mu }}_{nu }} a constant matrix, where we require that

{displaystyle eta _{mu nu }Lambda _{alpha }^{mu }Lambda _{beta }^{nu }=eta _{alpha beta } .}

Such a transformation is called a Poincaré transformation or an inhomogeneous Lorentz transformation. The {displaystyle C^{a}} represents a spacetime translation. When {displaystyle C^{a},=0}, the transformation is called an homogeneous Lorentz transformation, or simply a Lorentz transformation.

Taking the determinant of {displaystyle eta _{mu nu }{Lambda ^{mu }}_{alpha }{Lambda ^{nu }}_{beta }=eta _{alpha beta }} gives us

{displaystyle det(Lambda _{b}^{a})=pm 1 .}

Lorentz transformations with {displaystyle det({Lambda ^{mu }}_{nu })=+1} form a subgroup called proper Lorentz transformations which is the special orthogonal group {displaystyle SO(1,3)}. Those with {displaystyle det({Lambda ^{mu }}_{nu })=-1} are called improper Lorentz transformations which is not a subgroup, as the product of any two improper Lorentz transformations will be a proper Lorentz transformation. From the above definition of {displaystyle Lambda } it can be shown that {displaystyle ({Lambda ^{0}}_{0})^{2}geq 1}, so either {displaystyle {Lambda ^{0}}_{0}geq 1} or {displaystyle {Lambda ^{0}}_{0}leq -1}, called orthochronous and non-orthochronous respectively. An important subgroup of the proper Lorentz transformations are the proper orthochronous Lorentz transformations which consist purely of boosts and rotations. Any Lorentz transform can be written as a proper orthochronous, together with one or both of the two discrete transformations; space inversion ({displaystyle P}) and time reversal ({displaystyle T}), whose non-zero elements are:

{displaystyle P_{0}^{0}=1,P_{1}^{1}=P_{2}^{2}=P_{3}^{3}=-1}
{displaystyle T_{0}^{0}=-1,T_{1}^{1}=T_{2}^{2}=T_{3}^{3}=1}

The set of Poincaré transformations satisfies the properties of a group and is called the Poincaré group. Under the Erlangen program, Minkowski space can be viewed as the geometry defined by the Poincaré group, which combines Lorentz transformations with translations. In a similar way, the set of all Lorentz transformations forms a group, called the Lorentz group.

A quantity invariant under Lorentz transformations is known as a Lorentz scalar.

Special relativity

One of the most astounding consequences of Einstein’s clock-setting method is the idea that time is relative. In essence, each observer’s frame of reference is associated with a unique set of clocks, the result being that time passes at different rates for different observers. This was a direct result of the Lorentz transformations and is called time dilation. We can also clearly see from the Lorentz «local time» transformation that the concept of the relativity of simultaneity and of the relativity of length contraction are also consequences of that clock-setting hypothesis.

Lorentz transformations can also be used to prove that magnetic and electric fields are simply different aspects of the same force — the electromagnetic force. If we have one charge or a collection of charges which are all stationary with respect to each other, we can observe the system in a frame in which there is no motion of the charges. In this frame, there is only an «electric field». If we switch to a moving frame, the Lorentz transformation will predict that a «magnetic field» is present. This field was initially unified in Maxwell’s concept of the «electromagnetic field».

The correspondence principle

For relative speeds much less than the speed of light, the Lorentz transformations reduce to the Galilean transformation in accordance with the correspondence principle.

The correspondence limit is usually stated mathematically as: as {displaystyle vrightarrow 0}, {displaystyle crightarrow infty }. In words: as velocity approaches 0, the speed of light (seems to) approach infinity. Hence, it is sometimes said that nonrelativistic physics is a physics of «instant action at a distance».

History

See also History of Lorentz transformations.

Many physicists, including George FitzGerald, Joseph Larmor, Hendrik Lorentz and Woldemar Voigt, had been discussing the physics behind these equations since 1887.
Larmor and Lorentz, who believed the luminiferous ether hypothesis, were seeking the transformation under which Maxwell’s equations were invariant when transformed from the ether to a moving frame. Early in 1889, Oliver Heaviside had shown from Maxwell’s equations that the electric field surrounding a spherical distribution of charge should cease to have spherical symmetry once the charge is in motion relative to the ether. FitzGerald then conjectured that Heaviside’s distortion result might be applied to a theory of intermolecular forces. Some months later, FitzGerald published his conjecture in Science to explain the baffling outcome of the 1887 ether-wind experiment of Michelson and Morley. This idea was extended by Lorentz
and Larmor
over several years, and became known as the FitzGerald-Lorentz explanation of the Michelson-Morley null result, known early on through the writings of Lodge, Lorentz, Larmor, and FitzGerald.
Their explanation was widely known before 1905.
Larmor is also credited to have been the first to understand the crucial time dilation property inherent in his equations.

In 1905, Henri Poincaré was the first to recognize that the transformation has the properties of a mathematical group,
and named it after Lorentz.
Later in the same year Einstein derived the Lorentz transformation under the assumptions of the principle of relativity and the constancy of the speed of light in any inertial reference frame,
obtaining results that were algebraically equivalent to
Larmor’s (1897) and Lorentz’s (1899, 1904), but with a different interpretation.

Paul Langevin (1911) said of the transformation:

«It is the great merit of H. A. Lorentz to have seen that the fundamental equations of electromagnetism admit a group of transformations which enables them to have the same form when one passes from one frame of reference to another; this new transformation has the most profound implications for the transformations of space and time».

Derivation

The usual treatment is based on the invariance of the speed of light, as seen by the Michelson-Morley experiment. However, this is not necessarily the starting point: indeed (as is exposed, for example, in the second volume of the Course of Theoretical Physics by Landau and Lifshitz), what is really at stake is the locality of interactions: one supposes that the influence that one particle, say, exerts on another can not be transmitted instantaneously. Hence, there exists a theoretical maximal speed of information transmission which must be invariant, and it turns out that this speed coincides with the speed of light in vacuum. The need for locality in physical theories was already noted by Newton (see Koestler’s The Sleepwalkers), who considered the notion of an action at a distance «philosophically absurd» and believed that gravity must be transmitted by an agent (such as an interstellar aether) which obeys certain physical laws.

Michelson and Morley in 1887 designed an experiment, employing an interferometer and a half-silvered mirror, that was accurate enough to detect aether flow. The mirror system reflected the light back into the interferometer. If there were an aether drift, it would produce a phase shift and a change in the interference that would be detected. However, no phase shift was ever found. The negative outcome of the Michelson-Morley experiment left the concept of aether (or its drift) undermined. There was consequent perplexity as to why light evidently behaves like a wave, without any detectable medium through which wave activity might propagate.

In a 1964 paper, Erik Christopher Zeeman showed that the causality preserving property, a condition that is weaker in a mathematical sense than the invariance of the speed of light, is enough to assure that the coordinate transformations are the Lorentz transformations.

From group postulates

Following is a classical derivation (see, e.g., [1] and references therein) based on group postulates and isotropy of the space.

Coordinate transformations as a group

The coordinate transformations between inertial frames form a group (called the proper Lorentz group) with the group operation being the composition of transformations (performing one transformation after another). Indeed the four group axioms are satisfied:

  1. Closure: the composition of two transformations is a transformation: consider a composition of transformations from the inertial frame {displaystyle K} to inertial frame {displaystyle K'}, (denoted as {displaystyle [Kto K']}), and then from {displaystyle K'} to inertial frame {displaystyle K''}, {displaystyle [K'to K'']}, there exists a transformation, {displaystyle [Kto K'']}, directly from an inertial frame {displaystyle K} to inertial frame {displaystyle K''}.
  2. Associativity: the result of {displaystyle {big (}[Kto K'][K'to K'']{big )}[K''to K''']} and {displaystyle [Kto K']{big (}[K'to K''][K''to K''']{big )}} is the same, {displaystyle Kto K'''}.
  3. Identity element: there is an identity element, a transformation {displaystyle Kto K}.
  4. Inverse element: for any transformation {displaystyle Kto K'} there exists an inverse transformation {displaystyle K'to K}.

Transformation matrices consistent with group axioms

Let us consider two inertial frames, K and K’, the latter moving with velocity {displaystyle {vec {v}}} with respect to the former. By rotations and shifts we can choose the z and z’ axes along the relative velocity vector and also that the events (t=0,z=0) and (t’=0,z’=0) coincide. Since the velocity boost is along the z (and z’) axes nothing happens to the perpendicular coordinates and we can just omit them for brevity. Now since the transformation we are looking after connects two inertial frames, it has to transform a linear motion in (t,z) into a linear motion in (t’,z’) coordinates. Therefore it must be a linear transformation. The general form of a linear transformation is

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}},}

where {displaystyle alpha ,beta ,gamma ,} and {displaystyle delta } are some yet unknown functions of the relative velocity {displaystyle v}.

Let us now consider the motion of the origin of the frame K’. In the K’ frame it has coordinates (t’,z’=0), while in the K frame it has coordinates (t,z=vt). These two points are connected by our transformation

{displaystyle {begin{bmatrix}t'\0end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\vtend{bmatrix}},}

from which we get

{displaystyle beta =-valpha ,}.

Analogously, considering the motion of the origin of the frame K, we get

{displaystyle {begin{bmatrix}t'\-vt'end{bmatrix}}={begin{bmatrix}gamma &delta \beta &alpha end{bmatrix}}{begin{bmatrix}t\0end{bmatrix}},}

from which we get

{displaystyle beta =-vgamma ,}.

Combining these two gives {displaystyle alpha =gamma } and the transformation matrix has simplified a bit,

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}gamma &delta \-vgamma &gamma end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}},}

Now let us consider the group postulate inverse element. There are two ways we can go from the {displaystyle K'} coordinate system to the {displaystyle K} coordinate system. The first is to apply the inverse of the transform matrix to the {displaystyle K'} coordinates:

{displaystyle {begin{bmatrix}t\zend{bmatrix}}={frac {1}{gamma ^{2}+vdelta gamma }}{begin{bmatrix}gamma &-delta \vgamma &gamma end{bmatrix}}{begin{bmatrix}t'\z'end{bmatrix}}.}

The second is, considering that the {displaystyle K'} coordinate system is moving at a velocity {displaystyle v} relative to the {displaystyle K} coordinate system, the {displaystyle K} coordinate system must be moving at a velocity {displaystyle -v} relative to the {displaystyle K'} coordinate system. Replacing {displaystyle v} with {displaystyle -v} in the transformation matrix gives:

{displaystyle {begin{bmatrix}t\zend{bmatrix}}={begin{bmatrix}gamma (-v)&delta (-v)\vgamma (-v)&gamma (-v)end{bmatrix}}{begin{bmatrix}t'\z'end{bmatrix}},}

Now the function {displaystyle gamma } can not depend upon the direction of {displaystyle v} because it is apparently the factor which defines the relativistic contraction and time dilation. These two (in an isotropic world of ours) cannot depend upon the direction of {displaystyle v}. Thus, {displaystyle gamma (-v)=gamma (v)} and comparing the two matrices, we get

{displaystyle gamma ^{2}+vdelta gamma =1.,}

According to the closure group postulate a composition of two coordinate transformations is also a coordinate transformation, thus the product of two of our matrices should also be a matrix of the same form. Transforming {displaystyle K} to {displaystyle K'} and from {displaystyle K'} to {displaystyle K''} gives the following transformation matrix to go from {displaystyle K} to {displaystyle K''}:

{displaystyle {begin{aligned}{begin{bmatrix}t''\z''end{bmatrix}}&={begin{bmatrix}gamma (v')&delta (v')\-v'gamma (v')&gamma (v')end{bmatrix}}{begin{bmatrix}gamma (v)&delta (v)\-vgamma (v)&gamma (v)end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}\&={begin{bmatrix}gamma (v')gamma (v)-vdelta (v')gamma (v)&gamma (v')delta (v)+delta (v')gamma (v)\-(v'+v)gamma (v')gamma (v)&-v'gamma (v')delta (v)+gamma (v')gamma (v)end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}.end{aligned}}}

In the original transform matrix, the main diagonal elements are both equal to {displaystyle gamma }, hence, for the combined transform matrix above to be of the same form as the original transform matrix, the main diagonal elements must also be equal. Equating these elements and rearranging gives:

{displaystyle gamma (v')gamma (v)-vdelta (v')gamma (v)=-v'gamma (v')delta (v)+gamma (v')gamma (v),}
{displaystyle vdelta (v')gamma (v)=v'gamma (v')delta (v),}
{displaystyle {frac {delta (v)}{vgamma (v)}}={frac {delta (v')}{v'gamma (v')}}.,}

The denominator will be nonzero for nonzero v as {displaystyle {gamma (v)}} is always nonzero, as {displaystyle gamma ^{2}+vdelta gamma =1}. If v=0 we have the identity matrix which coincides with putting v=0 in the matrix we get at the end of this derivation for the other values of v, making the final matrix valid for all nonnegative v.

For the nonzero v, this combination of function must be a universal constant, one and the same for all inertial frames. Let’s define this constant as {displaystyle {frac {delta (v)}{vgamma (v)}},=,kappa ,} where {displaystyle kappa ,} has the dimension of {displaystyle 1/v^{2}}. Solving

{displaystyle 1=gamma ^{2}+vdelta gamma =gamma ^{2}(1+kappa v^{2}),}

we finally get {displaystyle gamma =1/{sqrt {1+kappa v^{2}}}} and thus the transformation matrix, consistent with the group axioms, is given by

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={frac {1}{sqrt {1+kappa v^{2}}}}{begin{bmatrix}1&kappa v\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}}.}

If {displaystyle kappa ,} were positive, then there would be transformations (with {displaystyle kappa v^{2}gg 1}) which transform time into a spatial coordinate and vice versa. We exclude this on physical grounds, because time can only run in the positive direction. Thus two types of transformation matrices are consistent with group postulates: i) with the universal constant {displaystyle kappa =0} and ii) with {displaystyle kappa <0}.

Galilean transformations

If {displaystyle kappa ,=,0,,} then we get the Galilean-Newtonian kinematics with the Galilean transformation,

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={begin{bmatrix}1&0\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}};,}

where time is absolute, {displaystyle t'=t}, and the relative velocity {displaystyle v} of two inertial frames is not limited.

Lorentz transformations

If {displaystyle kappa ,} is negative, then we set {displaystyle c,=,{frac {1}{sqrt {-kappa }}},} which becomes the invariant speed, the speed of light in vacuum. This yields {displaystyle kappa ={-1 over c^{2}},} and thus we get special relativity with Lorentz transformation

{displaystyle {begin{bmatrix}t'\z'end{bmatrix}}={frac {1}{sqrt {1-{v^{2} over c^{2}}}}}{begin{bmatrix}1&{-v over c^{2}}\-v&1end{bmatrix}}{begin{bmatrix}t\zend{bmatrix}};,}

where the speed of light is a finite universal constant determining the highest possible relative velocity between inertial frames.

If {displaystyle vll c} the Galilean transformation is a good approximation to the Lorentz transformation.

Only experiment can answer the question which of the two possibilities, {displaystyle kappa =0} or {displaystyle kappa <0}, is realised in our world. The experiments measuring the speed of light, first performed by a Danish physicist Ole Rømer, show that it is finite, and the Michelson–Morley experiment showed that it is an absolute speed, and thus that {displaystyle kappa <0}.

From physical principles

The problem is usually restricted to two dimensions by using a velocity along the x axis such that the y and z coordinates do not intervene. It is similar to that of Einstein. More details may be found in
As in the Galilean transformation, the Lorentz transformation is linear : the relative velocity of the reference frames is constant. They are called inertial or Galilean reference frames. According to relativity no Galilean reference frame is privileged. Another condition is that the speed of light must be independent of the reference frame, in practice of the velocity of the light source.

Galilean reference frames

In classical kinematics, the total displacement x in the R frame is the sum of the relative displacement x′ in frame R’ and of the distance between the two origins x-x’. If v is the relative velocity of R’ relative to R, we have v: x = x′ + vt or x′ = x − vt. This relationship is linear for a constant v, that is when R and R’ are Galilean frames of reference.

In Einstein’s relativity, the main difference with Galilean relativity is that space is a function of time and vice-versa: t ≠ t′. The most general linear relationship is obtained with four constant coefficients, α, β, γ and v:

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=beta left(t+alpha xright).}

The Lorentz transformation becomes the Galilean transformation when β = γ = 1 and α = 0.

Speed of light independent of the velocity of the source

Light being independent of the reference frame as was shown by Michelson, we need to have x = ct if x′ = ct′. In other words, light moves at velocity c in both frames. Replacing x and x′ in the preceding equations, one has:

{displaystyle ct'=gamma left(c-vright)t}
{displaystyle t'=beta left(1+alpha cright)t.}

Replacing t′ with the help of the second equation, the first one writes:

{displaystyle cbeta left(1+alpha cright)t=gamma left(c-vright)t.}

After simplification by t and dividing by cβ, one obtains:

{displaystyle 1+alpha c={frac {gamma }{beta }}left(1-{frac {v}{c}}right).}

Principle of relativity

According to the principle of relativity, there is no privileged Galilean frame of reference. One has to find the same Lorentz transformation from frame R to R’ or from R’ to R. As in the Galilean transformation, the transport velocity has to be changed from v to -v when passing from one frame to the other.

The following derivation uses only the principle of relativity which is independent of light velocity constancy.

The inverse transformation of

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=beta left(t+alpha xright)}

is given by

{displaystyle x={frac {1}{1+alpha v}}left({frac {x'}{gamma }}+{frac {vt'}{beta }}right)}
{displaystyle t={frac {1}{1+alpha v}}left({frac {t'}{beta }}-{frac {alpha x'}{gamma }}right)}.

In accordance with the principle of relativity, the expressions of x and t are

{displaystyle x=gamma left(x'+vt'right)}
{displaystyle t=beta left(t'-alpha x'right)}.

As the right hand sides have to be identical to those obtained by inverting the transformation, we have the identities, valid for any x’ and t’ :

{displaystyle gamma left(x'+vt'right)={frac {1}{1+alpha v}}left({frac {x'}{gamma }}+{frac {vt'}{beta }}right)}
{displaystyle beta left(t'-alpha x'right)={frac {1}{1+alpha v}}left({frac {t'}{beta }}-{frac {alpha x'}{gamma }}right).}

Substituting x’=1 and t’=0 in the first identity and x’=0 and t’=1 in the second, we immediately get the equalities

{displaystyle beta =gamma ={frac {1}{sqrt {1+alpha v}}}.}

Expression of the Lorentz transformation

Using the earlier obtained relation

{displaystyle 1+alpha c={frac {gamma }{beta }}(1-{frac {v}{c}}),}

one has

{displaystyle alpha =-{frac {v}{c^{2}}}}

and, finally

{displaystyle beta =gamma ={frac {1}{sqrt {1-{frac {v^{2}}{c^{2}}}}}}.}

We now have all the coefficients needed and, therefore, the Lorentz transformation

{displaystyle x={frac {x'+vt'}{sqrt[{}]{1-{frac {v^{2}}{c^{2}}}}}}}
{displaystyle t={frac {t'+{frac {vx'}{c^{2}}}}{sqrt[{}]{1-{frac {v^{2}}{c^{2}}}}}}},

or, using the Lorentz factor γ,

{displaystyle x=gamma left(x'+vt'right)}
{displaystyle t=gamma left(t'+{frac {vx'}{c^{2}}}right),}

and its inverse:

{displaystyle x'=gamma left(x-vtright)}
{displaystyle t'=gamma left(t-{frac {vx}{c^{2}}}right).}

See also

  • Electromagnetic field
  • Galilean transformation
  • Hyperbolic rotation
  • Invariance mechanics
  • Lorentz group
  • Principle of relativity
  • Velocity-addition formula
  • Algebra of physical space
  • Relativistic aberration

References

  • From Lorentz transformation
This page uses content that though originally imported from the Wikipedia article Lorentz transformation might have been very heavily modified, perhaps even to the point of disagreeing completely with the original wikipedia article.
The list of authors can be seen in the page history. The text of Wikipedia is available under the Creative Commons Licence.

Преобразования Лоренца

2006-10-22 02:07

Преобразования Лоренца

Пусть нам даны две системы отсчета k и k`. В момент t = О обе
эти системы координат совпадают. Пусть система k` (назовем ее
подвижной) движется так, что ось х` скользит по оси х, ось у`
параллельна оси у, скорость v — скорость движения этой
системы координат (рис. 109).

Точка М имеет координаты в системе k — х, у, z, a в системе k`
— х`, у`, z`.

Преобразования Галилея в классической механике имеют вид:

preobrazovaniya_lorenca_renamed_28999.jpg

preobrazovaniya_lorenca_renamed_10654.jpg

Преобразования координат, удовлетворяющие постулатам
специальной теории относительности, называются
преобразованиями Лоренца.

preobrazovaniya_lorenca_renamed_15634.jpg

Впервые они (в несколько иной форме) были предложены Лоренцем
для объяснения отрицательного эксперимента Майкельсона-Морли и
для придания уравнениям Максвелла одинакового вида во всех
инерциальных системах отсчета.

Эйнштейн вывел их независимо на основе своей теории
относительности. Подчеркнем, что изменилась (по сравнению с
преобразованием Галилея) не только формула преобразования
координаты х, но и формула преобразований времени t. Из
последней формулы непосредственно видно, как переплетены
пространственная и временная координаты.

Следствия из преобразований Лоренца

  1. Длина движущегося стержня.

    Предположим, что стержень расположен вдоль оси х` в
    системе k` и движется вместе с системой k` со
    скоростью v.

    Разность между координатами конца и начала отрезка в
    системе отсчета, в которой он неподвижен, называется
    собственной длиной отрезка. В нашем случае
    l0 = х2` —
    х1`, где х2` — координата конца
    отрезка в системе k` и х/ — координата начала.
    Относительно системы k стержень движется. Длиной
    движущегося стержня принимают разность между
    координатами конца и начала стержня в один и тот же
    момент времени по часам системы k.

    preobrazovaniya_lorenca_renamed_17310.jpg

    где l — длина движущегося стержня, l0
    собственная длина стержня. Длина движущегося стержня
    меньше собственной длины.

  2. Темп хода движущихся часов.

    Пусть в точке х0` движущейся системы
    координат k` происходит последовательно два события в
    моменты t/ и t2. В неподвижной системе
    координат k эти события происходят в разных точках в
    моменты t1 и t2. Интервал
    времени между этими событиями в движущейся системе
    координат равен дельта t` = t2` —
    t1`, а в покоящейся дельта t =
    t2 — t1.

    На основании преобразования Лоренца получим:

    preobrazovaniya_lorenca_renamed_4945.jpg

    Интервал времени дельта t` между событиями, измеренный
    движущимися часами, меньше, чем интервал времени
    дельта t между теми же событиями, измеренный
    покоящимися часами. Это означает, что темп хода
    движущихся часов замедлен относительно неподвижных.

    Время, которое измеряется по часам, связанным с
    движущейся точкой, называется собственным
    временем
    этой точки.

  3. Относительность одновременности.

    Из преобразований Лоренца следует, что если в системе
    k в точке с координатами x1 и х2
    происходили два события одновременно (t1 =
    t2 = t0), то в системе k`
    интервал

    preobrazovaniya_lorenca.jpg

    понятие одновременности — понятие относительное.
    События, одновременные в одной системе координат,
    оказались неодновременными в другой.

  4. Относительность одновременности и причинность.

    Из относительности одновременности следует, что
    последовательность одних и тех же событий в различных
    системах координат различна.

    Не может ли случиться так, что в одной системе
    координат причина предшествует следствию, а в другой,
    наоборот, следствие предшествует причине?

    Чтобы причинно-следственная связь между событиями
    имела объективный характер и не зависела от системы
    координат, в которой она рассматривается, необходимо,
    чтобы никакие материальные воздействия, осуществляющие
    физическую связь событий, происходящих в различных
    точках, не могли передаваться со скоростью, большей
    скорости света.

    Таким образом, передача физического влияния из одной
    точки в другую не может происходить со скоростью,
    большей скорости света. При этом условии причинная
    связь событий носит абсолютный характер: не существует
    системы координат, в которой причина и следствие
    меняются местами.

Видео

  • Физика воздуха. Сжимаемость воздуха.

    Физика воздуха. Сжимаемость воздуха.

    2020-05-23

  • Что такое электричество? | ПРОСТО ФИЗИКА с Алексеем Иванченко

    Что такое электричество? | ПРОСТО ФИЗИКА с Алексеем Иванченко

    2020-05-23

  • Курс подготовки к ЕГЭ. Физика. Урок №1 Кинематика равномерного движения

    Курс подготовки к ЕГЭ. Физика. Урок №1 Кинематика равномерного движения

    2018-12-22

  • Батавские слезки - опыты

    Батавские слезки — опыты

    2017-12-15

  • Тепловой рычаг - физические опыты

    Тепловой рычаг — физические опыты

    2017-12-15

  • Секрет ЖК-монитора - поляризационная пленка

    Секрет ЖК-монитора — поляризационная пленка

    2017-12-15

  • ЛАЗЕР В ВОДЕ - физические опыты

    ЛАЗЕР В ВОДЕ — физические опыты

    2017-12-15

  • ЭЛЕКТРОХРОМНАЯ ПЛЕНКА с токопроводящим слоем и жидкокристаллической основой

    ЭЛЕКТРОХРОМНАЯ ПЛЕНКА с токопроводящим слоем и жидкокристаллической основой

    2017-12-15

  • Урок из космоса.Физика невесомости

    Урок из космоса.Физика невесомости

    2017-12-12

  • Абсолютный ноль - погоня за абсолютным нулём

    Абсолютный ноль — погоня за абсолютным нулём

    2017-12-12



Преобразования Лоренца — математические преобразования в специальной теории относительности, которым подвергаются галилеевы координаты события при переходе от одной инерциальной системы отсчёта (ИСО) — к другой. Образуют группу — так называемую группу Пуанкаре.

Иногда под преобразованиями Лоренца понимают только частный случай преобразований: от одной ИСО к другой, когда начала отсчёта обоих ИСО совпадают. Эти преобразования также образуют группу — группу Лоренца, которая является подгруппой группы Пуанкаре.

Вид преобразований при коллинеарных осях

Если ИСО K’ движется относительно ИСО K с постоянной скоростью {displaystyle V} вдоль оси {displaystyle x}, а начала координат совпадают в начальный момент времени в обеих системах, то преобразования Лоренца (обратные) имеют вид:

{displaystyle x={frac {x'+Vt'}{sqrt {1-V^{2}/c^{2}}}},y=y',z=z',t={frac {t'+(V/c^{2})x'}{sqrt {1-V^{2}/c^{2}}}}},

где {displaystyle c} — скорость света в вакууме.

Формулы, выражающие обратное преобразование, то есть, {displaystyle x',y',z',t'} через {displaystyle x,y,z,t} можно получить заменой {displaystyle V} на {displaystyle V'=-V}.

Вид преобразований при произвольной ориентации осей

В силу произвольности введения осей координат, многие задачи можно свести к указанному случаю. Если же задача требует иного расположения осей, то можно воспользоваться формулами преобразований в более общем случае. Для этого радиус-вектор точки

{displaystyle mathbf {r'} =mathbf {i} x'+mathbf {j} y'+mathbf {k} z'},

где {displaystyle mathbf {i} ,mathbf {j} ,mathbf {k} } — орты, надо разбить на составляющую {displaystyle mathbf {r'_{|}} } параллельную скорости и составляющую {displaystyle mathbf {r'_{perp }} } ей перпендикулярную

{displaystyle mathbf {r'} =mathbf {r'_{|}} +mathbf {r'_{perp }} }.

Тогда преобразования получат вид

{displaystyle mathbf {r_{|}} ={frac {mathbf {r'_{|}} +mathbf {v} t'}{sqrt {1-v^{2}/c^{2}}}},mathbf {r_{perp }} =mathbf {r'_{perp }} ,t={frac {t'+(v/c^{2})r_{|}}{sqrt {1-v^{2}/c^{2}}}}},

где {displaystyle v=V=left|mathbf {v} right|} — абсолютная величина скорости,
{displaystyle r_{|}=left|mathbf {r_{|}} right|} — абсолютная величина продольной составляющей радиус-вектора.

Эти формулы для случая параллельных осей, но с произвольно направленной скоростью, можно преобразовать к виду, впервые полученному Герглоцем:

{displaystyle mathbf {r} =mathbf {r'} +{frac {1}{v^{2}}}left({frac {1-{sqrt {1-v^{2}/c^{2}}}}{sqrt {1-v^{2}/c^{2}}}}right)(mathbf {r'v} )mathbf {v} +{frac {mathbf {v} t'}{sqrt {1-v^{2}/c^{2}}}}},
{displaystyle t={frac {t'+mathbf {r'v} /c^{2}}{sqrt {1-V^{2}/c^{2}}}}}.

Обратите внимание, что самый общий случай, когда начала координат не совпадают в нулевой момент времени, здесь не приведён с целью экономии места. Его можно получить, добавив к преобразованиям Лоренца линейные преобразования.

Преобразования Лоренца в матричном виде

Для случая коллинеарных осей преобразования Лоренца записываются в виде

{displaystyle {begin{bmatrix}ct'\x'\y'\z'end{bmatrix}}={begin{bmatrix}gamma &{frac {v}{c}}gamma &0&0\{frac {v}{c}}gamma &gamma &0&0\0&0&1&0\0&0&0&1\end{bmatrix}}{begin{bmatrix}ct\x\y\zend{bmatrix}}.},

где {displaystyle gamma equiv {frac {1}{sqrt {1-v^{2}/c^{2}}}}}.

Свойства преобразований Лоренца

Можно заметить, что в случае, когда {displaystyle crightarrow infty }, преобразования Лоренца переходят в преобразования Галилея. То же самое происходит в случае, когда {displaystyle v/crightarrow 0}. Это говорит о том, что специальная теория относительности совпадает с механикой Ньютона либо в мире с бесконечной скоростью света, либо при скоростях, малых по сравнению со скоростью света. Последее объясняет, каким образом сочетаются эти две теории — первая является уточнением второй.

Связанные определения

Лоренц-инвариантность — свойство физических законов записываться одинаково во всех инерциальных системах отсчета(с учетом преобразований Лоренца). Принято считать, что этим свойством должны обладать все физические законы. Однако некоторые теории, например квантовую механику, пока не удается построить так, чтобы выполнялась Лоренц-инвариантность.

История

Преобразования названы в честь их первооткрывателя — Х. А. Лоренца, который вывел их, чтобы устранить противоречия между электродинамикой и механикой Ньютона. В 1900 г. он обнаружил, что эти преобразования оставляют инвариантными уравнения Максвелла. Сам Лоренц верил в светоносный эфир и только Эйнштейн в своей теории относительности пришёл к современной трактовке этих преобразований.

Преобразования Лоренца были впервые опубликованы в 1904 г. но в то время их форма была несовершенна. К современному, полностью самосогласованному виду их привёл французский математик А. Пуанкаре.

Литература

Ф. И. Фёдоров. Группа Лоренца. М.: Наука, 1979. 384 с.

ar:تحويلات لورينتز
ca:Transformació de Lorentz
cs:Lorentzova transformace
da:Lorentz-transformation
el:Μετασχηματισμοί Λόρεντζ
et:Lorentzi teisendused
fa:تبدیلات لورنتس
gl:Transformación de Lorentz
he:טרנספורמציות לורנץ
nl:Lorentztransformatie
pl:Transformacja Lorentza
sk:Lorentzova transformácia
sl:Lorentzova transformacija
sv:Lorentztransformation
uk:Перетворення Лоренца

Like this post? Please share to your friends:
  • Преобразование числовых тригонометрических выражений решу егэ
  • Преобразование числовых иррациональных выражений решу егэ
  • Преобразование тригонометрических выражений примеры с решениями егэ
  • Преобразование тригонометрических выражений егэ профиль самостоятельная работа
  • Преобразование петра первого сочинение