Der Zusammenhang zwischen SDR und HDR PQ

Der Zusammenhang zwischen SDR und HDR PQ

Der Zusammenhang zwischen SDR und HDR PQ lässt sich am besten anhand eines Beispiels erläutern:

Stellt man eine HDR PQ-Kamera so ein, dass 100 cd/m2 echte gemessene Leuchtdichte in der Szene eine relative Szenenleuchtdichte von 1/5952,08 = 0,0168 also 50,8078% Videopegel erzeugen, dann ist der Zusammenhang zwischen Szenenleuchtdichte und Displayleuchtdichte bis 100 Nits Displayleuchtdichte exakt gleich dem einer SDR-Kamera, die so eingerichtet ist, dass sie bei 100 cd/m2 echter Szenenleuchtdichte einen SDR-Videopegel von 100% erzeugt. In dem Fall erzeugt jede Leuchtdichte in der Szene sowohl in SDR als auch und HDR die gleiche Displayleuchtdichte, die OOTF ist in diesem Bereich also identisch:

Bedingungen für die Einrichtung der Kamera-Belichtungs-Einstellungen:

  1. HDR-Kamera erzeugt bei 100 cd/m2 Szenenleuchtdichte einen Videopegel von 50,8078%
  2. SDR-Kamera erzeugt bei 100 cd/m2 Szenenleuchtdichte einen Videopegel von 100%

Wenn man das so eingerichtete HDR dann anschaut, liegen über den angesetzten 100 Nits Szenenleuchtdichte bei 50,8078% nun noch knapp 5 Blenden bis mit 5952,08 Nits Szenenleuchtdichte ein Videopegel von 100% erzeugt wird. Auf der Displayseite erzeugen diese 5 Blenden durch das Systemgamma mathematisch Displayleuchtdichten von 100 – 10.000 cd/m2, also knapp 6,5 Blenden. Dies entspricht dem oft benannten Highlight-Vorteil des HDR-Signals.

Zusammengefasst ist PQ bis 100 cd/m2 Displayleuchtdichte gleich SDR plus eine daran anknüpfende Erweiterung für 6,5 Blenden Highlights.

Das Beispiel lässt sich auf jegliche reale Szenenleuchtdichten übertragen.

Mathematisch begründet sich der Aspekt darin, dass das System-Gamma von PQ genau dem SDR-Systemgamma nach BT.709 sowie BT.1886 entspricht. Dabei werden die Formeln mathematisch so eingesetzt, dass die relative Szenenleuchtdichte im SDR-Bereich des HDR-Signals so skaliert wird (0-0,0168 -> multipliziert mit 59,5208 -> 0-1), dass sie in diesem Bereich genau den Werten entsprechen, die eine SDR-Kamera in die Formeln geben würde (0-1). Der darüber liegende Bereich der relativen Szenenleuchtdichte (0,0167 – 1) der HDR-Kamera nutzt die gleiche Formeln dann nur mit größeren Werten (0,0167-1 -> multipliziert mit 59,5208 -> 1,0289-6,8129).  Die daraus resultierenden Werte der BT.709/BT.1886 entsprechen dann bereits den finalen Displayleuchtdichten. Dies liegt an den Verhältnissen von HDR-PQ-OETF zu HDR-PQ-EOTF:

Die OETF ist explizit als EOTF-1[OOTF[E]]] definiert, mit OOTF[E] = BT.1886[BT.709[E]], also EOTF-1[BT.1886[BT.709[E]]], entspricht also der Gamma-Bearbeitung durch die SDR-Formeln, verpackt in der invertierten Ausgangskennlinie. Die EOTF-1 als Teil der Eingangsformel sowie die OETF als Ausgangsformel heben sich mathematisch auf, da gilt EOTF[EOTF-1[x]]=x. Damit haben sie letztlich keinen Einfluss auf das Signal sondern bestimmen nur den Zusammenhang zwischen Leuchtdichten und Videopegel. Das eigentliche Gamma kommt also nur über die OOTF  = BT.1886[BT.709[E]], wobei die Formeln lediglich mit größeren Eingangswerten genutzt werden (siehe oben). Daher entstehen in diesem Schritt bereits die finalen Leuchtdichten (welches inhaltlich auch sinnvoll ist, da die OOTF die Übertragungsfunktion “über alles” ist) , die von der EOTF-1 dann nur in ein Verhältnis zu Videopegeln und Codierung gesetzt werden und mit der OETF wieder aus diesem Verhältnis entnommen. Der mathematische Zusammenhang findet sich auch noch einmal exemplarisch in folgender Darstellung:

Letztendlich resultieren diese Zusammenhänge in den zwei Kernaspekten, dass in HDR PQ die gleiche SDR-Formel für einen größeren Wertebereich genutzt wird und es durch ein andere EOTF einen anderen Zusammenhang zwischen Leuchtdichten und Videopegeln gibt. Inhaltlich bearbeiten die EOTF bzw. EOTF-1 aber keinerlei Leuchtdichten und verhalten sich mathematisch ohne Einfluss, das Systemgamma ist damit inhaltlich gleich SDR, wir nur auf den vollen Helligkeitsbereich erweitert.

HDR PQ Narrow Range Coding

Warum die durch BT.709 und BT.1886 bewerteten Signalwerte nicht direkt linear codiert werden können, sondern es vorher noch eine technische Bewertung mittels EOTF-1 gibt, zeigt folgender Vergleich:

Szenenleuchtdichte vs. Displayleuchtdichte bei 10-bit Codierung mit per PQ EOTF angepassten Signalwerten:

Szenenleuchtdichte vs. Displayleuchtdichte bei 10-bit Codierung wenn man nur die per OOTF (BT.709 & BT.2020)  bewerteten Signalwerte direkt kodieren würde:

Es gäbe bei reiner Codierung der OOTF deutlich weniger Code Values für dunkle Werte als wenn man die von der OOTF bewerteten Werte vor der Codierung noch mittels HDR PQ EOTF-1 bewertet. Da sich diese am Ende durch die EOTF am Endgerät mathematisch auflöst, hat sie keinen weiteren Einfluss, ist für eine visuell saubere Übertragung aber zwingend notwendig.

OOTF

An die oben beschriebene OOTF halten sich jedoch nicht zwingend alle Kamerahersteller. Einige bringen auch ihre eigene OOTF ein, bevor das Signal mit der Referenz EOTF-1 für die Codierung bewertet wird. Aktuell besteht Anlass zur Vermutung, dass dies auch bei der LDX C86N von Grass Valley der Fall ist, da diese im Bereich der unteren Szenenleuchtdichten deutlich höhere Displayleuchtdichten produziert und das Bild dadurch “flauer” wirkt.

In der Kamera wird für den Bereich von 0-51% Videopegel ein Simple Gamma von 1.2 angegeben, der Bereich darüber hinaus als linear angenommen. Damit fehlen gegenüber der originalen OOTF entscheiden Aspekte: Der lineare Teil im unteren Bereich der BT.709 und ein komplexeres Gamma wie in BT.709 bis in die Highlights.

Diese auf Grund der Kameradaten vermutete Theorie würde als OOTF mit HDR PQ EOTF-1 als technische Bewertung hinter OOTF und vor Codierung wie folgt aussehen:

Der sichtbare Sprung zwischen Simple Gamma und linearem Teil wird dabei sicher noch weitergehend ausgeglichen. Grundsätzlich wird aber schnell deutlich, wie unterschiedlich die OOTF ist und dass diese eine deutliche höhere Displayleuchtdichten im unteren Szenenleuchtdichte-Bereich erzeugt, als die HDR PQ Referenz OOTF oben.

Dies würde das in der Versuchsauswertung deutlich sichtbare flaue Schwarz des Bildes erklären.