Abychom se lépe připravili na prozkoumání možností a omezení kvantových Circuit, představíme si nyní některé další matematické pojmy — konkrétně skalární součin mezi vektory (a jeho souvislost s euklidovskou normou), pojmy ortogonalita a ortonormalita pro množiny vektorů a projekční matice, které nám umožní zavést šikovné zobecnění měření ve standardní bázi.
Připomeň si, že když v Diracově notaci označujeme libovolný sloupcový vektor jako ket, například
∣ψ⟩=α1α2⋮αn,
odpovídající bra vektor je konjugovaná transpozice tohoto vektoru:
⟨ψ∣=(∣ψ⟩)†=(α1α2⋯αn).(1)
Případně, pokud máme na mysli nějakou množinu klasických stavů Σ a vyjádříme sloupcový vektor jako ket,
například
∣ψ⟩=a∈Σ∑αa∣a⟩,
pak odpovídající řádkový (nebo bra) vektor je konjugovaná transpozice
⟨ψ∣=a∈Σ∑αa⟨a∣.(2)
Také platí, že součin bra vektoru a ket vektoru, na které se díváme jako na matice s jedním řádkem nebo jedním sloupcem, dává skalár.
Konkrétně, pokud máme dva sloupcové vektory
∣ψ⟩=α1α2⋮αnand∣ϕ⟩=β1β2⋮βn,
takže řádkový vektor ⟨ψ∣ je jako v rovnici (1), pak
kde poslední rovnost plyne z pozorování, že ⟨a∣a⟩=1 a ⟨a∣b⟩=0 pro klasické stavy a a b splňující a=b.
Hodnota ⟨ψ∣ϕ⟩ se nazývá skalární součin vektorů ∣ψ⟩ a ∣ϕ⟩.
Skalární součiny jsou v kvantové informaci a výpočtech naprosto zásadní;
bez nich bychom se v pochopení kvantové informace na matematické úrovni daleko nedostali.
Shromážděme nyní některé základní fakty o skalárních součinech vektorů.
Vztah k euklidovské normě. Skalární součin libovolného vektoru
∣ψ⟩=a∈Σ∑αa∣a⟩
se sebou samým je
⟨ψ∣ψ⟩=a∈Σ∑αaαa=a∈Σ∑∣αa∣2=∣ψ⟩2.
Euklidovskou normu vektoru tedy můžeme alternativně vyjádřit jako
∣ψ⟩=⟨ψ∣ψ⟩.
Všimni si, že euklidovská norma vektoru musí být vždy nezáporné reálné číslo.
Navíc jediný způsob, jak může být euklidovská norma vektoru rovna nule, je ten, že každá její složka je rovna nule, což znamená, že vektor je nulový vektor.
Tato pozorování můžeme shrnout takto: pro každý vektor ∣ψ⟩ platí
⟨ψ∣ψ⟩≥0,
přičemž ⟨ψ∣ψ⟩=0 právě tehdy, když ∣ψ⟩=0.
Tato vlastnost skalárního součinu se někdy označuje jako pozitivní definitnost.
Konjugovaná symetrie. Pro libovolné dva vektory
∣ψ⟩=a∈Σ∑αa∣a⟩and∣ϕ⟩=b∈Σ∑βb∣b⟩,
platí
⟨ψ∣ϕ⟩=a∈Σ∑αaβaand⟨ϕ∣ψ⟩=a∈Σ∑βaαa,
a proto
⟨ψ∣ϕ⟩=⟨ϕ∣ψ⟩.
Linearita v druhém argumentu (a konjugovaná linearita v prvním).
Předpokládejme, že ∣ψ⟩,∣ϕ1⟩, a ∣ϕ2⟩ jsou vektory a α1 a α2 jsou komplexní čísla. Pokud definujeme nový vektor
To znamená, že skalární součin je lineární v druhém argumentu.
To znamená, že vnitřní součin je lineární ve druhém argumentu.
To lze ověřit buď pomocí výše uvedených vzorců, nebo jednoduše tím, že si uvědomíš, že násobení matic je lineární v každém argumentu (a konkrétně ve druhém argumentu).
Kombinací tohoto faktu s konjugovanou symetrií zjistíme, že vnitřní součin je konjugovaně lineární v prvním argumentu. To znamená, že pokud ∣ψ1⟩,∣ψ2⟩, a ∣ϕ⟩ jsou vektory a α1 a α2 jsou komplexní čísla, a definujeme
Dva vektory ∣ϕ⟩ a ∣ψ⟩ se nazývají ortogonální, pokud je jejich vnitřní součin nulový:
⟨ψ∣ϕ⟩=0.
Geometricky si ortogonální vektory můžeš představit jako vektory, které jsou na sebe kolmé.
Množina vektorů {∣ψ1⟩,…,∣ψm⟩} se nazývá ortogonální množina, pokud je každý vektor v množině ortogonální ke každému jinému vektoru v množině.
To znamená, že tato množina je ortogonální, pokud
⟨ψj∣ψk⟩=0
pro všechny volby j,k∈{1,…,m}, pro které j=k.
Množina vektorů {∣ψ1⟩,…,∣ψm⟩} se nazývá ortonormální množina, pokud je ortogonální množinou a navíc je každý vektor v množině jednotkovým vektorem.
Alternativně je tato množina ortonormální, pokud platí
⟨ψj∣ψk⟩={10j=kj=k(3)
pro všechny volby j,k∈{1,…,m}.
Nakonec, množina {∣ψ1⟩,…,∣ψm⟩} je ortonormální báze, pokud je kromě toho, že je ortonormální množinou, také bází.
To je ekvivalentní tomu, že {∣ψ1⟩,…,∣ψm⟩} je ortonormální množina a m se rovná dimenzi prostoru, ze kterého jsou vektory ∣ψ1⟩,…,∣ψm⟩ vybrány.
Například pro libovolnou množinu klasických stavů Σ tvoří množina všech vektorů standardní báze
{∣a⟩:a∈Σ}
ortonormální bázi.
Množina {∣+⟩,∣−⟩} je ortonormální bází 2-dimenzionálního prostoru odpovídajícího jednomu qubit, a Bellova báze {∣ϕ+⟩,∣ϕ−⟩,∣ψ+⟩,∣ψ−⟩} je ortonormální bází 4-dimenzionálního prostoru odpovídajícího dvěma qubit.
Rozšíření ortonormálních množin na ortonormální báze
Předpokládej, že ∣ψ1⟩,…,∣ψm⟩ jsou vektory žijící v n-dimenzionálním prostoru, a předpokládej navíc, že {∣ψ1⟩,…,∣ψm⟩} je ortonormální množina.
Ortonormální množiny jsou vždy lineárně nezávislé množiny, takže tyto vektory nutně generují podprostor dimenze m.
Z toho vyplývá, že m≤n, protože dimenze podprostoru generovaného těmito vektory nemůže být větší než dimenze celého prostoru, ze kterého jsou vybrány.
Pokud platí m<n, pak je vždy možné zvolit dalších n−m vektorů
∣ψm+1⟩,…,∣ψn⟩ tak, aby
{∣ψ1⟩,…,∣ψn⟩} tvořilo ortonormální bázi.
K sestrojení těchto vektorů lze použít proceduru známou jako Gramův–Schmidtův ortogonalizační proces.
Ortonormální množiny vektorů jsou úzce spjaty s unitárními maticemi.
Jeden ze způsobů, jak vyjádřit tuto souvislost, je říci, že následující tři tvrzení jsou logicky ekvivalentní (což znamená, že jsou buď všechna pravdivá, nebo všechna nepravdivá) pro libovolnou volbu čtvercové matice U:
Matice U je unitární (tedy U†U=I=UU†).
Řádky matice U tvoří ortonormální množinu.
Sloupce matice U tvoří ortonormální množinu.
Tato ekvivalence je vlastně dost přímočará, když se zamyslíš nad tím, jak funguje násobení matic a konjugovaná transpozice.
Předpokládej například, že máme matici 3×3 jako je tato:
S odkazem na rovnici (3) nyní vidíme, že podmínka, aby tato matice byla rovna jednotkové matici, je ekvivalentní ortonormalitě množiny {∣ψ1⟩,∣ψ2⟩,∣ψ3⟩}.
Tento argument se zobecňuje na unitární matice libovolné velikosti.
Fakt, že řádky matice tvoří ortonormální bázi právě tehdy, když je matice unitární, pak plyne z toho, že matice je unitární právě tehdy, když je unitární její transpozice.
Vzhledem k výše popsané ekvivalenci spolu s faktem, že každou ortonormální množinu lze rozšířit na ortonormální bázi, dospějeme k následujícímu užitečnému faktu:
Pro libovolnou ortonormální množinu vektorů {∣ψ1⟩,…,∣ψm⟩} z n-dimenzionálního prostoru existuje unitární matice U, jejíž prvních m sloupců tvoří vektory ∣ψ1⟩,…,∣ψm⟩.
Obrazně řečeno, vždy můžeme najít unitární matici v tomto tvaru:
Čtvercová matice Π se nazývá projekce, pokud splňuje dvě vlastnosti:
Π=Π†.
Π2=Π.
Matice, které splňují první podmínku — tedy že se rovnají své vlastní konjugované transpozici — se nazývají hermitovské matice, a matice, které splňují druhou podmínku — tedy že umocnění je nezmění — se nazývají idempotentní matice.
Na upozornění: slovo projekce se někdy používá pro jakoukoli matici, která splňuje pouze druhou podmínku, ale ne nutně první, a v tom případě se termín ortogonální projekce obvykle používá pro matice splňující obě vlastnosti.
V kontextu kvantové informatiky a výpočtů však termíny projekce a projekční matice typicky označují matice splňující obě podmínky.
Příkladem projekce je matice
Π=∣ψ⟩⟨ψ∣(4)
pro libovolný jednotkový vektor ∣ψ⟩.
To, že tato matice je hermitovská, můžeš vidět takto:
Π†=(∣ψ⟩⟨ψ∣)†=(⟨ψ∣)†(∣ψ⟩)†=∣ψ⟩⟨ψ∣=Π.
Zde jsme k získání druhé rovnosti použili vzorec
(AB)†=B†A†,
který platí vždy, pro libovolné dvě matice A a B, pro které má součin AB smysl.
Abychom viděli, že matice Π v (4) je idempotentní, můžeme použít předpoklad, že ∣ψ⟩ je jednotkový vektor, takže splňuje ⟨ψ∣ψ⟩=1.
Tedy máme
Π2=(∣ψ⟩⟨ψ∣)2=∣ψ⟩⟨ψ∣ψ⟩⟨ψ∣=∣ψ⟩⟨ψ∣=Π.
Obecněji, pokud {∣ψ1⟩,…,∣ψm⟩} je libovolná ortonormální množina vektorů, pak matice
kde ortonormalita {∣ψ1⟩,…,∣ψm⟩} implikuje předposlední rovnost.
Ve skutečnosti tím jsou vyčerpány všechny možnosti: každou projekci Π lze zapsat ve tvaru (5) pro nějakou volbu ortonormální množiny {∣ψ1⟩,…,∣ψm⟩}.
(Technicky vzato, nulová matice Π=0, která je projekcí, je speciální případ.
Aby se vešla do obecného tvaru (5), musíme připustit možnost, že součet je prázdný, což dává nulovou matici.)
Pojem měření kvantového systému je obecnější než jen měření ve standardní bázi.
Projektivní měření jsou měření, která jsou popsána kolekcí projekcí, jejichž součet se rovná jednotkové matici.
Symbolicky, kolekce {Π0,…,Πm−1} projekčních matic popisuje projektivní měření, pokud
Π0+⋯+Πm−1=I.
Když se takové měření provede na systému X, který je v nějakém stavu ∣ψ⟩, stanou se dvě věci:
Pro každé k∈{0,…,m−1} je výsledek měření k s pravděpodobností rovnou
Pr(outcome is k)=Πk∣ψ⟩2.
Pro ten výsledek k, který měření dá, se stav X změní na
Πk∣ψ⟩Πk∣ψ⟩.
Můžeme si také zvolit jiné výsledky než {0,…,m−1} pro projektivní měření, pokud chceme.
Obecněji, pro libovolnou konečnou a neprázdnou množinu Σ, pokud máme kolekci projekčních matic
{Πa:a∈Σ}
která splňuje podmínku
a∈Σ∑Πa=I,
pak tato kolekce popisuje projektivní měření, jehož možné výsledky odpovídají množině Σ, kde pravidla jsou stejná jako předtím:
Pro každé a∈Σ je výsledek měření a s pravděpodobností rovnou
Pr(outcome is a)=Πa∣ψ⟩2.
Pro ten výsledek a, který měření dá, se stav X změní na
Πa∣ψ⟩Πa∣ψ⟩.
Například měření ve standardní bázi jsou ekvivalentní projektivním měřením, kde Σ je množina klasických stavů toho systému X, o kterém mluvíme, a naše množina projekčních matic je
{∣a⟩⟨a∣:a∈Σ}.Dalším příkladem projektivního měření, tentokrát na dvou Qubitech (X,Y), je množina
{Π0,Π1}, kde
Π0=∣ϕ+⟩⟨ϕ+∣+∣ϕ−⟩⟨ϕ−∣+∣ψ+⟩⟨ψ+∣andΠ1=∣ψ−⟩⟨ψ−∣.
Pokud máme více systémů, které jsou společně v nějakém kvantovém stavu, a projektivní měření se provede pouze na jednom ze systémů, je výsledek podobný tomu, co jsme měli pro měření ve standardní bázi — a ve skutečnosti nyní můžeme tento účinek popsat mnohem jednodušeji než dříve.
Přesněji řečeno, předpokládejme, že máme dva systémy (X,Y) v kvantovém stavu ∣ψ⟩, a projektivní měření popsané kolekcí {Πa:a∈Σ} se provede na systému X, zatímco se systémem Y se nic neděje.
Provedení tohoto je pak ekvivalentní provedení projektivního měření popsaného kolekcí
{Πa⊗I:a∈Σ}
na společném systému (X,Y).
Každý výsledek měření a nastane s pravděpodobností
(Πa⊗I)∣ψ⟩2,
a podmíněno výsledkem a se stav společného systému (X,Y) změní na
Libovolná projektivní měření lze implementovat pomocí unitárních operací, měření ve standardní bázi a extra pracovního systému, jak bude nyní vysvětleno.
Předpokládejme, že X je systém a {Π0,…,Πm−1} je projektivní měření na X. Tuto diskuzi můžeme snadno zobecnit na projektivní měření s různými množinami výsledků, ale v zájmu pohodlí a jednoduchosti budeme předpokládat, že množina možných výsledků našeho měření je {0,…,m−1}.
Poznamenejme výslovně, že m nemusí být nutně rovno počtu klasických stavů X — počet klasických stavů X označíme n, což znamená, že každá matice Πk je projekční matice n×n.
Protože předpokládáme, že {Π0…,Πm−1} představuje projektivní měření, nutně platí
k=0∑m−1Πk=In.
Naším cílem je provést proces, který má stejný efekt jako provedení tohoto projektivního měření na X, ale dosáhnout toho pouze pomocí unitárních operací a měření ve standardní bázi.
K tomu využijeme extra pracovní systém Y, a konkrétně zvolíme množinu klasických stavů Y jako {0,…,m−1}, což je stejná množina jako množina výsledků projektivního měření.
Myšlenka je taková, že provedeme měření ve standardní bázi na Y a výsledek tohoto měření budeme interpretovat jako ekvivalent výsledku projektivního měření na X.
Budeme muset předpokládat, že Y je inicializován do nějakého pevného stavu, který zvolíme jako ∣0⟩.
(Jakákoliv jiná volba pevného kvantového stavového vektoru by také fungovala, ale volba ∣0⟩ výrazně zjednoduší následující vysvětlení.)
Aby nám samozřejmě měření Y ve standardní bázi něco řeklo o X, budeme muset nechat X a Y před měřením Y nějakým způsobem interagovat, a to provedením unitární operace na systému (Y,X).
Nejprve uvažujme tuto matici:
M=k=0∑m−1∣k⟩⟨0∣⊗Πk.
Vyjádřena explicitně jako takzvaná bloková matice, což je v podstatě matice matic, kterou interpretujeme jako jednu větší matici, vypadá M takto:
M=Π0Π1⋮Πm−100⋮0⋯⋯⋱⋯00⋮0.
Zde každá 0 představuje matici n×n vyplněnou zcela nulami, takže celá matice M je matice nm×nm.
M rozhodně není unitární matice (pokud m=1, v tom případě Π0=I, což dává M=I v tomto triviálním případě), protože unitární matice nemohou mít žádné sloupce (ani řádky), které jsou celé 0; unitární matice mají sloupce tvořící ortonormální bázi, a nulový vektor není jednotkový vektor.
Nicméně prvních n sloupců M je ortonormálních, a to plyne z předpokladu, že {Π0,…,Πm−1} je měření.
Pro ověření tohoto tvrzení si všimni, že pro každé j∈{0,…,n−1} je vektor tvořený sloupcem číslo j matice M následující:
∣ψj⟩=M∣0,j⟩=k=0∑m−1∣k⟩⊗Πk∣j⟩.
Všimni si, že zde číslujeme sloupce od sloupce 0. Skalární součin sloupce i se sloupcem j pro i,j∈{0,…,n−1} dává
Protože tedy prvních n sloupců matice M je ortonormálních, můžeme všechny zbývající nulové položky nahradit jinou volbou komplexních čísel tak, aby celá matice byla unitární.
U=Π0Π1⋮Πm−1??⋮?⋯⋯⋱⋯??⋮?
Pokud máme dány matice Π0,…,Πm−1, můžeme vhodné matice pro dosazení za bloky označené ? v rovnici vypočítat — pomocí Gram-Schmidtova procesu — ale konkrétní podoba těchto matic pro účely této diskuze nehraje roli.
Nakonec můžeme popsat proces měření: nejprve provedeme U na společném systému (Y,X) a poté změříme Y pomocí měření ve standardní bázi.
Pro libovolný stav ∣ϕ⟩ systému X získáme stav
U(∣0⟩∣ϕ⟩)=M(∣0⟩∣ϕ⟩)=k=0∑m−1∣k⟩⊗Πk∣ϕ⟩,
kde první rovnost plyne z toho, že U a M se shodují ve svých prvních n sloupcích.
Když provedeme projektivní měření na Y, získáme každý výsledek k s pravděpodobností
Πk∣ϕ⟩2,
přičemž stav (Y,X) se v tom případě změní na
∣k⟩⊗Πk∣ϕ⟩Πk∣ϕ⟩.
Tedy Y uchovává kopii výsledku měření a X se změní přesně tak, jako by projektivní měření popsané {Π0,…,Πm−1} bylo provedeno přímo na X.