Přeskočit na hlavní obsah

Klasická informace

Stejně jako v předchozí lekci začneme i tuto lekci diskuzí o klasické informaci. Probabilistický a kvantový popis jsou opět matematicky podobné a pochopení toho, jak matematika funguje ve známém prostředí klasické informace, ti pomůže pochopit, proč je kvantová informace popisována právě tak, jak je.

Klasické stavy pomocí kartézského součinu

Začneme na velmi základní úrovni, klasickými stavy více systémů. Pro jednoduchost začneme diskuzí pouze o dvou systémech a poté zobecníme na více než dva systémy.

Přesněji řečeno, nechť X\mathsf{X} je systém, jehož množina klasických stavů je Σ,\Sigma, a nechť Y\mathsf{Y} je druhý systém, jehož množina klasických stavů je Γ.\Gamma. Všimni si, že protože jsme tyto množiny označili jako množiny klasických stavů, předpokládáme, že Σ\Sigma i Γ\Gamma jsou konečné a neprázdné. Může platit Σ=Γ,\Sigma = \Gamma, ale nemusí — a v každém případě bude pro přehlednost užitečné používat pro tyto množiny různá jména.

Nyní si představ, že dva systémy, X\mathsf{X} a Y,\mathsf{Y}, jsou umístěny vedle sebe, s X\mathsf{X} vlevo a Y\mathsf{Y} vpravo. Pokud chceme, můžeme tyto dva systémy chápat, jako by tvořily jediný systém, který můžeme označit (X,Y)(\mathsf{X},\mathsf{Y}) nebo XY\mathsf{XY} podle naší preference. Přirozená otázka ohledně tohoto složeného systému (X,Y)(\mathsf{X},\mathsf{Y}) zní: „Jaké jsou jeho klasické stavy?"

Odpověď je, že množina klasických stavů (X,Y)(\mathsf{X},\mathsf{Y}) je kartézský součin Σ\Sigma a Γ,\Gamma, což je množina definovaná jako

Σ×Γ={(a,b):aΣ  and  bΓ}. \Sigma\times\Gamma = \bigl\{(a,b)\,:\,a\in\Sigma\;\text{and}\;b\in\Gamma\bigr\}.

Jednoduše řečeno, kartézský součin je přesně ten matematický pojem, který zachycuje myšlenku nahlížení na prvek jedné množiny a prvek druhé množiny dohromady, jako by tvořily jediný prvek jediné množiny. V daném případě říci, že (X,Y)(\mathsf{X},\mathsf{Y}) je v klasickém stavu (a,b)Σ×Γ,(a,b)\in\Sigma\times\Gamma, znamená, že X\mathsf{X} je v klasickém stavu aΣa\in\Sigma a Y\mathsf{Y} je v klasickém stavu bΓ;b\in\Gamma; a pokud je klasický stav X\mathsf{X} roven aΣa\in\Sigma a klasický stav Y\mathsf{Y} roven bΓ,b\in\Gamma, pak klasický stav společného systému (X,Y)(\mathsf{X},\mathsf{Y}) je (a,b).(a,b).

Pro více než dva systémy se situace přirozeně zobecňuje. Předpokládejme, že X1,,Xn\mathsf{X}_1,\ldots,\mathsf{X}_n jsou systémy s množinami klasických stavů Σ1,,Σn,\Sigma_1,\ldots,\Sigma_n, pro libovolné kladné celé číslo n.n. Množina klasických stavů nn-tice (X1,,Xn),(\mathsf{X}_1,\ldots,\mathsf{X}_n), chápané jako jediný společný systém, je kartézský součin

Σ1××Σn={(a1,,an):a1Σ1,,anΣn}. \Sigma_1\times\cdots\times\Sigma_n = \bigl\{(a_1,\ldots,a_n)\,:\, a_1\in\Sigma_1,\:\ldots,\:a_n\in\Sigma_n\bigr\}.

Samozřejmě můžeme systémy pojmenovat, jak chceme, a uspořádat je, jak se nám zlíbí. Zejména pokud máme nn systémů jako výše, mohli bychom je místo toho pojmenovat X0,,Xn1\mathsf{X}_{0},\ldots,\mathsf{X}_{n-1} a uspořádat je zprava doleva, takže společný systém se stane (Xn1,,X0).(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0). Při dodržení stejného vzoru pro pojmenování příslušných klasických stavů a množin klasických stavů bychom pak mohli odkazovat na klasický stav

(an1,,a0)Σn1××Σ0(a_{n-1},\ldots,a_0) \in \Sigma_{n-1}\times \cdots \times \Sigma_0

tohoto složeného systému. Právě tuto konvenci uspořádání používá Qiskit při pojmenovávání více Qubitů. K této konvenci a jejímu spojení s kvantovými Circuit se vrátíme v další lekci, ale začneme ji používat už teď, aby sis na ni zvykl.

Je často výhodné zapisovat klasický stav tvaru (an1,,a0)(a_{n-1},\ldots,a_0) jako řetězec an1a0a_{n-1}\cdots a_0 pro stručnost, zejména ve velmi typické situaci, kdy jsou množiny klasických stavů Σ0,,Σn1\Sigma_0,\ldots,\Sigma_{n-1} spojeny s množinami symbolů nebo znaků. V tomto kontextu se termín abeceda běžně používá pro množiny symbolů, ze kterých se tvoří řetězce, ale matematická definice abecedy je přesně stejná jako definice množiny klasických stavů: je to konečná a neprázdná množina.

Předpokládejme například, že X0,,X9\mathsf{X}_0,\ldots,\mathsf{X}_9 jsou bity, takže množiny klasických stavů těchto systémů jsou všechny stejné.

Σ0=Σ1==Σ9={0,1} \Sigma_0 = \Sigma_1 = \cdots = \Sigma_9 = \{0,1\}

Pak existuje 210=10242^{10} = 1024 klasických stavů společného systému (X9,,X0),(\mathsf{X}_9,\ldots,\mathsf{X}_0), což jsou prvky množiny

Σ9×Σ8××Σ0={0,1}10. \Sigma_9\times\Sigma_8\times\cdots\times\Sigma_0 = \{0,1\}^{10}.

Zapsány jako řetězce vypadají tyto klasické stavy takto:

000000000000000000010000000010000000001100000001001111111111 \begin{array}{c} 0000000000\\ 0000000001\\ 0000000010\\ 0000000011\\ 0000000100\\ \vdots\\[1mm] 1111111111 \end{array}

Pro klasický stav 00000001100000000110 například vidíme, že X1\mathsf{X}_1 a X2\mathsf{X}_2 jsou ve stavu 1,1, zatímco všechny ostatní systémy jsou ve stavu 0.0.

Probabilistické stavy

Připomeň si z předchozí lekce, že probabilistický stav přiřazuje pravděpodobnost každému klasickému stavu systému. Probabilistický stav více systémů — chápaných souhrnně jako jediný systém — tedy přiřazuje pravděpodobnost každému prvku kartézského součinu množin klasických stavů jednotlivých systémů.

Předpokládejme například, že X\mathsf{X} a Y\mathsf{Y} jsou oba bity, takže jejich odpovídající množiny klasických stavů jsou Σ={0,1}\Sigma = \{0,1\} a Γ={0,1}.\Gamma = \{0,1\}. Zde je probabilistický stav páru (X,Y):(\mathsf{X},\mathsf{Y}):

Pr((X,Y)=(0,0))=1/2Pr((X,Y)=(0,1))=0Pr((X,Y)=(1,0))=0Pr((X,Y)=(1,1))=1/2 \begin{aligned} \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (0,0)\bigr) & = 1/2 \\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (0,1)\bigr) & = 0\\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (1,0)\bigr) & = 0\\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (1,1)\bigr) & = 1/2 \end{aligned}

Tento probabilistický stav je takový, v němž X\mathsf{X} i Y\mathsf{Y} jsou náhodné bity — každý je 00 s pravděpodobností 1/21/2 a 11 s pravděpodobností 1/21/2 — ale klasické stavy obou bitů se vždy shodují. Toto je příklad korelace mezi těmito systémy.

Uspořádání množin stavů kartézského součinu

Probabilistické stavy systémů mohou být reprezentovány vektory pravděpodobností, jak bylo diskutováno v předchozí lekci. Konkrétně složky vektoru představují pravděpodobnosti, že systém bude v možných klasických stavech daného systému, a rozumí se, že byla zvolena korespondence mezi složkami a množinou klasických stavů.

Zvolení takové korespondence efektivně znamená rozhodnutí o uspořádání klasických stavů, které je často přirozené nebo určené standardní konvencí. Například binární abeceda {0,1}\{0,1\} je přirozeně uspořádána s 00 na prvním místě a 11 na druhém, takže první složka vektoru pravděpodobností reprezentujícího probabilistický stav bitu je pravděpodobnost, že je ve stavu 0,0, a druhá složka je pravděpodobnost, že je ve stavu 1.1.

V kontextu více systémů se na tom nic nemění, ale je třeba se rozhodnout. Množina klasických stavů více systémů dohromady, chápaných souhrnně jako jediný systém, je kartézský součin množin klasických stavů jednotlivých systémů — takže musíme rozhodnout, jak budou prvky kartézských součinů množin klasických stavů uspořádány.

Existuje jednoduchá konvence, kterou pro to dodržujeme, a tou je začít s jakýmkoli uspořádáním, které je už zavedeno pro jednotlivé množiny klasických stavů, a pak uspořádat prvky kartézského součinu abecedně. Jinak řečeno, složky v každé nn-tici (nebo ekvivalentně symboly v každém řetězci) se chovají, jako by měly význam, který klesá zleva doprava. Například podle této konvence je kartézský součin {1,2,3}×{0,1}\{1,2,3\}\times\{0,1\} uspořádán takto:

(1,0),  (1,1),  (2,0),  (2,1),  (3,0),  (3,1). (1,0),\; (1,1),\; (2,0),\; (2,1),\; (3,0),\; (3,1).

Když jsou nn-tice zapsány jako řetězce a uspořádány tímto způsobem, pozorujeme známé vzory, jako je {0,1}×{0,1}\{0,1\}\times\{0,1\} uspořádané jako 00,01,10,11,00, 01, 10, 11, a množina {0,1}10\{0,1\}^{10} uspořádaná tak, jak byla zapsána dříve v této lekci. Jako další příklad, chápeme-li množinu {0,1,,9}×{0,1,,9}\{0, 1, \dots, 9\} \times \{0, 1, \dots, 9\} jako množinu řetězců, získáme dvojciferná čísla 000099,99, uspořádaná numericky. To samozřejmě není náhoda; náš desítkový číselný systém používá přesně tento druh abecedního uspořádání, kde slovo abecední je třeba chápat v širokém smyslu, který zahrnuje kromě písmen i číslice.

Vrátíme-li se k výše uvedenému příkladu dvou bitů, dříve popsaný probabilistický stav je tedy reprezentován následujícím vektorem pravděpodobností, kde jsou složky pro přehlednost explicitně označeny.

(120012)probability of being in the state 00probability of being in the state 01probability of being in the state 10probability of being in the state 11(1) \begin{pmatrix} \frac{1}{2}\\[1mm] 0\\[1mm] 0\\[1mm] \frac{1}{2} \end{pmatrix} \begin{array}{l} \leftarrow \text{probability of being in the state 00}\\[1mm] \leftarrow \text{probability of being in the state 01}\\[1mm] \leftarrow \text{probability of being in the state 10}\\[1mm] \leftarrow \text{probability of being in the state 11} \end{array} \tag{1}

Nezávislost dvou systémů

Speciálním typem probabilistického stavu dvou systémů je stav, v němž jsou systémy nezávislé. Intuitivně řečeno, dva systémy jsou nezávislé, pokud zjištění klasického stavu jednoho systému nemá žádný vliv na pravděpodobnosti spojené s druhým systémem. To znamená, že zjištění, v jakém klasickém stavu se jeden ze systémů nachází, neposkytuje vůbec žádnou informaci o klasickém stavu druhého systému.

Pro přesnou definici tohoto pojmu předpokládejme opět, že X\mathsf{X} a Y\mathsf{Y} jsou systémy s množinami klasických stavů Σ\Sigma a Γ.\Gamma. Vzhledem k danému probabilistickému stavu těchto systémů se říká, že jsou nezávislé, pokud platí

Pr((X,Y)=(a,b))=Pr(X=a)Pr(Y=b)(2) \operatorname{Pr}((\mathsf{X},\mathsf{Y}) = (a,b)) = \operatorname{Pr}(\mathsf{X} = a) \operatorname{Pr}(\mathsf{Y} = b) \tag{2}

pro každou volbu aΣa\in\Sigma a bΓ.b\in\Gamma.

Pro vyjádření této podmínky pomocí vektorů pravděpodobností předpokládejme, že daný probabilistický stav (X,Y)(\mathsf{X},\mathsf{Y}) je popsán vektorem pravděpodobností, zapsaným v Diracově notaci jako

(a,b)Σ×Γpabab.\sum_{(a,b) \in \Sigma\times\Gamma} p_{ab} \vert a b\rangle.

Podmínka (2)(2) pro nezávislost je pak ekvivalentní existenci dvou vektorů pravděpodobností

ϕ=aΣqaaandψ=bΓrbb,\vert \phi \rangle = \sum_{a\in\Sigma} q_a \vert a \rangle \quad\text{and}\quad \vert \psi \rangle = \sum_{b\in\Gamma} r_b \vert b \rangle,

reprezentující pravděpodobnosti přiřazené klasickým stavům X\mathsf{X} a Y,\mathsf{Y}, takové, že

pab=qarb(4)p_{ab} = q_a r_b \tag{4}

pro všechna aΣa\in\Sigma a bΓ.b\in\Gamma.

Například pravděpodobnostní stav dvojice bitů (X,Y)(\mathsf{X},\mathsf{Y}) reprezentovaný vektorem

1600+11201+1210+1411 \frac{1}{6} \vert 00 \rangle + \frac{1}{12} \vert 01 \rangle + \frac{1}{2} \vert 10 \rangle + \frac{1}{4} \vert 11 \rangle

je takový, ve kterém jsou X\mathsf{X} a Y\mathsf{Y} nezávislé. Konkrétně je podmínka požadovaná pro nezávislost splněna pro pravděpodobnostní vektory

ϕ=140+341andψ=230+131. \vert \phi \rangle = \frac{1}{4} \vert 0 \rangle + \frac{3}{4} \vert 1 \rangle \quad\text{and}\quad \vert \psi \rangle = \frac{2}{3} \vert 0 \rangle + \frac{1}{3} \vert 1 \rangle.

Například abychom ověřili shodu pravděpodobností pro stav 00,00, potřebujeme 16=14×23,\frac{1}{6} = \frac{1}{4} \times \frac{2}{3}, a to skutečně platí. Ostatní položky lze ověřit obdobným způsobem.

Na druhou stranu pravděpodobnostní stav (1),(1), který můžeme zapsat jako

1200+1211,(5) \frac{1}{2} \vert 00 \rangle + \frac{1}{2} \vert 11 \rangle, \tag{5}

nepředstavuje nezávislost mezi systémy X\mathsf{X} a Y.\mathsf{Y}. Jednoduchý způsob, jak to zdůvodnit, je následující.

Předpokládejme, že by existovaly pravděpodobnostní vektory ϕ\vert \phi\rangle a ψ,\vert \psi \rangle, jako v rovnici (3)(3) výše, pro které je podmínka (4)(4) splněna pro každou volbu aa a b.b. Pak by nutně muselo platit

q0r1=Pr((X,Y)=(0,1))=0. q_0 r_1 = \operatorname{Pr}\bigl((\mathsf{X},\mathsf{Y}) = (0,1)\bigr) = 0.

To znamená, že buď q0=0,q_0 = 0, nebo r1=0,r_1 = 0, protože kdyby obojí bylo nenulové, součin q0r1q_0 r_1 by také byl nenulový. To vede k závěru, že buď q0r0=0q_0 r_0 = 0 (v případě q0=0q_0 = 0), nebo q1r1=0q_1 r_1 = 0 (v případě r1=0r_1 = 0). Vidíme však, že ani jedna z těchto rovností nemůže platit, protože musí být q0r0=1/2q_0 r_0 = 1/2 a q1r1=1/2.q_1 r_1 = 1/2. Neexistují tedy vektory ϕ\vert\phi\rangle a ψ\vert\psi\rangle splňující vlastnost požadovanou pro nezávislost.

Po definování nezávislosti dvou systémů nyní můžeme definovat, co se rozumí korelací: je to nedostatek nezávislosti. Například proto, že dva bity v pravděpodobnostním stavu reprezentovaném vektorem (5)(5) nejsou nezávislé, jsou podle definice korelované.

Tenzorové součiny vektorů

Podmínku nezávislosti, kterou jsme právě popsali, lze stručně vyjádřit pomocí pojmu tenzorový součin. Přestože tenzorové součiny jsou velmi obecný pojem a lze je definovat poměrně abstraktně a aplikovat na různé matematické struktury, v daném případě můžeme přijmout jednoduchou a konkrétní definici.

Jsou-li dány dva vektory

ϕ=aΣαaaandψ=bΓβbb,\vert \phi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{and}\quad \vert \psi \rangle = \sum_{b\in\Gamma} \beta_b \vert b \rangle,

tenzorový součin ϕψ\vert \phi \rangle \otimes \vert \psi \rangle je vektor definovaný jako

ϕψ=(a,b)Σ×Γαaβbab. \vert \phi \rangle \otimes \vert \psi \rangle = \sum_{(a,b)\in\Sigma\times\Gamma} \alpha_a \beta_b \vert ab\rangle.

Složky tohoto nového vektoru odpovídají prvkům kartézského součinu Σ×Γ,\Sigma\times\Gamma, které jsou v předchozí rovnici zapsány jako řetězce. Ekvivalentně je vektor π=ϕψ\vert \pi \rangle = \vert \phi \rangle \otimes \vert \psi \rangle definován rovnicí

abπ=aϕbψ\langle ab \vert \pi \rangle = \langle a \vert \phi \rangle \langle b \vert \psi \rangle

platící pro každé aΣa\in\Sigma a bΓ.b\in\Gamma.

Nyní můžeme přeformulovat podmínku nezávislosti: pro společný systém (X,Y)(\mathsf{X}, \mathsf{Y}) v pravděpodobnostním stavu reprezentovaném pravděpodobnostním vektorem π\vert \pi \rangle jsou systémy X\mathsf{X} a Y\mathsf{Y} nezávislé, pokud π\vert\pi\rangle vznikne tenzorovým součinem

π=ϕψ \vert \pi \rangle = \vert \phi \rangle \otimes \vert \psi \rangle

pravděpodobnostních vektorů ϕ\vert \phi \rangle a ψ\vert \psi \rangle na každém z podsystémů X\mathsf{X} a Y.\mathsf{Y}. V této situaci se o π\vert \pi \rangle říká, že je to produktový stav nebo produktový vektor.

Často vynecháváme symbol \otimes při tvoření tenzorového součinu ketů, takže píšeme ϕψ\vert \phi \rangle \vert \psi \rangle místo ϕψ.\vert \phi \rangle \otimes \vert \psi \rangle. Tato konvence vyjadřuje myšlenku, že tenzorový součin je v tomto kontextu nejpřirozenějším či výchozím způsobem, jak násobit dva vektory. I když je to méně obvyklé, někdy se také používá zápis ϕψ\vert \phi\otimes\psi\rangle.

Když použijeme abecední konvenci pro uspořádání prvků kartézských součinů, získáme následující specifikaci tenzorového součinu dvou sloupcových vektorů.

(α1αm)(β1βk)=(α1β1α1βkα2β1α2βkαmβ1αmβk) \begin{pmatrix} \alpha_1\\ \vdots\\ \alpha_m \end{pmatrix} \otimes \begin{pmatrix} \beta_1\\ \vdots\\ \beta_k \end{pmatrix} = \begin{pmatrix} \alpha_1 \beta_1\\ \vdots\\ \alpha_1 \beta_k\\ \alpha_2 \beta_1\\ \vdots\\ \alpha_2 \beta_k\\ \vdots\\ \alpha_m \beta_1\\ \vdots\\ \alpha_m \beta_k \end{pmatrix}

Jako důležitou poznámku si všimni následujícího výrazu pro tenzorové součiny vektorů standardní báze:

ab=ab.\vert a \rangle \otimes \vert b \rangle = \vert ab \rangle.

Alternativně bychom mohli zapsat (a,b)(a,b) jako uspořádanou dvojici místo řetězce, čímž bychom dostali ab=(a,b).\vert a \rangle \otimes \vert b \rangle = \vert (a,b) \rangle. Je však běžnější v této situaci závorky vynechat a psát místo toho ab=a,b.\vert a \rangle \otimes \vert b \rangle = \vert a,b \rangle. To je v matematice obecně typické; závorky, které nepřidávají srozumitelnost ani neodstraňují nejednoznačnost, se často jednoduše vynechávají.

Tenzorový součin dvou vektorů má důležitou vlastnost, že je bilineární, což znamená, že je lineární v každém ze dvou argumentů zvlášť za předpokladu, že druhý argument je pevný. Tuto vlastnost lze vyjádřit těmito rovnicemi:

1. Linearita v prvním argumentu:

(ϕ1+ϕ2)ψ=ϕ1ψ+ϕ2ψ(αϕ)ψ=α(ϕψ)\begin{aligned} \bigl(\vert\phi_1\rangle + \vert\phi_2\rangle\bigr)\otimes \vert\psi\rangle & = \vert\phi_1\rangle \otimes \vert\psi\rangle + \vert\phi_2\rangle \otimes \vert\psi\rangle \\[1mm] \bigl(\alpha \vert \phi \rangle\bigr) \otimes \vert \psi \rangle & = \alpha \bigl(\vert \phi \rangle \otimes \vert \psi \rangle \bigr) \end{aligned}

2. Linearita v druhém argumentu:

ϕ(ψ1+ψ2)=ϕψ1+ϕψ2ϕ(αψ)=α(ϕψ)\begin{aligned} \vert \phi \rangle \otimes \bigl(\vert \psi_1 \rangle + \vert \psi_2 \rangle \bigr) & = \vert \phi \rangle \otimes \vert \psi_1 \rangle + \vert \phi \rangle \otimes \vert \psi_2 \rangle\\[1mm] \vert \phi \rangle \otimes \bigl(\alpha \vert \psi \rangle \bigr) & = \alpha \bigl(\vert\phi\rangle\otimes\vert\psi\rangle\bigr) \end{aligned}

Podíváme-li se na druhou rovnici v každém z těchto párů rovnic, vidíme, že skaláry se v tenzorových součinech „pohybují volně":

(αϕ)ψ=ϕ(αψ)=α(ϕψ).\bigl(\alpha \vert \phi \rangle\bigr) \otimes \vert \psi \rangle = \vert \phi \rangle \otimes \bigl(\alpha \vert \psi \rangle \bigr) = \alpha \bigl(\vert \phi \rangle \otimes \vert \psi \rangle \bigr).

Proto neexistuje žádná nejednoznačnost v prostém zápisu αϕψ,\alpha\vert\phi\rangle\otimes\vert\psi\rangle, případně αϕψ\alpha\vert\phi\rangle\vert\psi \rangle nebo αϕψ,\alpha\vert\phi\otimes\psi\rangle, pro odkaz na tento vektor.

Nezávislost a tenzorové součiny pro tři a více systémů

Pojmy nezávislosti a tenzorových součinů se přímočaře zobecňují na tři a více systémů. Pokud X0,,Xn1\mathsf{X}_0,\ldots,\mathsf{X}_{n-1} jsou systémy s množinami klasických stavů Σ0,,Σn1,\Sigma_0,\ldots,\Sigma_{n-1}, pak pravděpodobnostní stav složeného systému (Xn1,,X0)(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0) je produktový stav, pokud přiřazený pravděpodobnostní vektor má tvar

ψ=ϕn1ϕ0 \vert \psi \rangle = \vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle

pro pravděpodobnostní vektory ϕ0,,ϕn1\vert \phi_0 \rangle,\ldots,\vert \phi_{n-1}\rangle popisující pravděpodobnostní stavy X0,,Xn1.\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}.

ψ=ϕn1ϕ0\vert \psi \rangle = \vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle

je definován rovnicí

an1a0ψ=an1ϕn1a0ϕ0 \langle a_{n-1} \cdots a_0 \vert \psi \rangle = \langle a_{n-1} \vert \phi_{n-1} \rangle \cdots \langle a_0 \vert \phi_0 \rangle

platící pro každé a0Σ0,an1Σn1.a_0\in\Sigma_0, \ldots a_{n-1}\in\Sigma_{n-1}.

Jiný, ale ekvivalentní způsob, jak definovat tenzorový součin tří nebo více vektorů, je rekurzivně pomocí tenzorových součinů dvou vektorů:

ϕn1ϕ0=ϕn1(ϕn2ϕ0). \vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle = \vert \phi_{n-1} \rangle \otimes \bigl( \vert \phi_{n-2} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle \bigr).

Podobně jako u tenzorového součinu pouze dvou vektorů je tenzorový součin tří nebo více vektorů lineární v každém z argumentů jednotlivě, za předpokladu, že všechny ostatní argumenty jsou fixovány. V tomto případě se říká, že tenzorový součin tří nebo více vektorů je multilineární.

Stejně jako v případě dvou systémů bychom mohli říci, že systémy X0,,Xn1\mathsf{X}_0,\ldots,\mathsf{X}_{n-1} jsou nezávislé, když jsou v produktovém stavu, ale přesnější je termín vzájemně nezávislé. Existují i jiné pojmy nezávislosti pro tři nebo více systémů, jako je párová nezávislost, které jsou zajímavé i důležité — ale ne v kontextu tohoto kurzu.

Zobecněním dřívějšího pozorování o tenzorových součinech standardních bázových vektorů platí, že pro libovolné kladné celé číslo nn a libovolné klasické stavy a0,,an1a_0,\ldots,a_{n-1} máme

an1a0=an1a0.\vert a_{n-1} \rangle \otimes \cdots \otimes \vert a_0 \rangle = \vert a_{n-1} \cdots a_0 \rangle.

Měření probabilistických stavů

Nyní přejděme k měřením probabilistických stavů více systémů. Tím, že jsme se rozhodli nahlížet na více systémů společně jako na jediné systémy, okamžitě získáváme specifikaci toho, jak musí měření pro více systémů fungovat — za předpokladu, že se měří všechny systémy.

Například pokud je probabilistický stav dvou bitů (X,Y)(\mathsf{X},\mathsf{Y}) popsán vektorem pravděpodobnosti

1200+1211, \frac{1}{2} \vert 00 \rangle + \frac{1}{2} \vert 11 \rangle,

pak výsledek 0000 — tedy 00 pro měření X\mathsf{X} a 00 pro měření Y\mathsf{Y} — nastane s pravděpodobností 1/21/2 a výsledek 1111 rovněž nastane s pravděpodobností 1/2.1/2. V každém případě příslušně aktualizujeme popis vektoru pravděpodobnosti naší znalosti, takže probabilistický stav se stane 00|00\rangle nebo 11.|11\rangle.

Mohli bychom se ale rozhodnout měřit ne každý systém, ale pouze některé ze systémů. To povede k výsledku měření pro každý systém, který je měřen, a také (obecně) ovlivní naši znalost zbývajících systémů, které jsme neměřili.

Pro vysvětlení, jak to funguje, se zaměříme na případ dvou systémů, z nichž jeden je měřen. Obecnější situace — kdy se měří nějaká vlastní podmnožina tří nebo více systémů — se efektivně redukuje na případ dvou systémů, když nahlížíme na měřené systémy souhrnně, jako by tvořily jeden systém, a na neměřené systémy, jako by tvořily druhý systém.

Přesněji řečeno, předpokládejme, že X\mathsf{X} a Y\mathsf{Y} jsou systémy, jejichž množiny klasických stavů jsou Σ\Sigma a Γ,\Gamma, a že oba systémy dohromady jsou v nějakém probabilistickém stavu. Budeme uvažovat, co se stane, když měříme pouze X\mathsf{X} a s Y\mathsf{Y} neděláme nic. Situace, kdy je měřeno pouze Y\mathsf{Y} a s X\mathsf{X} se nic neděje, se řeší symetricky.

Zaprvé víme, že pravděpodobnost pozorování konkrétního klasického stavu aΣa\in\Sigma při měření pouze X\mathsf{X} musí být konzistentní s pravděpodobnostmi, které bychom získali za předpokladu, že by bylo měřeno i Y.\mathsf{Y}. To znamená, že musí platit

Pr(X=a)=bΓPr((X,Y)=(a,b)). \operatorname{Pr}(\mathsf{X} = a) = \sum_{b\in\Gamma} \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (a,b) \bigr).

Toto je vzorec pro takzvaný redukovaný (neboli marginální) probabilistický stav samotného X.\mathsf{X}.

Tento vzorec dává na intuitivní úrovni dokonalý smysl v tom smyslu, že by se muselo stát něco velmi podivného, aby byl nesprávný. Kdyby byl nesprávný, znamenalo by to, že měření Y\mathsf{Y} by mohlo nějak ovlivnit pravděpodobnosti spojené s různými výsledky měření X,\mathsf{X}, bez ohledu na skutečný výsledek měření Y.\mathsf{Y}. Kdyby se Y\mathsf{Y} nacházel ve vzdáleném místě, třeba někde v jiné galaxii, umožňovalo by to signalizaci rychlejší než světlo — což odmítáme na základě našeho chápání fyziky. Další způsob, jak tomu porozumět, vychází z interpretace pravděpodobnosti jako odrazu míry přesvědčení. Samotný fakt, že by se někdo jiný mohl rozhodnout podívat na Y,\mathsf{Y}, nemůže změnit klasický stav X,\mathsf{X}, takže bez jakékoliv informace o tom, co viděli nebo neviděli, by se naše přesvědčení o stavu X\mathsf{X} nemělo v důsledku toho měnit.

Nyní, za předpokladu, že je měřeno pouze X\mathsf{X} a Y\mathsf{Y} nikoliv, může stále existovat nejistota ohledně klasického stavu Y.\mathsf{Y}. Z tohoto důvodu, místo aktualizace našeho popisu probabilistického stavu (X,Y)(\mathsf{X},\mathsf{Y}) na ab\vert ab\rangle pro nějakou volbu aΣa\in\Sigma a bΓ,b\in\Gamma, musíme aktualizovat náš popis tak, aby tato nejistota ohledně Y\mathsf{Y} byla správně zachycena.

Následující vzorec podmíněné pravděpodobnosti tuto nejistotu zachycuje.

Pr(Y=bX=a)=Pr((X,Y)=(a,b))Pr(X=a) \operatorname{Pr}(\mathsf{Y} = b \,\vert\, \mathsf{X} = a) = \frac{ \operatorname{Pr}\bigl((\mathsf{X},\mathsf{Y}) = (a,b)\bigr) }{ \operatorname{Pr}(\mathsf{X} = a) }

Zde výraz Pr(Y=bX=a)\operatorname{Pr}(\mathsf{Y} = b \,\vert\, \mathsf{X} = a) označuje pravděpodobnost, že Y=b\mathsf{Y} = b podmíněnou (neboli za předpokladu, že) X=a.\mathsf{X} = a. Technicky vzato má tento výraz smysl pouze pokud je Pr(X=a)\operatorname{Pr}(\mathsf{X}=a) nenulová, protože pokud Pr(X=a)=0,\operatorname{Pr}(\mathsf{X}=a) = 0, pak dělíme nulou a dostaneme neurčitý výraz 00.\frac{0}{0}. To ale není problém, protože pokud je pravděpodobnost spojená s aa nulová, pak aa nikdy nezískáme jako výsledek měření X,\mathsf{X}, a nemusíme se touto možností znepokojovat.

Pro vyjádření těchto vzorců pomocí vektorů pravděpodobnosti uvažujme vektor pravděpodobnosti π\vert \pi \rangle popisující společný probabilistický stav (X,Y).(\mathsf{X},\mathsf{Y}).

π=(a,b)Σ×Γpabab \vert\pi\rangle = \sum_{(a,b)\in\Sigma\times\Gamma} p_{ab} \vert ab\rangle

Měřením samotného X\mathsf{X} získáme každý možný výsledek aΣa\in\Sigma s pravděpodobností

Pr(X=a)=cΓpac. \operatorname{Pr}(\mathsf{X} = a) = \sum_{c\in\Gamma} p_{ac}.

Vektor reprezentující probabilistický stav samotného X\mathsf{X} je tedy dán

aΣ(cΓpac)a. \sum_{a\in\Sigma} \biggl(\sum_{c\in\Gamma} p_{ac}\biggr) \vert a\rangle.

Po získání konkrétního výsledku aΣa\in\Sigma z měření X\mathsf{X} se probabilistický stav Y\mathsf{Y} aktualizuje podle vzorce pro podmíněné pravděpodobnosti, takže je reprezentován tímto vektorem pravděpodobnosti:

ψa=bΓpabbcΓpac. \vert \psi_a \rangle = \frac{\sum_{b\in\Gamma}p_{ab}\vert b\rangle}{\sum_{c\in\Gamma} p_{ac}}.

V případě, že měření X\mathsf{X} vedlo ke klasickému stavu a,a, aktualizujeme tedy náš popis probabilistického stavu společného systému (X,Y)(\mathsf{X},\mathsf{Y}) na aψa.\vert a\rangle \otimes \vert\psi_a\rangle.

Jeden způsob, jak přemýšlet o této definici ψa,\vert\psi_a\rangle, je vidět ji jako normalizaci vektoru bΓpabb,\sum_{b\in\Gamma} p_{ab} \vert b\rangle, kde dělíme součtem složek tohoto vektoru, abychom získali vektor pravděpodobnosti. Tato normalizace efektivně zohledňuje podmínění na událost, že měření X\mathsf{X} vedlo k výsledku a.a.

Pro konkrétní příklad předpokládejme, že množina klasických stavů X\mathsf{X} je Σ={0,1},\Sigma = \{0,1\}, množina klasických stavů Y\mathsf{Y} je Γ={1,2,3},\Gamma = \{1,2,3\}, a probabilistický stav (X,Y)(\mathsf{X},\mathsf{Y}) je

π=120,1+1120,3+1121,1+161,2+161,3. \vert \pi \rangle = \frac{1}{2} \vert 0,1 \rangle + \frac{1}{12} \vert 0,3 \rangle + \frac{1}{12} \vert 1,1 \rangle + \frac{1}{6} \vert 1,2 \rangle + \frac{1}{6} \vert 1,3 \rangle.

Naším cílem bude určit pravděpodobnosti dvou možných výsledků (00 a 11) a vypočítat, jaký bude výsledný probabilistický stav Y\mathsf{Y} pro oba výsledky, za předpokladu, že je měřen systém X.\mathsf{X}.

Pomocí bilinearity tenzorového součinu, a konkrétně skutečnosti, že je lineární v druhém argumentu, můžeme přepsat vektor π\vert \pi \rangle následovně:

π=0(121+1123)+1(1121+162+163). \vert \pi \rangle = \vert 0\rangle \otimes \biggl( \frac{1}{2} \vert 1 \rangle + \frac{1}{12} \vert 3 \rangle\biggr) + \vert 1\rangle \otimes \biggl( \frac{1}{12} \vert 1 \rangle + \frac{1}{6} \vert 2\rangle + \frac{1}{6} \vert 3 \rangle\biggr).

Slovy řečeno, to co jsme udělali, je izolování jednotlivých standardních bázových vektorů pro první systém (tedy ten, který se měří), přičemž každý je tensorizován s lineární kombinací standardních bázových vektorů druhého systému, kterou získáme výběrem těch složek původního vektoru, které odpovídají příslušnému klasickému stavu prvního systému. Krátké zamyšlení odhalí, že to je vždy možné, bez ohledu na to, s jakým vektorem jsme začali.

Když jsme takto vyjádřili náš vektor pravděpodobnosti, efekty měření prvního systému se snadno analyzují. Pravděpodobnosti obou výsledků lze získat sečtením pravděpodobností v závorkách.

Pr(X=0)=12+112=712Pr(X=1)=112+16+16=512 \begin{aligned} \operatorname{Pr}(\mathsf{X} = 0) & = \frac{1}{2} + \frac{1}{12} = \frac{7}{12}\\[3mm] \operatorname{Pr}(\mathsf{X} = 1) & = \frac{1}{12} + \frac{1}{6} + \frac{1}{6} = \frac{5}{12} \end{aligned}

Tyto pravděpodobnosti dávají v součtu jedničku, jak se očekává — ale to je užitečná kontrola našich výpočtů.

A nyní lze probabilistický stav Y\mathsf{Y} podmíněný každým možným výsledkem odvodit normalizací vektorů v závorkách. To znamená, že tyto vektory vydělíme příslušnými pravděpodobnostmi, které jsme právě vypočítali, aby se staly vektory pravděpodobnosti.

Tedy, podmíněno tím, že X\mathsf{X} je 0,0, probabilistický stav Y\mathsf{Y} se stane

121+1123712=671+173, \frac{\frac{1}{2} \vert 1 \rangle + \frac{1}{12} \vert 3 \rangle}{\frac{7}{12}} = \frac{6}{7} \vert 1 \rangle + \frac{1}{7} \vert 3 \rangle,

a podmíněno tím, že měření X\mathsf{X} je 1,1, probabilistický stav Y\mathsf{Y} se stane

1121+162+163512=151+252+253. \frac{\frac{1}{12} \vert 1 \rangle + \frac{1}{6} \vert 2\rangle + \frac{1}{6} \vert 3 \rangle}{\frac{5}{12}} = \frac{1}{5} \vert 1 \rangle + \frac{2}{5} \vert 2 \rangle + \frac{2}{5} \vert 3 \rangle.

Operace na probabilistických stavech

Na závěr této diskuze o klasické informaci pro více systémů budeme uvažovat operace na více systémech v probabilistických stavech. Stejnou myšlenkou jako předtím můžeme na více systémů nahlížet kolektivně jako na jednotlivé složené systémy a pak se podívat do předchozí lekce, jak to funguje.

Vraťme se k typickému nastavení, kde máme dva systémy X\mathsf{X} a Y,\mathsf{Y}, a uvažujme klasické operace na složeném systému (X,Y).(\mathsf{X},\mathsf{Y}). Na základě předchozí lekce a výše uvedené diskuse docházíme k závěru, že jakákoliv taková operace je reprezentována stochastickou maticí, jejíž řádky a sloupce jsou indexovány kartézským součinem Σ×Γ.\Sigma\times\Gamma.

Předpokládejme například, že X\mathsf{X} a Y\mathsf{Y} jsou bity, a uvažujme operaci s následujícím popisem.

Operace

Pokud X=1,\mathsf{X} = 1, proveď operaci NOT na Y.\mathsf{Y}.
Jinak nedělej nic.

Toto je deterministická operace známá jako řízená operace NOT (controlled-NOT), kde X\mathsf{X} je řídicí bit, který určuje, zda se má na cílový bit Y\mathsf{Y} aplikovat operace NOT, nebo ne. Zde je maticová reprezentace této operace:

(1000010000010010).\begin{pmatrix} 1 & 0 & 0 & 0\\[2mm] 0 & 1 & 0 & 0\\[2mm] 0 & 0 & 0 & 1\\[2mm] 0 & 0 & 1 & 0 \end{pmatrix}.

Její působení na standardní bázové stavy je následující.

0000010110111110\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\ \vert 01 \rangle & \mapsto \vert 01 \rangle\\ \vert 10 \rangle & \mapsto \vert 11 \rangle\\ \vert 11 \rangle & \mapsto \vert 10 \rangle \end{aligned}

Pokud bychom vyměnili role X\mathsf{X} a Y\mathsf{Y} tak, že Y\mathsf{Y} by byl řídicí bit a X\mathsf{X} cílový bit, pak by maticová reprezentace operace vypadala takto

(1000000100100100)\begin{pmatrix} 1 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 1\\[2mm] 0 & 0 & 1 & 0\\[2mm] 0 & 1 & 0 & 0 \end{pmatrix}

a její působení na standardní bázové stavy by bylo následující:

0000011110101101\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\ \vert 01 \rangle & \mapsto \vert 11 \rangle\\ \vert 10 \rangle & \mapsto \vert 10 \rangle\\ \vert 11 \rangle & \mapsto \vert 01 \rangle \end{aligned}

Dalším příkladem je operace s tímto popisem:

Operace

Proveď jednu z následujících dvou operací, každou s pravděpodobností 1/2:1/2:

  1. Nastav Y\mathsf{Y} na hodnotu rovnou X.\mathsf{X}.
  2. Nastav X\mathsf{X} na hodnotu rovnou Y.\mathsf{Y}.

Maticová reprezentace této operace je následující:

(11212000000000012121)=12(1100000000000011)+12(1010000000000101).\begin{pmatrix} 1 & \frac{1}{2} & \frac{1}{2} & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & \frac{1}{2} & \frac{1}{2} & 1 \end{pmatrix} = \frac{1}{2} \begin{pmatrix} 1 & 1 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 1 & 1 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 1 & 0 & 1 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 1 & 0 & 1 \end{pmatrix}.

Působení této operace na standardní bázové vektory je následující:

0000011200+1211101200+12111111\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\[1mm] \vert 01 \rangle & \mapsto \frac{1}{2} \vert 00 \rangle + \frac{1}{2}\vert 11\rangle\\[3mm] \vert 10 \rangle & \mapsto \frac{1}{2} \vert 00 \rangle + \frac{1}{2}\vert 11\rangle\\[2mm] \vert 11 \rangle & \mapsto \vert 11 \rangle \end{aligned}

V těchto příkladech se jednoduše díváme na dva systémy dohromady jako na jeden systém a postupujeme stejně jako v předchozí lekci.

Totéž lze provést pro libovolný počet systémů. Představ si například, že máme tři bity a inkrementujeme je modulo 88 — což znamená, že na tři bity nahlížíme jako na zakódování čísla mezi 00 a 77 v binárním zápisu, přičteme 11 a pak vezmeme zbytek po dělení 8.8. Jeden způsob, jak tuto operaci vyjádřit, je takto:

001000+010001+011010+100011+101100+110101+111110+000111.\begin{aligned} & \vert 001 \rangle \langle 000 \vert + \vert 010 \rangle \langle 001 \vert + \vert 011 \rangle \langle 010 \vert + \vert 100 \rangle \langle 011 \vert\\[1mm] & \quad + \vert 101 \rangle \langle 100 \vert + \vert 110 \rangle \langle 101 \vert + \vert 111 \rangle \langle 110 \vert + \vert 000 \rangle \langle 111 \vert. \end{aligned}

Další způsob, jak ji vyjádřit, je

k=07(k+1)mod8k,\sum_{k = 0}^{7} \vert (k+1) \bmod 8 \rangle \langle k \vert,

za předpokladu, že jsme se dohodli, že čísla od 00 do 77 uvnitř ketů odkazují na tříbitové binární kódování těchto čísel. Třetí možností je vyjádřit tuto operaci jako matici.

(0000000110000000010000000010000000010000000010000000010000000010)\begin{pmatrix} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1\\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \end{pmatrix}

Nezávislé operace

Nyní předpokládejme, že máme více systémů a nezávisle provádíme různé operace na jednotlivých systémech zvlášť.

Vezměme si například naše obvyklé nastavení dvou systémů X\mathsf{X} a Y\mathsf{Y} s množinami klasických stavů Σ\Sigma a Γ\Gamma a předpokládejme, že provedeme jednu operaci na X\mathsf{X} a zcela nezávisle jinou operaci na Y.\mathsf{Y}. Jak víme z předchozí lekce, tyto operace jsou reprezentovány stochastickými maticemi — a abychom byli přesní, řekněme, že operace na X\mathsf{X} je reprezentována maticí MM a operace na Y\mathsf{Y} je reprezentována maticí N.N. Řádky a sloupce matice MM tedy mají indexy, které odpovídají prvkům Σ,\Sigma, a obdobně řádky a sloupce matice NN odpovídají prvkům Γ.\Gamma.

Přirozená otázka zní: pokud se na X\mathsf{X} a Y\mathsf{Y} díváme společně jako na jeden složený systém (X,Y),(\mathsf{X},\mathsf{Y}), jaká matice reprezentuje kombinované působení obou operací na tento složený systém? K zodpovězení této otázky musíme nejprve zavést tenzorové součiny matic, které jsou podobné tenzorovým součinům vektorů a jsou definovány analogicky.

Tenzorové součiny matic

Tenzorový součin MNM\otimes N matic

M=a,bΣαabab M = \sum_{a,b\in\Sigma} \alpha_{ab} \vert a\rangle \langle b\vert

a

N=c,dΓβcdcd N = \sum_{c,d\in\Gamma} \beta_{cd} \vert c\rangle \langle d\vert

je matice

MN=a,bΣc,dΓαabβcdacbd M \otimes N = \sum_{a,b\in\Sigma} \sum_{c,d\in\Gamma} \alpha_{ab} \beta_{cd} \vert ac \rangle \langle bd \vert

Ekvivalentne je tenzorovy soucin MM a NN definovan rovnici

acMNbd=aMbcNd\langle ac \vert M \otimes N \vert bd\rangle = \langle a \vert M \vert b\rangle \langle c \vert N \vert d\rangle

ktera plati pro kazdou volbu a,bΣa,b\in\Sigma a c,dΓ.c,d\in\Gamma.

Alternativni, ale ekvivalentni zpusob popisu MNM\otimes N je, ze jde o jedinou matici splnujici rovnici

(MN)(ϕψ)=(Mϕ)(Nψ) (M \otimes N) \bigl( \vert \phi \rangle \otimes \vert \psi \rangle \bigr) = \bigl(M \vert\phi\rangle\bigr) \otimes \bigl(N \vert\psi\rangle\bigr)

pro kazdou moznou volbu vektoru ϕ\vert\phi\rangle a ψ,\vert\psi\rangle, za predpokladu, ze indexy ϕ\vert\phi\rangle odpovidaji prvkum Σ\Sigma a indexy ψ\vert\psi\rangle odpovidaji Γ.\Gamma.

Podle drive popsane konvence pro razeni prvku kartezskych soucinu muzeme tenzorovy soucin dvou matic zapsat explicitne takto:

(α11α1mαm1αmm)(β11β1kβk1βkk)=(α11β11α11β1kα1mβ11α1mβ1kα11βk1α11βkkα1mβk1α1mβkkαm1β11αm1β1kαmmβ11αmmβ1kαm1βk1αm1βkkαmmβk1αmmβkk)\begin{gathered} \begin{pmatrix} \alpha_{11} & \cdots & \alpha_{1m} \\ \vdots & \ddots & \vdots \\ \alpha_{m1} & \cdots & \alpha_{mm} \end{pmatrix} \otimes \begin{pmatrix} \beta_{11} & \cdots & \beta_{1k} \\ \vdots & \ddots & \vdots\\ \beta_{k1} & \cdots & \beta_{kk} \end{pmatrix} \hspace{6cm}\\[8mm] \hspace{1cm} = \begin{pmatrix} \alpha_{11}\beta_{11} & \cdots & \alpha_{11}\beta_{1k} & & \alpha_{1m}\beta_{11} & \cdots & \alpha_{1m}\beta_{1k} \\ \vdots & \ddots & \vdots & \hspace{2mm}\cdots\hspace{2mm} & \vdots & \ddots & \vdots \\ \alpha_{11}\beta_{k1} & \cdots & \alpha_{11}\beta_{kk} & & \alpha_{1m}\beta_{k1} & \cdots & \alpha_{1m}\beta_{kk} \\[2mm] & \vdots & & \ddots & & \vdots & \\[2mm] \alpha_{m1}\beta_{11} & \cdots & \alpha_{m1}\beta_{1k} & & \alpha_{mm}\beta_{11} & \cdots & \alpha_{mm}\beta_{1k} \\ \vdots & \ddots & \vdots & \hspace{2mm}\cdots\hspace{2mm} & \vdots & \ddots & \vdots \\ \alpha_{m1}\beta_{k1} & \cdots & \alpha_{m1}\beta_{kk} & & \alpha_{mm}\beta_{k1} & \cdots & \alpha_{mm}\beta_{kk} \end{pmatrix} \end{gathered}

Tenzorove souciny tri a vice matic se definuji analogickym zpusobem. Pokud M0,,Mn1M_0, \ldots, M_{n-1} jsou matice, jejichz indexy odpovidaji mnozinam klasickych stavu Σ0,,Σn1,\Sigma_0,\ldots,\Sigma_{n-1}, pak je tenzorovy soucin Mn1M0M_{n-1}\otimes\cdots\otimes M_0 definovan podminkou

an1a0Mn1M0bn1b0=an1Mn1bn1a0M0b0\langle a_{n-1}\cdots a_0 \vert M_{n-1}\otimes\cdots\otimes M_0 \vert b_{n-1}\cdots b_0\rangle = \langle a_{n-1} \vert M_{n-1} \vert b_{n-1} \rangle \cdots\langle a_0 \vert M_0 \vert b_0 \rangle

pro kazdou volbu klasickych stavu a0,b0Σ0,,an1,bn1Σn1.a_0,b_0\in\Sigma_0,\ldots,a_{n-1},b_{n-1}\in\Sigma_{n-1}. Alternativne lze tenzorove souciny tri a vice matic definovat rekurzivne pomoci tenzorovych soucinu dvou matic, podobne jako jsme to videli u vektoru.

O tenzorovem soucinu matic se nekdy rika, ze je multiplikativni, protoze rovnice

(Mn1M0)(Nn1N0)=(Mn1Nn1)(M0N0) (M_{n-1}\otimes\cdots\otimes M_0)(N_{n-1}\otimes\cdots\otimes N_0) = (M_{n-1} N_{n-1})\otimes\cdots\otimes (M_0 N_0)

plati vzdy, pro jakoukoli volbu matic M0,,Mn1M_0,\ldots,M_{n-1} a N0,Nn1,N_0\ldots,N_{n-1}, za predpokladu, ze souciny M0N0,,Mn1Nn1M_0 N_0, \ldots, M_{n-1} N_{n-1} davaji smysl.

Nezavisle operace (pokracovani)

Nyni muzeme odpovedet na drive polozenou otazku: pokud MM je pravdepodobnostni operace na X,\mathsf{X}, NN je pravdepodobnostni operace na Y\mathsf{Y} a obe operace se provadeji nezavisle, pak vysledna operace na slozenem systemu (X,Y)(\mathsf{X},\mathsf{Y}) je tenzorovy soucin MN.M\otimes N.

Takze jak pro pravdepodobnostni stavy, tak pro pravdepodobnostni operace plati, ze tenzorove souciny reprezentuji nezavislost. Pokud mame dva systemy X\mathsf{X} a Y,\mathsf{Y}, ktere jsou nezavisle v pravdepodobnostnich stavech ϕ\vert\phi\rangle a ψ,\vert\psi\rangle, pak slozeny system (X,Y)(\mathsf{X},\mathsf{Y}) je v pravdepodobnostnim stavu ϕψ;\vert\phi\rangle\otimes\vert\psi\rangle; a pokud na oba systemy nezavisle aplikujeme pravdepodobnostni operace MM a N,N, pak vysledna akce na slozenem systemu (X,Y)(\mathsf{X},\mathsf{Y}) je popsana operaci MN.M\otimes N.

Podivejme se na priklad, ktery pripomina pravdepodobnostni operaci na jednom bitu z predchozi lekce: pokud je klasicky stav bitu 0,0, necha se beze zmeny; a pokud je klasicky stav bitu 1,1, prevraci se na 0 s pravdepodobnosti 1/2.1/2. Zjistili jsme, ze tato operace je reprezentovana matici

(112012). \begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix}.

Pokud se tato operace provede na bitu X\mathsf{X} a (nezavisle) se provede operace NOT na druhem bitu Y,\mathsf{Y}, pak spolecna operace na slozenem systemu (X,Y)(\mathsf{X},\mathsf{Y}) ma maticovou reprezentaci

(112012)(0110)=(01012101200001200120). \begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix} \otimes \begin{pmatrix} 0 & 1\\[1mm] 1 & 0 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 0 & \frac{1}{2} \\[1mm] 1 & 0 & \frac{1}{2} & 0 \\[1mm] 0 & 0 & 0 & \frac{1}{2} \\[1mm] 0 & 0 & \frac{1}{2} & 0 \end{pmatrix}.

Pri blizsi kontrole vidime, ze jde o stochastickou matici. To bude platit vzdy: tenzorovy soucin dvou nebo vice stochastickych matic je vzdy stochasticky.

Casta situace, se kterou se setkavame, je takova, ze se provede jedna operace na jednom systemu a s druhym se nedela nic. V takovem pripade se postupuje uplne stejne, pricemz je treba mit na pameti, ze nedelani niceho je reprezentovano jednotkovou matici. Napriklad resetovani bitu X\mathsf{X} do stavu 00 a nedelani niceho s Y\mathsf{Y} dava pravdepodobnostni (a vlastne deterministickou) operaci na (X,Y)(\mathsf{X},\mathsf{Y}) reprezentovanou matici

(1100)(1001)=(1010010100000000). \begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix} \otimes \begin{pmatrix} 1 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 & 1 & 0 \\[1mm] 0 & 1 & 0 & 1 \\[1mm] 0 & 0 & 0 & 0 \\[1mm] 0 & 0 & 0 & 0 \end{pmatrix}.