Klasická informace
Stejně jako v předchozí lekci začneme i tuto lekci diskuzí o klasické informaci. Probabilistický a kvantový popis jsou opět matematicky podobné a pochopení toho, jak matematika funguje ve známém prostředí klasické informace, ti pomůže pochopit, proč je kvantová informace popisována právě tak, jak je.
Klasické stavy pomocí kartézského součinu
Začneme na velmi základní úrovni, klasickými stavy více systémů. Pro jednoduchost začneme diskuzí pouze o dvou systémech a poté zobecníme na více než dva systémy.
Přesněji řečeno, nechť je systém, jehož množina klasických stavů je a nechť je druhý systém, jehož množina klasických stavů je Všimni si, že protože jsme tyto množiny označili jako množiny klasických stavů, předpokládáme, že i jsou konečné a neprázdné. Může platit ale nemusí — a v každém případě bude pro přehlednost užitečné používat pro tyto množiny různá jména.
Nyní si představ, že dva systémy, a jsou umístěny vedle sebe, s vlevo a vpravo. Pokud chceme, můžeme tyto dva systémy chápat, jako by tvořily jediný systém, který můžeme označit nebo podle naší preference. Přirozená otázka ohledně tohoto složeného systému zní: „Jaké jsou jeho klasické stavy?"
Odpověď je, že množina klasických stavů je kartézský součin a což je množina definovaná jako
Jednoduše řečeno, kartézský součin je přesně ten matematický pojem, který zachycuje myšlenku nahlížení na prvek jedné množiny a prvek druhé množiny dohromady, jako by tvořily jediný prvek jediné množiny. V daném případě říci, že je v klasickém stavu znamená, že je v klasickém stavu a je v klasickém stavu a pokud je klasický stav roven a klasický stav roven pak klasický stav společného systému je
Pro více než dva systémy se situace přirozeně zobecňuje. Předpokládejme, že jsou systémy s množinami klasických stavů pro libovolné kladné celé číslo Množina klasických stavů -tice chápané jako jediný společný systém, je kartézský součin
Samozřejmě můžeme systémy pojmenovat, jak chceme, a uspořádat je, jak se nám zlíbí. Zejména pokud máme systémů jako výše, mohli bychom je místo toho pojmenovat a uspořádat je zprava doleva, takže společný systém se stane Při dodržení stejného vzoru pro pojmenování příslušných klasických stavů a množin klasických stavů bychom pak mohli odkazovat na klasický stav
tohoto složeného systému. Právě tuto konvenci uspořádání používá Qiskit při pojmenovávání více Qubitů. K této konvenci a jejímu spojení s kvantovými Circuit se vrátíme v další lekci, ale začneme ji používat už teď, aby sis na ni zvykl.
Je často výhodné zapisovat klasický stav tvaru jako řetězec pro stručnost, zejména ve velmi typické situaci, kdy jsou množiny klasických stavů spojeny s množinami symbolů nebo znaků. V tomto kontextu se termín abeceda běžně používá pro množiny symbolů, ze kterých se tvoří řetězce, ale matematická definice abecedy je přesně stejná jako definice množiny klasických stavů: je to konečná a neprázdná množina.
Předpokládejme například, že jsou bity, takže množiny klasických stavů těchto systémů jsou všechny stejné.
Pak existuje klasických stavů společného systému což jsou prvky množiny
Zapsány jako řetězce vypadají tyto klasické stavy takto:
Pro klasický stav například vidíme, že a jsou ve stavu zatímco všechny ostatní systémy jsou ve stavu
Probabilistické stavy
Připomeň si z předchozí lekce, že probabilistický stav přiřazuje pravděpodobnost každému klasickému stavu systému. Probabilistický stav více systémů — chápaných souhrnně jako jediný systém — tedy přiřazuje pravděpodobnost každému prvku kartézského součinu množin klasických stavů jednotlivých systémů.
Předpokládejme například, že a jsou oba bity, takže jejich odpovídající množiny klasických stavů jsou a Zde je probabilistický stav páru
Tento probabilistický stav je takový, v němž i jsou náhodné bity — každý je s pravděpodobností a s pravděpodobností — ale klasické stavy obou bitů se vždy shodují. Toto je příklad korelace mezi těmito systémy.
Uspořádání množin stavů kartézského součinu
Probabilistické stavy systémů mohou být reprezentovány vektory pravděpodobností, jak bylo diskutováno v předchozí lekci. Konkrétně složky vektoru představují pravděpodobnosti, že systém bude v možných klasických stavech daného systému, a rozumí se, že byla zvolena korespondence mezi složkami a množinou klasických stavů.
Zvolení takové korespondence efektivně znamená rozhodnutí o uspořádání klasických stavů, které je často přirozené nebo určené standardní konvencí. Například binární abeceda je přirozeně uspořádána s na prvním místě a na druhém, takže první složka vektoru pravděpodobností reprezentujícího probabilistický stav bitu je pravděpodobnost, že je ve stavu a druhá složka je pravděpodobnost, že je ve stavu
V kontextu více systémů se na tom nic nemění, ale je třeba se rozhodnout. Množina klasických stavů více systémů dohromady, chápaných souhrnně jako jediný systém, je kartézský součin množin klasických stavů jednotlivých systémů — takže musíme rozhodnout, jak budou prvky kartézských součinů množin klasických stavů uspořádány.
Existuje jednoduchá konvence, kterou pro to dodržujeme, a tou je začít s jakýmkoli uspořádáním, které je už zavedeno pro jednotlivé množiny klasických stavů, a pak uspořádat prvky kartézského součinu abecedně. Jinak řečeno, složky v každé -tici (nebo ekvivalentně symboly v každém řetězci) se chovají, jako by měly význam, který klesá zleva doprava. Například podle této konvence je kartézský součin uspořádán takto:
Když jsou -tice zapsány jako řetězce a uspořádány tímto způsobem, pozorujeme známé vzory, jako je uspořádané jako a množina uspořádaná tak, jak byla zapsána dříve v této lekci. Jako další příklad, chápeme-li množinu jako množinu řetězců, získáme dvojciferná čísla až uspořádaná numericky. To samozřejmě není náhoda; náš desítkový číselný systém používá přesně tento druh abecedního uspořádání, kde slovo abecední je třeba chápat v širokém smyslu, který zahrnuje kromě písmen i číslice.
Vrátíme-li se k výše uvedenému příkladu dvou bitů, dříve popsaný probabilistický stav je tedy reprezentován následujícím vektorem pravděpodobností, kde jsou složky pro přehlednost explicitně označeny.
Nezávislost dvou systémů
Speciálním typem probabilistického stavu dvou systémů je stav, v němž jsou systémy nezávislé. Intuitivně řečeno, dva systémy jsou nezávislé, pokud zjištění klasického stavu jednoho systému nemá žádný vliv na pravděpodobnosti spojené s druhým systémem. To znamená, že zjištění, v jakém klasickém stavu se jeden ze systémů nachází, neposkytuje vůbec žádnou informaci o klasickém stavu druhého systému.
Pro přesnou definici tohoto pojmu předpokládejme opět, že a jsou systémy s množinami klasických stavů a Vzhledem k danému probabilistickému stavu těchto systémů se říká, že jsou nezávislé, pokud platí
pro každou volbu a
Pro vyjádření této podmínky pomocí vektorů pravděpodobností předpokládejme, že daný probabilistický stav je popsán vektorem pravděpodobností, zapsaným v Diracově notaci jako
Podmínka pro nezávislost je pak ekvivalentní existenci dvou vektorů pravděpodobností
reprezentující pravděpodobnosti přiřazené klasickým stavům a takové, že
pro všechna a
Například pravděpodobnostní stav dvojice bitů reprezentovaný vektorem
je takový, ve kterém jsou a nezávislé. Konkrétně je podmínka požadovaná pro nezávislost splněna pro pravděpodobnostní vektory
Například abychom ověřili shodu pravděpodobností pro stav potřebujeme a to skutečně platí. Ostatní položky lze ověřit obdobným způsobem.
Na druhou stranu pravděpodobnostní stav který můžeme zapsat jako
nepředstavuje nezávislost mezi systémy a Jednoduchý způsob, jak to zdůvodnit, je následující.
Předpokládejme, že by existovaly pravděpodobnostní vektory a jako v rovnici výše, pro které je podmínka splněna pro každou volbu a Pak by nutně muselo platit
To znamená, že buď nebo protože kdyby obojí bylo nenulové, součin by také byl nenulový. To vede k závěru, že buď (v případě ), nebo (v případě ). Vidíme však, že ani jedna z těchto rovností nemůže platit, protože musí být a Neexistují tedy vektory a splňující vlastnost požadovanou pro nezávislost.
Po definování nezávislosti dvou systémů nyní můžeme definovat, co se rozumí korelací: je to nedostatek nezávislosti. Například proto, že dva bity v pravděpodobnostním stavu reprezentovaném vektorem nejsou nezávislé, jsou podle definice korelované.
Tenzorové součiny vektorů
Podmínku nezávislosti, kterou jsme právě popsali, lze stručně vyjádřit pomocí pojmu tenzorový součin. Přestože tenzorové součiny jsou velmi obecný pojem a lze je definovat poměrně abstraktně a aplikovat na různé matematické struktury, v daném případě můžeme přijmout jednoduchou a konkrétní definici.
Jsou-li dány dva vektory
tenzorový součin je vektor definovaný jako
Složky tohoto nového vektoru odpovídají prvkům kartézského součinu které jsou v předchozí rovnici zapsány jako řetězce. Ekvivalentně je vektor definován rovnicí
platící pro každé a
Nyní můžeme přeformulovat podmínku nezávislosti: pro společný systém v pravděpodobnostním stavu reprezentovaném pravděpodobnostním vektorem jsou systémy a nezávislé, pokud vznikne tenzorovým součinem
pravděpodobnostních vektorů a na každém z podsystémů a V této situaci se o říká, že je to produktový stav nebo produktový vektor.
Často vynecháváme symbol při tvoření tenzorového součinu ketů, takže píšeme místo Tato konvence vyjadřuje myšlenku, že tenzorový součin je v tomto kontextu nejpřirozenějším či výchozím způsobem, jak násobit dva vektory. I když je to méně obvyklé, někdy se také používá zápis .
Když použijeme abecední konvenci pro uspořádání prvků kartézských součinů, získáme následující specifikaci tenzorového součinu dvou sloupcových vektorů.
Jako důležitou poznámku si všimni následujícího výrazu pro tenzorové součiny vektorů standardní báze:
Alternativně bychom mohli zapsat jako uspořádanou dvojici místo řetězce, čímž bychom dostali Je však běžnější v této situaci závorky vynechat a psát místo toho To je v matematice obecně typické; závorky, které nepřidávají srozumitelnost ani neodstraňují nejednoznačnost, se často jednoduše vynechávají.
Tenzorový součin dvou vektorů má důležitou vlastnost, že je bilineární, což znamená, že je lineární v každém ze dvou argumentů zvlášť za předpokladu, že druhý argument je pevný. Tuto vlastnost lze vyjádřit těmito rovnicemi:
1. Linearita v prvním argumentu:
2. Linearita v druhém argumentu:
Podíváme-li se na druhou rovnici v každém z těchto párů rovnic, vidíme, že skaláry se v tenzorových součinech „pohybují volně":
Proto neexistuje žádná nejednoznačnost v prostém zápisu případně nebo pro odkaz na tento vektor.
Nezávislost a tenzorové součiny pro tři a více systémů
Pojmy nezávislosti a tenzorových součinů se přímočaře zobecňují na tři a více systémů. Pokud jsou systémy s množinami klasických stavů pak pravděpodobnostní stav složeného systému je produktový stav, pokud přiřazený pravděpodobnostní vektor má tvar
pro pravděpodobnostní vektory popisující pravděpodobnostní stavy
je definován rovnicí
platící pro každé
Jiný, ale ekvivalentní způsob, jak definovat tenzorový součin tří nebo více vektorů, je rekurzivně pomocí tenzorových součinů dvou vektorů:
Podobně jako u tenzorového součinu pouze dvou vektorů je tenzorový součin tří nebo více vektorů lineární v každém z argumentů jednotlivě, za předpokladu, že všechny ostatní argumenty jsou fixovány. V tomto případě se říká, že tenzorový součin tří nebo více vektorů je multilineární.
Stejně jako v případě dvou systémů bychom mohli říci, že systémy jsou nezávislé, když jsou v produktovém stavu, ale přesnější je termín vzájemně nezávislé. Existují i jiné pojmy nezávislosti pro tři nebo více systémů, jako je párová nezávislost, které jsou zajímavé i důležité — ale ne v kontextu tohoto kurzu.
Zobecněním dřívějšího pozorování o tenzorových součinech standardních bázových vektorů platí, že pro libovolné kladné celé číslo a libovolné klasické stavy máme
Měření probabilistických stavů
Nyní přejděme k měřením probabilistických stavů více systémů. Tím, že jsme se rozhodli nahlížet na více systémů společně jako na jediné systémy, okamžitě získáváme specifikaci toho, jak musí měření pro více systémů fungovat — za předpokladu, že se měří všechny systémy.
Například pokud je probabilistický stav dvou bitů popsán vektorem pravděpodobnosti
pak výsledek — tedy pro měření a pro měření — nastane s pravděpodobností a výsledek rovněž nastane s pravděpodobností V každém případě příslušně aktualizujeme popis vektoru pravděpodobnosti naší znalosti, takže probabilistický stav se stane nebo
Mohli bychom se ale rozhodnout měřit ne každý systém, ale pouze některé ze systémů. To povede k výsledku měření pro každý systém, který je měřen, a také (obecně) ovlivní naši znalost zbývajících systémů, které jsme neměřili.
Pro vysvětlení, jak to funguje, se zaměříme na případ dvou systémů, z nichž jeden je měřen. Obecnější situace — kdy se měří nějaká vlastní podmnožina tří nebo více systémů — se efektivně redukuje na případ dvou systémů, když nahlížíme na měřené systémy souhrnně, jako by tvořily jeden systém, a na neměřené systémy, jako by tvořily druhý systém.
Přesněji řečeno, předpokládejme, že a jsou systémy, jejichž množiny klasických stavů jsou a a že oba systémy dohromady jsou v nějakém probabilistickém stavu. Budeme uvažovat, co se stane, když měříme pouze a s neděláme nic. Situace, kdy je měřeno pouze a s se nic neděje, se řeší symetricky.
Zaprvé víme, že pravděpodobnost pozorování konkrétního klasického stavu při měření pouze musí být konzistentní s pravděpodobnostmi, které bychom získali za předpokladu, že by bylo měřeno i To znamená, že musí platit
Toto je vzorec pro takzvaný redukovaný (neboli marginální) probabilistický stav samotného
Tento vzorec dává na intuitivní úrovni dokonalý smysl v tom smyslu, že by se muselo stát něco velmi podivného, aby byl nesprávný. Kdyby byl nesprávný, znamenalo by to, že měření by mohlo nějak ovlivnit pravděpodobnosti spojené s různými výsledky měření bez ohledu na skutečný výsledek měření Kdyby se nacházel ve vzdáleném místě, třeba někde v jiné galaxii, umožňovalo by to signalizaci rychlejší než světlo — což odmítáme na základě našeho chápání fyziky. Další způsob, jak tomu porozumět, vychází z interpretace pravděpodobnosti jako odrazu míry přesvědčení. Samotný fakt, že by se někdo jiný mohl rozhodnout podívat na nemůže změnit klasický stav takže bez jakékoliv informace o tom, co viděli nebo neviděli, by se naše přesvědčení o stavu nemělo v důsledku toho měnit.
Nyní, za předpokladu, že je měřeno pouze a nikoliv, může stále existovat nejistota ohledně klasického stavu Z tohoto důvodu, místo aktualizace našeho popisu probabilistického stavu na pro nějakou volbu a musíme aktualizovat náš popis tak, aby tato nejistota ohledně byla správně zachycena.
Následující vzorec podmíněné pravděpodobnosti tuto nejistotu zachycuje.
Zde výraz označuje pravděpodobnost, že podmíněnou (neboli za předpokladu, že) Technicky vzato má tento výraz smysl pouze pokud je nenulová, protože pokud pak dělíme nulou a dostaneme neurčitý výraz To ale není problém, protože pokud je pravděpodobnost spojená s nulová, pak nikdy nezískáme jako výsledek měření a nemusíme se touto možností znepokojovat.
Pro vyjádření těchto vzorců pomocí vektorů pravděpodobnosti uvažujme vektor pravděpodobnosti popisující společný probabilistický stav
Měřením samotného získáme každý možný výsledek s pravděpodobností
Vektor reprezentující probabilistický stav samotného je tedy dán
Po získání konkrétního výsledku z měření se probabilistický stav aktualizuje podle vzorce pro podmíněné pravděpodobnosti, takže je reprezentován tímto vektorem pravděpodobnosti:
V případě, že měření vedlo ke klasickému stavu aktualizujeme tedy náš popis probabilistického stavu společného systému na
Jeden způsob, jak přemýšlet o této definici je vidět ji jako normalizaci vektoru kde dělíme součtem složek tohoto vektoru, abychom získali vektor pravděpodobnosti. Tato normalizace efektivně zohledňuje podmínění na událost, že měření vedlo k výsledku
Pro konkrétní příklad předpokládejme, že množina klasických stavů je množina klasických stavů je a probabilistický stav je
Naším cílem bude určit pravděpodobnosti dvou možných výsledků ( a ) a vypočítat, jaký bude výsledný probabilistický stav pro oba výsledky, za předpokladu, že je měřen systém
Pomocí bilinearity tenzorového součinu, a konkrétně skutečnosti, že je lineární v druhém argumentu, můžeme přepsat vektor následovně:
Slovy řečeno, to co jsme udělali, je izolování jednotlivých standardních bázových vektorů pro první systém (tedy ten, který se měří), přičemž každý je tensorizován s lineární kombinací standardních bázových vektorů druhého systému, kterou získáme výběrem těch složek původního vektoru, které odpovídají příslušnému klasickému stavu prvního systému. Krátké zamyšlení odhalí, že to je vždy možné, bez ohledu na to, s jakým vektorem jsme začali.
Když jsme takto vyjádřili náš vektor pravděpodobnosti, efekty měření prvního systému se snadno analyzují. Pravděpodobnosti obou výsledků lze získat sečtením pravděpodobností v závorkách.
Tyto pravděpodobnosti dávají v součtu jedničku, jak se očekává — ale to je užitečná kontrola našich výpočtů.
A nyní lze probabilistický stav podmíněný každým možným výsledkem odvodit normalizací vektorů v závorkách. To znamená, že tyto vektory vydělíme příslušnými pravděpodobnostmi, které jsme právě vypočítali, aby se staly vektory pravděpodobnosti.
Tedy, podmíněno tím, že je probabilistický stav se stane
a podmíněno tím, že měření je probabilistický stav se stane
Operace na probabilistických stavech
Na závěr této diskuze o klasické informaci pro více systémů budeme uvažovat operace na více systémech v probabilistických stavech. Stejnou myšlenkou jako předtím můžeme na více systémů nahlížet kolektivně jako na jednotlivé složené systémy a pak se podívat do předchozí lekce, jak to funguje.
Vraťme se k typickému nastavení, kde máme dva systémy a a uvažujme klasické operace na složeném systému Na základě předchozí lekce a výše uvedené diskuse docházíme k závěru, že jakákoliv taková operace je reprezentována stochastickou maticí, jejíž řádky a sloupce jsou indexovány kartézským součinem
Předpokládejme například, že a jsou bity, a uvažujme operaci s následujícím popisem.
Toto je deterministická operace známá jako řízená operace NOT (controlled-NOT), kde je řídicí bit, který určuje, zda se má na cílový bit aplikovat operace NOT, nebo ne. Zde je maticová reprezentace této operace:
Její působení na standardní bázové stavy je následující.
Pokud bychom vyměnili role a tak, že by byl řídicí bit a cílový bit, pak by maticová reprezentace operace vypadala takto
a její působení na standardní bázové stavy by bylo následující:
Dalším příkladem je operace s tímto popisem:
Maticová reprezentace této operace je následující:
Působení této operace na standardní bázové vektory je následující:
V těchto příkladech se jednoduše díváme na dva systémy dohromady jako na jeden systém a postupujeme stejně jako v předchozí lekci.
Totéž lze provést pro libovolný počet systémů. Představ si například, že máme tři bity a inkrementujeme je modulo — což znamená, že na tři bity nahlížíme jako na zakódování čísla mezi a v binárním zápisu, přičteme a pak vezmeme zbytek po dělení Jeden způsob, jak tuto operaci vyjádřit, je takto:
Další způsob, jak ji vyjádřit, je
za předpokladu, že jsme se dohodli, že čísla od do uvnitř ketů odkazují na tříbitové binární kódování těchto čísel. Třetí možností je vyjádřit tuto operaci jako matici.
Nezávislé operace
Nyní předpokládejme, že máme více systémů a nezávisle provádíme různé operace na jednotlivých systémech zvlášť.
Vezměme si například naše obvyklé nastavení dvou systémů a s množinami klasických stavů a a předpokládejme, že provedeme jednu operaci na a zcela nezávisle jinou operaci na Jak víme z předchozí lekce, tyto operace jsou reprezentovány stochastickými maticemi — a abychom byli přesní, řekněme, že operace na je reprezentována maticí a operace na je reprezentována maticí Řádky a sloupce matice tedy mají indexy, které odpovídají prvkům a obdobně řádky a sloupce matice odpovídají prvkům
Přirozená otázka zní: pokud se na a díváme společně jako na jeden složený systém jaká matice reprezentuje kombinované působení obou operací na tento složený systém? K zodpovězení této otázky musíme nejprve zavést tenzorové součiny matic, které jsou podobné tenzorovým součinům vektorů a jsou definovány analogicky.
Tenzorové součiny matic
Tenzorový součin matic
a
je matice
Ekvivalentne je tenzorovy soucin a definovan rovnici
ktera plati pro kazdou volbu a
Alternativni, ale ekvivalentni zpusob popisu je, ze jde o jedinou matici splnujici rovnici
pro kazdou moznou volbu vektoru a za predpokladu, ze indexy odpovidaji prvkum a indexy odpovidaji
Podle drive popsane konvence pro razeni prvku kartezskych soucinu muzeme tenzorovy soucin dvou matic zapsat explicitne takto:
Tenzorove souciny tri a vice matic se definuji analogickym zpusobem. Pokud jsou matice, jejichz indexy odpovidaji mnozinam klasickych stavu pak je tenzorovy soucin definovan podminkou
pro kazdou volbu klasickych stavu Alternativne lze tenzorove souciny tri a vice matic definovat rekurzivne pomoci tenzorovych soucinu dvou matic, podobne jako jsme to videli u vektoru.
O tenzorovem soucinu matic se nekdy rika, ze je multiplikativni, protoze rovnice
plati vzdy, pro jakoukoli volbu matic a za predpokladu, ze souciny davaji smysl.
Nezavisle operace (pokracovani)
Nyni muzeme odpovedet na drive polozenou otazku: pokud je pravdepodobnostni operace na je pravdepodobnostni operace na a obe operace se provadeji nezavisle, pak vysledna operace na slozenem systemu je tenzorovy soucin
Takze jak pro pravdepodobnostni stavy, tak pro pravdepodobnostni operace plati, ze tenzorove souciny reprezentuji nezavislost. Pokud mame dva systemy a ktere jsou nezavisle v pravdepodobnostnich stavech a pak slozeny system je v pravdepodobnostnim stavu a pokud na oba systemy nezavisle aplikujeme pravdepodobnostni operace a pak vysledna akce na slozenem systemu je popsana operaci
Podivejme se na priklad, ktery pripomina pravdepodobnostni operaci na jednom bitu z predchozi lekce: pokud je klasicky stav bitu necha se beze zmeny; a pokud je klasicky stav bitu prevraci se na 0 s pravdepodobnosti Zjistili jsme, ze tato operace je reprezentovana matici
Pokud se tato operace provede na bitu a (nezavisle) se provede operace NOT na druhem bitu pak spolecna operace na slozenem systemu ma maticovou reprezentaci
Pri blizsi kontrole vidime, ze jde o stochastickou matici. To bude platit vzdy: tenzorovy soucin dvou nebo vice stochastickych matic je vzdy stochasticky.
Casta situace, se kterou se setkavame, je takova, ze se provede jedna operace na jednom systemu a s druhym se nedela nic. V takovem pripade se postupuje uplne stejne, pricemz je treba mit na pameti, ze nedelani niceho je reprezentovano jednotkovou matici. Napriklad resetovani bitu do stavu a nedelani niceho s dava pravdepodobnostni (a vlastne deterministickou) operaci na reprezentovanou matici