Co je Deep Learning AF: jak funguje automatické zaostřování s technologií AI od společnosti Canon?

Společnost Canon udělala hodně hluku ze svého nového systému Deep Learning AF, který je srdcem nejnovější vlajkové lodi profesionálního fotoaparátu výrobce. Zní to neuvěřitelně chytře, ale existuje spousta otázek - co je Deep Learning? Kdo vyučuje? Učí se systém, jak střílíte? Je to opravdu umělá inteligence ve fotoaparátu? Opravdu vylepšuje automatické zaostřování?

Pokud jste si přečetli naši recenzi Canon EOS-1D X Mark III, budete vědět, že odpověď na poslední otázku je jednoznačná ano. Pokud jde o odpovědi na další otázky týkající se Deep Learning AF, vezměte si něco k pití a občerstvení a přečtěte si …

Mechanika automatického zaostřování fotoaparátu Canon EOS-1D X Mark III je neuvěřitelně chytrá a podporuje dva jednotlivé systémy AF. Prvním z nich je optický systém, který snímá 16 snímků za sekundu hledáčkem pomocí měřicího senzoru 400 000 pixelů ve spojení s dedikovaným procesorem Digic 8 pro 191bodové automatické ostření schopné sledování tváře.

Pak je tu systém Live View, který dokáže pořídit 20 snímků za sekundu a zaměstnává všech 20,1 milionu pixelů obrazového snímače v kombinaci s novým procesorem Digic X pro 3 869 bodů Dual Pixel CMOS, které dokáží provádět automatické ostření s detekcí očí.

Napájením obou těchto systémů je hlavní technologie Canon EOS iTR AFX - nejnovější iterace jejího inteligentního sledování a rozpoznávání automatického ostření, která debutovala v původním modelu EOS-1D X (a následně se dostala do rodiny 7D Mark II a 5D). A v jeho obvodech je pohřben algoritmus Deep Learning.

Hluboké učení NENÍ to samé jako AI

Nejprve je důležité si ujasnit, že Deep Learning nelze zaměňovat s umělou inteligencí (AI). Systém AI je něco, co je v neustálém stavu vývoje. Hluboké učení neboli strojové učení je podmnožinou AI.

Na rozdíl od skutečné AI je Deep Learning uzavřený proces. Jedná se o algoritmus před sestavením, který umožňuje architektuře kamery v podstatě se učit, mnohem rychleji, než by ji mohli ručně naprogramovat lidští inženýři. Jakmile je toto učení dokončeno, je uzamčeno a načteno do kamery.

Od tohoto bodu již není možné se učit; navzdory názvu - a Deep Learning je název technologie, nikoli popis procesu - kamera se neustále neučí a nebude se „zlepšovat“, čím víc budete střílet (skutečný systém AI by se naučil tolik vašich špatných návyků, jako by byly vaše dobré!).

„Bylo to naučeno,“ vysvětluje Mike Burnhill, manažer technické podpory společnosti Canon Europe. „Dáte to do počítače, vytvoří to algoritmus, který se poté načte do kamery. Takže se to liší od AI - AI je neustálé učení; hluboké učení je v podstatě to, že se to naučí samo a dá vám konečný výsledek, který se pak načte do kamery. “

Z čeho vyvstává otázka: je tolik kamer, které křičí o funkcích založených na AI, je kamera skutečně schopná podporovat umělou inteligenci?

„Výkon zpracování skutečné AI není u kamery proveditelný,“ říká Burnhill. „Pokud to chcete udělat, existují telefony - ale data nejsou ve vašem telefonu, jsou v Silicon Valley. To je místo, kde je systém AI. Je to jen připojení vašeho telefonu - není zde, je tam (v mrak), protože potřebujete server. Mohli bychom udělat kameru, ale pořád byste s sebou vláčili obří kufr. “

Jak se Deep Learning učí?

Algoritmus Deep Learning se tedy učí sám - ale odkud se vlastně poučí? Jednoduše řečeno, odpověď je „od nejlepšího“.

„Canon spolupracoval s našimi agenturami,“ říká nám Burnhill. „Získali jsme v zásadě přístup k celé jejich obrazové databázi sportovní fotografie, od všech hlavních agentur, spolupracovali jsme s našimi ambasadory, kteří střílejí sporty, a oni poskytli své snímky různých předmětů, a to nám umožnilo naučit tento systém AF, jak rozpoznat lidé ve sportu. “

Sport je samozřejmě cílenou metodou výuky, protože Canon EOS-1D X Mark III je primárně sportovní fotoaparát. Problém je v tom, že ať už jde o basketbalistu odvráceného od kamery, lyžaře s brýlemi nebo řidiče Formule 1 s helmou, lidé ve sportu mají často zakryté tváře - což znamená, že tradiční AF s detekcí obličeje nebo dokonce očí není Funguje to a kamera se místo toho zamkne na věci, jako jsou čísla na hráčově uniformě.

Díky přístupu k algoritmu Deep Learning k rozsáhlé knihovně obrazů, od všeho vzhůru nohama gymnastů až po hokejisty, kteří nosí chrániče a helmy, je schopen se naučit a odlišit lidskou podobu v nekonečné rozmanitosti situací - a je nakonec schopen provést tuto „detekci hlavy“, takže i když obličej osoby není viditelný, hlava je vždy primárním bodem zaostření.

„Hluboké učení je v zásadě obrazem, vytvoříte pro něj sadu pravidel, která se bude učit, a pak to půjde a vytvoří si vlastní algoritmus,“ pokračuje Burnhill. „Takže nastavíte parametry toho, jak by ten člověk vypadal, jdete:„ Tady je člověk “, pak analyzuje všechny obrazy lidí a říká:„ Toto je osoba “,„ To je osoba “. projde miliony obrázků za určité časové období a vytvoří tuto databázi a sama se naučí. “

Algoritmus ve skutečnosti vytváří dvě databáze - jednu pro servis optického hledáčku AF systém a měření pomocí Digic 8 a jednu pro servis AF systému s živým náhledem, který používá Digic X. Jelikož je to Digic X, který provádí veškerý výpočet pro sledování hlavy, jakmile algoritmus AF detekuje osobu v rámečku, vše je přeneseno do nového procesoru.

„Jakmile jste dostali člověka, skutečně máte duální zpracování,“ říká Burnhill. „Jsou zde dvě databáze, protože vstup z obou senzorů se bude mírně lišit, takže způsob, jakým je rozpoznán, se bude mírně lišit, takže se jedná o podmnožiny stejného algoritmu. Základní data pro oba jsou stejná, je to jen jak to bude rozpoznáno a budou na něj použita správná data. “

Pokud se nemůže naučit nové věci … co zvířecí AF?

Fotoaparát Canon EOS-1D X Mark III samozřejmě není jen sportovní fotoaparát - jeho dalším klíčovým publikem jsou střelci na divokou zvěř. Fotoaparát přesto nedisponuje schopností automatického zaostřování na zvířatech a my jsme zjistili, že Deep Learning se ve skutečnosti nemůže naučit žádné nové triky, jakmile je do fotoaparátu zapečen. Tak je to? Díky této nové fantastické technologii se kamera nezaměří ani na rodinného psa?

Je pravda, že právě teď fotoaparát neobsahuje AF (zvířecí oko). „V zásadě se soustředíme na to, aby lidé začali, aby tento druh algoritmu fungoval jako první,“ odpovídá Burnhill. „Proto jsme se trochu zaměřili na sport, protože to je stanovený parametr a můžeme ho učit v určitém časovém období,“

Odpověď tedy spočívá ve firmwaru. Burnhill potvrdil, že existuje potenciál, aby kamera podstoupila více hlubokého učení, například pro ptáky a divokou zvěř, a aby byl tento aktualizovaný algoritmus šířen uživatelům prostřednictvím aktualizací firmwaru - ačkoli neexistují žádné konkrétní plány, které by bylo možné oznámit.

„Budeme to vyvíjet pořád, takže v tuto chvíli stále není rozhodnuto, jak a kam jdeme. Ale vývojový tým jde a dívá se na další fotografii zvířat - uvědomujeme si, že existuje celá řada polí, ale samozřejmě velká fotoaparát se zaměřuje na sport a poté na divokou zvěř a v Tokiu 2022-2023 to byla zřejmě priorita. “

Je to spravedlivý bod; kdyby Canon čekal, až se Deep Learning všechno naučí, uvolnění fotoaparátu by trvalo déle. A přestože se výrobci jako Sony ve svých fotoaparátech chlubí selektivním zvířecím AF, Burnhill poznamenává, že Canon by raději vydal spíše kompletní zvířecí AF řešení než selektivní, kusové. A právě zde se Deep Learning stane neocenitelným.

„Problém je s divokou přírodou, existuje spousta různých zvířat - očividně máte predátory s očima vpředu, a pak máte (oči) králíků po boku, máte hady, máte ptáky … neexistuje žádný systém, který by rozpoznává tváře všech zvířat. A právě tam se dostanete do celého tohoto hlubokého učení, naučit systém rozpoznávat tyto složité věci. “

Zatímco vaše Sony může být schopna sledovat vašeho psa nebo kočku, ale nikoli mloka nebo plameňáka, Canon chce vyrobit fotoaparát, který dělá všechno nebo nic. „Pokud bychom to chtěli udělat, chtěli bychom to udělat pro co nejširší spektrum - nechceme vyrábět fotoaparát vhodný pro psy a fotoaparát vhodný pro kočky, chceme vyrábět fotoaparát vhodný pro zvířata to funguje pro širokou škálu zvířat, která (profesionálové) zastřelí. “

Recenze Canon EOS-1D X Mark III
Jak společnost Canon vyrobila nejrychlejší digitální zrcadlovku vůbec? Přepracováním zrcadlového boxu
102 aktualizací fotoaparátu Canon EOS-1D X Mark III

Zajímavé články...