Publikované pred 5 mesiacmi: 21.12.2011 / Tlačový servis PCR , čítaní: 1747
Google v priebehu posledných rokov zhromaždil veľké množstvo fotografií. Jeden z ich zdrojov je aj
Street View, kde zábery obsahujú aj množstvo textu a číslic (napr. adresy budov). Teraz sa inžinieri z Googlu v spolupráci s vedcami zo Stanfordu snažia údaje z nich analyzovať. V štúdii Reading Digits in Natural Images with Unsupervised Feature Learning skúmali, ako si rozličné mechanizmy OCR poradia s dekódovaním číslic na prirodzených fotkách. Klasické algoritmy OCR mali vysokú chybovosť. No po nasadení systému umelej inteligencie, ktorý sa postupne učil rozpoznávať symboliku písma, dosiahli úspešnosť 90 %.
Na porovnanie, človek dosiahol úspešnosť 98 %. OCR v tomto prípade zlyhalo z toho dôvodu, že išlo o zábery zhotovené rozličných uhlov, pričom niektoré časti boli rozmazané alebo čísla čiastočne prekrývali napr. okolité stromy. S postupným zdokonaľovaním štatistických algoritmov a systémov umelej inteligencie rastie aj cena dát, ktoré Google v priebehu rokov zhromaždil. Z fotografií sa totiž podarí získavať čoraz viac informácií. Možno však pochybovať o tom, či je to jednoznačne dobrá správa...
Zdroj: i-programmer.info
static.googleusercontent.com
Dĺžka:00:25:58
Dĺžka:00:17:22
Dĺžka:00:22:22
Dĺžka:00:55:21