Blog

Král – muž + žena = …

27. 9. 2021
Tomáš Mikolov

Proč jsme místo nadpisu zvolili hádanku? Takový úvod článku je totiž podobně nekonvenční jako myšlení autora samotné rovnice. Tomáš Mikolov, vědec v oblasti umělé inteligence, vymyslel způsob, jak interpretovat slova pomocí čísel respektive vektorů. A dokonce je umí i sčítat a odčítat. Jeho program word2vec pomáhá zpřesnit výsledky internetových služeb, které zpracovávají přirozený jazyk. Laureáta Ceny Neuron jsme s radostí přivítali v ABRA Software, kde studentům technických oborů vyprávěl svůj příběh.

Pokud jste přišli na to, že za rovnítkem má být „královna“, jistě hned vyřešíte, že Madrid – Španělsko + Francie = Paříž. Slovní rovnice jsou ovšem jen třešinkou na dortu. “Byl to spíš vtip,” vzpomíná Tomáš na rok 2013, kdy tuto zajímavost testoval s Jeffem Deanem, manažerem v Google Research. “Jméno vám možná nic neříká, ale v Silicon Valley je to celebrita. V rámci pozic jste tehdy mohli v Googlu vystoupat od první až na devátou příčku. A Jeff měl desátou,” směje se Tomáš. Tehdy tady pracoval ve výzkumné skupině a potřeboval své šéfy přesvědčit, že word2vec opravdu funguje. A povedlo se. S kolegy publikoval oficiální článek a vedení mu umožnilo dát program k dispozici jako open source. Každý, kdo se zabývá strojovým překladem, tak od léta 2013 může využívat jeho kód.

A jak vývojář, který už v osmi letech začínal programoval vlastní hry, na nápad vlastně přišel? “Část mojí rodiny pochází z Polska, a když člověk vedle sebe vidí ty dva jazyky, tak si uvědomí, že si dokážeme rozumět, i když neznáme všechna slova. Dojde nám to z kontextu,” říká. K interpretaci přes vektory pak šumperský rodák dospěl při magisterském studiu na VUT v Brně. “Pomohl mi k tomu předmět o kompresi dat, a když jsem pak někde viděl matematický model neuronové sítě, bylo mi jasné, že je to přesně to, co hledám,” vypráví osmatřicetiletý Mikolov.

Jeho word2vec umí předpovědět, jaká další slova se objeví ve větě na základě vztahu k těm ostatním. Slova jsou definovaná pomocí faktorů jako je číslo, rod, pád, čas apod., což jim dává velikost a směr, tedy podobu konkrétního vektoru. Z navrhovaných vektorů (slov) se vybere to nejbližší. Hlavní výhody oproti jiným řešením? Kromě přirozenějšího překladu také vyšší rychlost. Program neplýtvá svou kapacitou počítáním věcí, které se ve výsledku vůbec nemusí využít. “Někteří vědci hledají perfektní řešení a pak často stráví všechen čas optimalizací něčeho, co není pro výsledek podstatné. Já zastávám přístup, že je lepší optimalizovat nejdříve ty části, které nejvíce ovlivňují výsledek,” vysvětluje vědec.

Po zkušenostech v Microsoftu, Googlu a Facebooku se Tomáš Mikolov vrátil na domácí akademickou půdu. V Českém institutu informatiky, robotiky a kybernetiky vede výzkumnou skupinu zaměřenou na vývoj tzv. silné umělé inteligence. Postupnou evolucí chce stvořit komplexní systém se schopností učit se podobnou rychlostí jako člověk. A věří, že Čechy jsou tím správným místem. „Máme tady spoustu chytrých lidí, studenti techniky mají minimálně srovnatelné znalosti s americkou konkurencí. Jen se neumíme tolik prodat,“ uzavírá s tím, že i to je jen z důvodů, proč jsou zahraniční zkušenosti k nezaplacení a určitě je doporučuje každému, kdo chce prorazit ve svém oboru.

Úvodní foto: CIIRC


Související články a videa

Zajímáte se o systém ABRA Gen? Napište nám!

Zeptejte se CZ