Weblog – novinky ze světa web 2.0

Inspirujte se

Weblog – novinky ze světa web 2.0 header image 2

Kaggle – datamining jako sport

25.6. 2013 · Žádný komentář · Start-upy

Kaggle sdružuje největší komunitu datových specialistů na světě – v současnosti přes 100 000 lidí z více než 100 zemí a 200 univerzit.  Kaggle založil v roce 2010 Anthony Goldbloom v Melbourne a v roce 2011 se firma přesunula do San Francisca a v témže roce získala investici ve výši 11 miliónů dolarů od skupiny investorů vedených Index Ventures a Khosla Ventures.  Kaggle pořádá soutěže týkající se  prediktivního modelování, které pomáhají řešit nejsložitější problémy v různých oblastech od zdravotnictví po finance a pojišťovnictví. Členové komunity pak soutěží o co nejlepší výsledky a mohou tak získat zajímavé odměny v řádech tisíců až stovek tisíc dolarů. Atraktivitu soutěží zvyšuje fakt, že účastníci okamžitě vidí svůj výsledek v porovnání s ostatními.

Firmy se nemusí bát o svá data – za pomocí odborníků z Kaggle je mohou anonymizovat, popřípadě si mohou vybrat soutěžící z řad prověřených specialistů, kteří mají podepsané NDA (non disclosure agreement).  Pro složitější úlohy je možné si najmout  nejúspěšnější členy komunity (0,5% z stotisícové členské základny)  za hodinovou sazbu.  Pro řadu datových specialistů to představuje i jejich hlavní příjem. Tuto  crowdsourcingovou platformu už úspěšně použila řada nadnárodních firem – Microsoft díky tomu dokázal  vylepšit rozpoznávaní gest na konzoli XBOX,  NASA dosáhla lepšího zobrazování temné hmoty ve vesmíru.  Zatím největší soutěž o 500 000 USD vypsala Heritage Provider Network - síť  lékařských zařízení, která chtěla vytvořit model, který by předvídal počet dnů strávených v budoucím roce v  nemocnici pro jednotlivé pacienty.  To jí umožňuje lépe plánovat kapacity a šetřit tak milióny dolarů. V letošním roce stejná firma připravuje privátní soutěž (tedy jen pro osvědčené členy z nejlepšími výsledky z předchozí soutěže) o rovné 3 milióny USD.

Pro zkušené data specialisty se zde otvírá zajímavá možnost jak si přivydělat nebo se blýsknout před potencionálními zaměstnavateli.  Na Kaggle se řeší  i   řada vědeckých problémů a součástí odměny bývá i placená účast na konferencích nebo možnost publikovat v renomovaných vědeckých časopisech.  Pokud se najde více firem, které překonají blok z poskytování svých interních dat mimo firmu, přinese to do dataminingu velkou změnu a zvýšenou konkurenci současným specialistům. Kaggle je ukázkový příklad toho, jak internet mění zaběhlé zvyklosti – dneska už jsme si zvykli, že si můžeme za pár kliků nakoupit téměř libovolné zboží a brzy si bude možné objednávat tímto způsobem i služby.  Příležitost pro vnímavé.

Díky @pavelcurda za inspiraci pro článek.

Tagy: ·······