Velká data a e-commerce na steroidech

Dokázat nahlédnout do hlav zákazníků a odhalit jejich přání dříve než je vysloví je odvěkým snem obchodníků a marketérů. Jeho naplnění je nyní díky analýze (Velkých) dat a strojovému učení o pořádný kus blíže. Intuici a osobní znalost klientů totiž nahrazují algoritmy těžící informace z větších či menších souborů dat.

3. listopadu 2014

Autor: Jan Janča, CEO Gauss Algorithmic Rubrika: Blog

Snahy vydělat na analýze historických záznamů o chování zákazníků, trhů a kdo ví čeho ještě, samozřejmě nejsou ničím novým. Staletí před vynálezem počítačů si „podnikatelé“ vedli podrobné poznámky o klientech i burzovních transakcích a hltali zprávy o okolním světě, aby včas zachytili trendy a přizpůsobili se jim. A nezůstávali pouze u přizpůsobování.

Poměrně úspěšně se pokoušeli předpovídat budoucí vývoj na základě opakovaného výskytu určitých jevů v historických pozorováních. Dobrým příkladem takového „věštění“ jsou lidové pranostiky, podle kterých se řídili především zemědělci. Určitě si ale dokážeme představit také schopného obchodníka, který si po propršeném dnu svatého Medarda zajistil na dalších 40 dní stabilní příjem rychlou změnou popisu produktu ze slunečníku na deštník.

Přesto, že jsou dnešní možnosti analýzy dat o mnoho dále, velká část firem jakoby neměla o cenné informace ukryté v jejich vlastních datech zájem. Počítače by jim přitom mohly začít v reálném čase chrlit hromady „pranostik“, které by je dovedly k vyšší efektivitě, obratu a zisku.

Big Data nebo jen Data?

Množství analyzovaných dat nemusí nutně překračovat kapacitu pevných disků běžných počítačů a do značné míry závisí na typu dat. Ta mohou být strukturovaná, nebo (překvapivě)nestrukturovaná.

Strukturovaná data jsou běžně používané záznamy, jako jména, data narození, záliby nebo pohlaví. Zdrojem překvapivých, cenných a na první pohled skrytých informací však bývají zpravidla data nestrukturovaná, což jsou například počty kliků na banner, návštěv stránek a „lajků“, obsah e-mailové komunikace nebo fotografie.

Rozdíl v použití různých typů dat si ukážeme na jednoduchém příkladu. Představme si, že máme k dispozici strukturovaná data v podobě databáze zákazníků a nestrukturovaná data v podobě záznamů SMS komunikace klientů jednoho z telefonních operátorů. Každý den budeme chtít zaslat lidem, kteří mají narozeniny, osobní přání s poukazem na 10% slevu v e-shopu.

V případě strukturovaných dat je to jednoduché. Pokud má uživatel v databázi uvedeno datum narození, máme vyhráno, pokud ne, máme smůlu. V případě nestrukturovaných dat bude postup komplikovanější. Budeme předpokládat, že si lidé posílají k narozeninám SMS obsahující slova jako „gratuluji“ nebo „blahopřeji“. Provedete tedy analýzu komunikace, ze které vypadnou dny, ve kterých je frekvence uvedených slov v přijatých SMS uživatelů nejvyšší. Pokud vyřadíte Vánoce, Nový rok a podobné „přací“ svátky, zůstanou vám dny, které s vysokou pravděpodobností odpovídají dnům narozenin.

Čím více let komunikace budete mít k dispozici, tím jistější budou vaše závěry, ale také časově náročnější zpracování dat.

Strojové učení a nahlížení do budoucnosti

Statická analýza historických dat je však pouze začátek. Výkon dnešních počítačů umožňuje analyzovat data v reálném čase, učit se z nich a vytvářet předpovědi pravděpodobného budoucího vývoje. V praxi se často setkávám s lidmi, pro které je myšlenka, že by se počítač mohl sám od sebe něco naučit zcela nepochopitelná nebo přímo nepřijatelná. Jak by se mohla nějaká blbá škatule něco naučit? Poměrně snadno.

Stroje (počítač + program) se nejprve učí rozpoznávat určité vzory ve známých datech. V našem předchozím příkladu to bylo hledání výskytu „přacích“ slov, v případě e-shopu to může být například pořadí stránek, které si uživatel prohlédl, než se dostal na stránku detailu zboží, které skutečně nakoupil.

Naučený stroj potom v reálném čase vyhodnocuje data o průchodu uživatele e-shopem a podle podobnosti jeho chování s naučenými vzory mu zobrazuje nabídky zboží, které skončí s vysokou pravděpodobností objednávkou. Stejný stroj můžeme využít také k zasílání personalizovaných newsletterů nebo zlepšení cílení PPC reklamy.

Stroje se navíc neustále učí z nově příchozích dat, takže jsou schopny sami rozeznávat měnící se trendy. V e-shopu, který používá strojové učení k takzvanému behaviorálnímu cílení nabídky zboží, si tak uživatel skutečně připadá, že obchodník ví o jeho přáních ještě dříve, než je vyslovil.

Jak využít strojové učení ke zvýšení výkonu e-shopu

Je přirozené, že se využívání analýzy velkých dat a strojového učení nejrychleji šíří ve společnostech z oblasti e-commerce. Používání výpočetních techniky ve všech oblastech jejich podnikání je pro ně samozřejmostí a jejich zákazníci po sobě nechávají na internetu obrovské množství relativně snadno dostupných dat.

Většina e-shopů navíc pracuje s velice nízkými maržemi, a proto je pro ně jakýkoliv nástroj, který jim pomůže zvýšit efektivitu a návratnost investic vítaným pomocníkem. Strojové učení a analýzu dat využívají nejčastěji v následujících oblastech.

Personalizace

Nabídka ušitá na míru každému zákazníkovi zásadním způsobem zvyšuje konverzní poměr. Datovou analytiku lze použít k zobrazování personalizovaných nabídek zboží na e-shopu, k zasílání takových nabídek e-mailem nebo jinými komunikačními kanály, ale také k zobrazování dokonale cílené reklamy. Výzkumy ukazují, že personalizace nabídek zvyšuje návratnost investic do marketingových kampaní (ROI) až 5 krát a zvyšuje průměrnou hodnotu objednávky o 10 procent a více.

Prediktivní analytika

E-shopy a webové služby mají dostatek dat k tomu, aby mohly předpovídat chování jejich uživatelů. Příkladem je Amazon, který dokáže odhadnout, jaké zboží zákazník nejpravděpodobněji zakoupí na základě jeho předchozího chování. Zvlášť efektivní je propojení interních záznamů e-shopu a externích zdrojů, například dat ze sociálních sítí. K rozhodování o tom jaké zboží uživateli nabídnout pomáhá například i analýza aktivity uživatele na Facebooku.

Cenotvorba

Na webu si může každý uživatel snadno porovnat cenu zboží u různých dodavatelů. Schopnost přizpůsobovat cenotvorbu podle aktuálního vývoje cen u konkurence, skladových zásob a poptávky je proto pro e-shopy klíčová. Podle průzkumu asociace pro elektronickou komerci se na základě nejnižší ceny rozhoduje 19 až 24 procent uživatelů.

Logistika

Kdy naskladnit, kdy vyskladnit, jakého dopravce využít vzhledem k předchozím zkušenostem a době dodání v cílové lokalitě. To jsou jen některé z otázek, na které vám může dát odpověď analýza dat. Stejně tak vám může pomoci identifikovat problémové odběratele a zadavatele. Nejlepším příkladem využití je opět Amazon, který své sklady po celém světě plní s předstihem na základě předpovědí poptávky po zboží v různých částech světa.

Vztahy se zákazníky

Od prvního příchodu uživatele na váš web bojujete s konkurencí o jeho udržení. To jakým způsobem mu budete prezentovat zboží, jak přívětivý bude objednávkový proces nebo jak rychle mu doručíte zboží nebo vyřídíte reklamaci, jsou zásadní faktory ovlivňující zákazníkovu spokojenost a pravděpodobnost, že u vás nakoupí i příště.

Analýza interakcí uživatele s dodavatelem odhaluje chyby v nákupním procesu a stojí na začátku návrhů zlepšení, které vedou k vyššímu konverznímu poměru, vyšší loajalitě a celkové spokojenosti zákazníků.

Jak se do toho pustit

O analýze velkých dat a strojovém učení jsou mezi lidmi rozšířené dvě zásadní nepravdy. Že je to drahá věc, kterou si mohou dovolit je velké firmy, a že je to vše otázkou pořízení nějakého softwaru produkujícího krásné grafy. První nepravda je zřejmě historický relikt, za druhou si mohou analytické firmy samy, protože je pro ně snazší prodávat jednoduchý produkt než složitou službu.

Softwaru pro analýzu dat i strojového učení je na trhu spousta a to zdarma. Pokud provozujete e-shop nebo webovou službu, máte možnost získat snadno i data. Za co zaplatíte, bude práce datového vědce. Pokud jste nevystudovali matematiku, fyziku nebo příbuzné obory, budete zkrátka potřebovat někoho, kdo má zkušenosti se statistikou a dokáže při pohledu na výsledky padající ze strojů rozpoznat věci, které mají potenciál zlepšit vaše obchodní výsledky.


Napsáno pro časopis Connect 11/2014.

Sdílejte s přáteli
Anglicky