Proizvodi koje pokreću podaci i mašinsko učenje mogu biti moćan način da odgovorite na potrebe korisnika. Takođe mogu napraviti i “štit” koji vas može zaštititi od konkurencije. Klasični primeri su Google pretraga i Amazon preporuke proizvoda, koji se unapređuju što se više korisnici angažuju. Ali prilika je daleko većih razmera i nije rezervisana samo za tehnološke gigante: kao što kompanije različitih veličina i širom različitih sektora investiraju, i vi možete da napravite izuzetne data proizvode koje omogućavaju podaci. U kompaniji Coursera, mašinsko učenje se koristi da bi se polaznicima pomoglo da pronađu najbolji sadržaj koji će odgovarati njihovim ciljevima obuke, te kako bi se osiguralo da imaju podršku – automatsku i ljudsku – koja im je potrebna za uspeh.

Životni cikljus takozvanog “data proizvoda” preslikava standardni razvoj proizvoda: identifikovanje prilike da se reši ključna potreba korisnika, izgradnja inicijalne verzije, a zatim evaluacija njenog uticaja i iteracije. Ali komponenta podataka dodaje još jedan sloj kompleksnosti. Kako bi se uhvatile u koštac sa izazovom, kompanije treba da daju naglasak kros-funkcionalnoj saradnji, evaluiraju i prioritizuju prilike za data proizvode imajući na umu dugoročno funkcionisanje, i započnu od jednostavnih koraka.

Faza 1: Identifikovanje prilike

Data proizvodi su timski sport

Identifikovanje najboljih prilika za data proizvode zahteva spajanje dve perspektive: proizvod-poslovanje i tehnologija-podaci. Menadžeri proizvoda, istraživači korisnika i poslovni lideri tradicionalno imaju jaku intuiciju i stručnost u datoj oblasti da identifikuju ključne nerešene korisničke i poslovne potrebe. Istovremeno, data naučnici i inženjeri imaju oštro oko za identifikovanje izvodljivih rešenja na osnovu toka podataka i jako izraženu intuiciju o tome šta se može skalirati i kako.

Kako biste identifikovali i prioritzovali prave prilike za data proizvod, dovedite obe ove strane da rade zajedno. Nekoliko normi može biti od pomoći:

  • Podučite data naučnike o potrebama korisnika i poslovanja. Značiće vam da držite data naučnike usaglašene sa menadžerima proizvoda, istraživačima korisnika i liderima poslovanja. Postarajte se da deo njihove uloge bude da “kopaju” direktno po podacima kako bi razumeli korisnike i njihove potrebe.
  • Neka data naučnici budu i promoteri podataka, šireći prilike iz podataka sa širom organizacijom. To može ići od pružanja organizaciji jednostavnog pristupa sirovim podacima i uzoraka rezultata modela u ranim fazama razvoja ideja, pa do izgradnje celovitih prototipa u kasnijim fazama.
  • Razvijte poznavanje podataka među proizvod i poslovnim grupama. Pojedinci iz različitih funkcija i industrija nadograđuju svoje kvalifikacije u pogledu podataka, a poslodavci mogu pojačati ovaj trend investiranjem u programe obuke. Što je veća pismenost sa podacima među prizvod i poslovnim funkcijama, više će biti u mogućnosti da sarađuju sa timovima data naučnika i tehnike.
  • Dajte data nauci mesto za stolom. Data nauka može živeti na različitim mestima širom organizacije (bilo centralizovano ili decentralizovano), ali bez obzira na strukturu, imati lidere data nauke u prostoriji za diskusije proizvoda i poslovne strategije će ubrzati razvoj data proizvoda.

Prioritizujte imajući na umu budućnost

Najbolji data proizvodi postaju sve bolji što su stariji, kao i dobro vino. Za ovo postoje dva razloga:

Prvo, aplikacije data proizvoda obično ubrzavaju prikupljanje podataka, što zauzvrat unapređuje aplikaciju. Setite se proizvoda za preporučivanje koji je vođen korisničkim samo-prijavljenim profilnim podacima. Sa ograničenim podacima sa profila danas, inicijalne (ili “cold start”) preporuke mogu biti neinspirativne. Ali ukoliko su korisnici radi da popunjavaju profil kada se to koristi da se personalizuje njihovo iskustvo, pokretanje preporuka će ubrzati prikupljanje profila, za uzvrat unapređujući preporuke tokom vremena.

Drugo, mnogi data proizvodi mogu biti napravljeni da opslužuju više aplikacija. Ovde se ne radi samo o širenju skupih istraživanja i razvoja po različitim slučajevima upotrebe; reč je o izgradnji mrežnih efekata putem deljenih podataka. Ukoliko podaci koje proizvodi svaka aplikacija puni podatke u osnovi, to poboljšava aplikacije, što zauzvrat vodi većoj utilizaciji i samim tim prikupljanju podataka, i ciklus se nastavlja.

Skills Graph kompanije Coursera  je jedan od primera. Serija algoritama koji mapiraju biblioteku veština na sadržaj, karijere i polaznike – Graph omogućava niz aplikacija koje se odnose na otkrivanje na sajtu.

Previše fokusa na neposredni performans može dovesti do nedovoljnog investiranja u obećavajuće srednje ili dugoročne prilike. Uopšteno, važnost podataka visokog kvaliteta ne može se preceniti; investicijama u prikupljanje i skladištenje podataka treba dati prioritet u svakoj fazi.

Faza 2: Napravite proizvod

Izbegnite rizik scenirajući egzekuciju

Data proizvodi obično zahtevaju validaciju i da li algoritam radi, kao i da li se korisnicima dopada. Kao rezultat, oni koji prave data proizvide se suočavaju sa neizbežnom tenzijom između toga koliko investirati u razvoj i istraživanja unapred, a koliko brzo izbaciti aplikaciju kako bi bilo validirano da li rešava suštinsku potrebu.

Timovi koji previše investiraju u tehničku validaciju pre validacije uklapanja proizvoda i tržišta rizikuju da protraće trud na istraživanja i razvoj koja su usmerena na pogrešan problem ili rešenje. Slično tome, timovi koji previše investiraju u validaciju potražnje korisnika bez dovoljnih istraživanja i razvoja mogu završiti prezentirajući korisnicima nedovoljno moćan prototip, i tako rizikovati nepouzdanu negativnu reakciju. Ukoliko korisnici ne reaguju pozitivno, moguće je da bi sa boljim I&R rezultat bio drugačiji.

Premda ne postoji čarobni štapić za simultanu validaciju tehnike i uklapanja proizvoda i tržišta, može vam pomoći scenirana egzekucija. Početi jednostavno će ubrzati i testiranje i prikupljanje vrednih podataka. Tokom izgradnje Skills Graph, na primer, inicijalno je lansirana pretraga na osnovu veština – aplikacija koja je zahtevala samo mali niz, a zatim generisala pregršt dodatnih podataka o obukama. Serija MVP pristupa može takođe smanjiti vreme potrebno za testiranje:

  • Lagani modeli su obično brži za isporuku i imaju dodatnu prednost da ih je lakše objasniti, korigovati i nadograditi tokom vremena. Premda dubinsko učenje može biti moćno (i svakako je u porastu), u većini slučajeva nije nešto od čega treba početi.
  • Eksterni izvori podataka, bilo da su otvoreni ili kupljena/partnerska rešenja, mogu ubrzati razvoj. Ako i kada se javi jak signal iz podataka koje proizvod generiše, proizvod može biti adaptiran tako da se oslanja na taj kompetitivni diferencijator.
  • Sužavanje domena može redukovati obim algoritamskih izazova od samog početka. Na primer, neke aplikacije mogu inicijalno biti napravljene i lansirane samo za podskup korisnika ili slučajeva upotrebe.
  • Ručno biranje — gde ljudi ili obavljaju posao za koji se nadate da će ga na kraju obavljati model, ili bar pregledaju i koriguju inicijalne rezultate modela – to može dodatno ubrzati razvoj. Ovo se u idealnom slučaju radi imajući na umu kako bi koraci ručnog biranja mogli biti automatizovani tokom vremena kako bi se proizvod skalirao.

Faza 3: Evaluirajte i sprovodite iteracije

Razmotrite budući potencijal kada evaluirate performanse data proizvoda

Evaluiranje rezultata nakon lansiranja kako bi se donela odluka o nastavljanju ili zaustavljanju data proizvoda nije tako jednostavno kao sa modifikovanjem korisničkog interejsa. Budući da se data proizvod može značajno unaprediti kako prikupljate više podataka, kao i zato što osnovni data proizvodi mogu omogućavati mnogo više funkcionalnosti tokom vremena. Pre nego što odbacite data proizvod koji ne deluje kao očigledan uspeh, pitajte svoje data naučnike da kvantifikuju odgovore na nekoliko važnih pitanja. Na primer, u kojoj meri se proizvod organski unapređuje pomoću prikupljanja podataka? Koliko ima mogućnosti za lako izvodljiva poboljšanja algoritma? Koje vrste aplikacija će ovo omogućiti u budućnosti? U zavisnosti od odgovora na ova  pitanja, proizvod sa neinspirativnim merenjima danas možda zaslužuje da se sačuva.

Brzina iteracija je važna

Za data proizvode su često potrebne iteracije i za algoritme i za korisnički interfejs. Izazov je odrediti odakle će doći iteracije od najveće vrednosti, zasnovane na podacima i fidbeku korisnika, tako da timovi znaju koje funkcije su opcija za pravljenje poboljšanja. Ovde će algoritamske iteracije biti ključne – jer se one obično nalaze u kompleksnim sistemima preporuka ili komunikacija, kao što je Coursera personalizovane intervencije učenja. Razmotrite dizajniranje sistema tako da data naučnici mogu nezavisno da sprovedu i testiraju nove modele u produkciji.

Kako da napravite izuzetne data proizvode?

Negovanjem saradnje između odseka proizvoda, lidera u poslovnim funkcijama i data naučnika, prioritizovanjem investicija uz gledanje u budućnost i jednostavnim počecima, kompanije svih oblika i veličina mogu ubrzati svoj razvoj izuzetnih data proizvoda koji rešavaju suštinske korisničke potrebe, podstiču poslovanje i kreiraju dugotrajnu prednost nad konkurencijom.

Ključ izuzetne data strategije: biranje Data Science projekata