Benn Stancil, założyciel firmy Mode, o tym, jak data science może pomóc nam podejmować lepsze decyzje
Opublikowany: 2022-05-06Analiza danych nie polega na wyrzucaniu fantazyjnych pulpitów nawigacyjnych — to długi, powtarzalny proces oparty na współpracy, który pomaga lepiej zrozumieć, czego chce klient i jak to osiągnąć.
A raczej powinno być. Ten stereotypowy obraz pokoju pełnego monitorów i rozbudowanych pulpitów, w którym podejmowane są wszystkie decyzje, nie jest prawdziwy i najwyższy czas od niego odejść. Według Benna Stancila, współzałożyciela i dyrektora ds. analityki w Mode, platformie zaprojektowanej, aby pomóc analitykom danych i naukowcom analizować, wizualizować i udostępniać dane, wiele z ich rzeczywistej codziennej pracy wymaga siedzenia z menedżerami produktu i liderzy biznesu, majstrujący przy różnych rzeczach, próbujący wspólnie rozwiązać problem biznesowy.
Faktem jest, że nauka o danych jako dziedzina jest wciąż stosunkowo nowa. Dlatego wielu liderów biznesu nie jest do końca pewien, jak zacząć, jak to wykorzystać lub co zrobić, gdy wszystkie pulpity nawigacyjne i narzędzia wydają się wskazywać na różne rozwiązania. Ale jak wskazuje Benn, przyszłością analizy danych nie jest diagram architektury ani liderzy biznesowi patrzący na kokpity – to budowanie doświadczenia, i to bardzo ekscytującego.
W tym tygodniu mieliśmy przyjemność porozmawiać z Bennem o nowoczesnym stosie danych oraz o tym, jak dane mogą – a co ważniejsze, powinny być wykorzystywane do napędzania wzrostu.
Jeśli masz mało czasu, oto kilka szybkich wskazówek:
- Chociaż nauka o danych nie może przewidzieć przyszłości, z pewnością może pomóc skoncentrować zasoby, rozwiązywać problemy, a nawet odblokować nowe rynki.
- Wszelkie spostrzeżenia wynikające z analizy danych będą zawsze tak dobre, jak same dane. Upewnij się, że Twoje dane są dokładne, zanim wyciągniesz jakiekolwiek wnioski na ich temat.
- O ile nie patrzysz na dane, aby zrozumieć, dlaczego Twoi klienci korzystają z Twoich produktów, unikaj podejmowania decyzji w oparciu o oczekiwania dotyczące ich motywacji.
- Ponieważ widzimy więcej standaryzacji nad najlepszymi praktykami w zakresie obsługi danych, nie będzie już konieczne projektowanie procesu od podstaw, ale raczej opieranie się na nim i dostosowywanie go do każdego przypadku użycia.
- Patrzenie na niekończące się wiersze i kolumny może być zniechęcające nawet dla doświadczonego analityka danych. W razie wątpliwości zacznij grzebać w podstawowych założeniach dotyczących produktu i stamtąd.
Jeśli podoba Ci się nasza dyskusja, sprawdź więcej odcinków naszego podcastu. Możesz śledzić na iTunes, Spotify lub pobrać kanał RSS w wybranym odtwarzaczu. Poniżej znajduje się lekko zredagowany transkrypcja odcinka.
Wchodzenie w analitykę
Liam Geraghty: Benn, bardzo dziękuję za przyłączenie się do nas dzisiaj.
Benn Stancil: Świetnie tu być.
Liam: Po pierwsze, czy mógłbyś opowiedzieć nam trochę o swoim pochodzeniu, czym się zajmujesz i jak doszedłeś do tego punktu?
Benn: W zasadzie zacząłem swoją karierę w zupełnie innym świecie. Zaczynałem w świecie polityki jako badacz ekonomii w think tanku. Spędziłem tam kilka lat, naprawdę podobała mi się ta praca i pomysł, aby w zasadzie spróbować rozwiązać problemy z danymi. Moim zadaniem było przyjrzenie się temu, co dzieje się w gospodarce światowej – był wtedy rok 2010, więc wszystko się rozpadało – a następnie przyjrzenie się danym na ten temat i wymyślenie zaleceń dotyczących tego, co powinni zrobić decydenci .
To było naprawdę interesujące koncepcyjnie, ale jeśli wydajesz zalecenia dotyczące tego, co powinien zrobić Fed jako młodsza osoba w think tanku, nikt tak naprawdę nie zwraca na ciebie uwagi. Podoba mi się pomysł wykonywania tego rodzaju pracy, ale chciałem to zrobić w sposób, który byłby bardziej bezpośrednio związany z problemami, które ludzie próbowali rozwiązać, aby można było zobaczyć, czy twoje pomysły lub zalecenia się sprawdziły. W ten sposób przeszedłem z tej pracy na stanowisko analityka w firmie technologicznej w San Francisco. To była moja pierwsza praca w branży technologicznej. Pracowałem tam przez kilka lat jako analityk lub data scientist. Byłem typem osoby, której zadaniem jest współpraca z marketerami, menedżerami produktu lub pracownikami operacyjnymi, aby pomóc im w podejmowaniu decyzji o tym, które produkty wysyłać, do jakich odbiorców kierować reklamy lub czy firma dobrze sobie radzi w pewnych obszarach, a nie inni. To było podobne do tego, co robiłem w DC, ale dotyczyło zupełnie innej domeny.
„Podróż firmy trzech osób pracujących z czyjegoś salonu do czegoś, co jest setkami ludzi, to taka, w której ciągle napotykasz nowe rzeczy”
Od tego momentu poznałem kilku ludzi, zacząłem zdawać sobie sprawę z potrzeb ludzi takich jak ja i jakich narzędzi chcieliśmy, jakich narzędzi jeszcze nie było, i ostatecznie stworzyłem tryb oparty na tej wizji.
Liam: Czy dotarcie do tego punktu w trybie startowym było trudne?
Benn: Na pewno. Każdy startup będzie wyzwaniem, a Mode nie jest inny. Tryb miał wiele wzlotów i upadków. Z jednej strony było to bardzo trudne. Każdego dnia pracujesz nad różnymi problemami, rzeczami, których nigdy wcześniej się nie spodziewałeś. Jestem pewien, że dobrze zdajesz sobie sprawę, podróż firmy trzech osób pracujących z czyjegoś salonu do czegoś, co jest setkami ludzi, to taka, w której ciągle napotykasz nowe rzeczy, gdzie problemy, które masz w pierwszym miesiącu, są inne niż problemy, które masz w drugim miesiącu.
Każdego dnia musisz nauczyć się czegoś nowego, o czym nigdy wcześniej nie myślałeś. To nie jest tak: „Będę naprawdę dobry w tej konkretnej rzeczy”. Jak tylko staniesz się w tym dobry, przejdziesz do następnego. W tym sensie było to bardzo trudne. Jednak mieliśmy świetny zespół. Są wspaniali ludzie, którzy wspierali firmę, bez względu na to, czy są pracownikami, czy nie, są to ludzie, którzy byli pierwszymi klientami, czy są tylko przyjaciółmi i rodziną, i typy ludzi, którzy tolerują ty, jak się z tym zgadzasz. To była ciężka praca, ale było to bardzo dobre doświadczenie, mając do tego wsparcie tak wielu ludzi. Myślę, że ludzie w Dolinie Krzemowej są szczególnie uprzywilejowani, mając cały ekosystem, który pomaga im i ich firmie odnosić sukcesy. Gdybyś miał to zrobić w innych miejscach, myślę, że byłoby to znacznie trudniejsze.
Jakie dane mogą, a czego nie mogą?
Liam: Nauka o danych to podstawa dla firm, które chcą usprawnić podejmowanie decyzji, wykorzystując informacje, które już gromadzą w swoich aplikacjach i innych systemach. W tym miejscu wkracza tryb Twojej firmy. Czy możesz nam opowiedzieć o stworzonej przez siebie platformie i o tym, jak pomaga ona analitykom danych?
Benn: Na pewno. Firmy wykorzystują dane na wiele różnych sposobów. Najprostszym sposobem myślenia o tym jest myślenie o tym, co widzisz w karykaturach w filmach i innych rzeczach, takich jak pokoje pełne pulpitów nawigacyjnych i wykresów, w których ludzie podejmują decyzje. To oczywiście się nie dzieje. Ludzie mają pulpity nawigacyjne i wszyscy sprawdzamy, jak radzą sobie firmy i tego typu rzeczy. Jednak wiele z codziennej pracy polegającej na efektywnym wykorzystaniu danych pochodzi od eksperta ds. danych, który siedzi z ekspertem biznesowym, próbując wspólnie rozwiązać problem i odpowiedzieć na pytania, które mają im pomóc w podjęciu pewnych decyzji.
„Menedżer produktu nie będzie patrzeć na ekran i mówić:„ Aha, to jest dokładnie to, czego potrzebujemy ”
Wyobraź sobie, że jesteś menedżerem produktu, który chce zdecydować, który produkt zbudować. Możesz chcieć zrozumieć, w jaki sposób ludzie korzystają z obecnych funkcji, które chcesz zmienić. Czy różne typy ludzi używają go na różne sposoby? Czy są rzeczy, które próbują zrobić, ale mają problemy? Czy potrafią osiągnąć swoje cele? Wszystkie te rzeczy wymagają tych bardzo konkretnych pytań i nie jest to proces, na który można by odpowiedzieć, patrząc na pulpit nawigacyjny. Menedżer produktu nie będzie patrzeć na ekran i mówić: „Aha, to jest dokładnie to, czego potrzebujemy”. To długi, powtarzalny proces coraz większego rozumienia, czego chcą ich klienci, a następnie podejmowania decyzji i mówienia: „Hej, myślę, że powinniśmy to zbudować. Zróbmy trochę analizy, aby dowiedzieć się, czy uważamy, że jest to właściwa funkcja do zbudowania”.
W trybie naprawdę chodzi o umożliwienie ludziom robienia tego. Chodzi o umożliwienie analitykowi wykonywania tego rodzaju pracy, aby mógł bardzo szybko i łatwo odpowiadać na pytania innym osobom. A potem, jak to rozpowszechniają i upewniają się, że jest to również współpraca z tymi ludźmi – analityk nie może po prostu wpaść w dziurę i odpowiedzieć na te pytania, musi współpracować z menedżerem produktu, aby to zrobić. Właśnie to naprawdę chcemy umożliwić. A kiedy już masz takie odpowiedzi, czy możesz zmienić je w coś wielokrotnego użytku? Czy możesz sprawić, by były łatwe do powrotu, podlegały kontroli i tym podobne? Sednem tego jest pomaganie ludziom, którzy muszą zrozumieć coś na temat swojej działalności i odpowiadać na pytania, umożliwiając im bardziej płynną pracę z analitykami, którzy często odpowiadają za te odpowiedzi.
Liam: Jaka jest historia danych lub przykład, który przyniósł szczęśliwe zakończenie, a taki, który nie za bardzo? Tylko dla ludzi takich jak ja, którzy na przykład zanurzają palec w puli danych.
Benn: Kilka szczęśliwych wyników. Była taka firma, która w zasadzie dostarczała filmy wideo grupie swoich klientów – jej produkt to globalna platforma wideo. Próbowali wymyślić, jak poprawić sytuację ludzi na całym świecie i zdali sobie sprawę, że niektóre kraje mają tendencję do osiągania bardzo dobrych wyników, a inne nie, i nie byli do końca pewni, dlaczego. Mówili: „Och, radzimy sobie świetnie w tym kraju i świetnie w tym kraju, ale nie radzimy sobie tak dobrze w innych.
„[Nasze badania] otworzyły nowe rynki dla tego produktu bez konieczności przechodzenia przez inne rodzaje eksperymentów, które pierwotnie planowali”
Po przeprowadzeniu szeregu analiz i zagłębieniu się w to, zdali sobie sprawę, że filmy były zbyt wolne w niektórych krajach ze względu na lokalizację ich centrów danych lub środowisk AWS. Myśleli, że może to było coś kulturowego, coś związanego z internacjonalizacją, że może zrobili tam coś złego. Może chodziło o coś, co po prostu nie odpowiadało konkretnym odbiorcom lub zostało zaadoptowane przez różne typy ludzi z różnymi przypadkami użycia w różnych krajach. Mieli wiele różnych rzeczy, które mogliby spróbować rozwiązać, na przykład: „Może musimy zainwestować całą masę internacjonalizacji, może musimy zainwestować w różne funkcje, jeśli chcemy sprzedawać tego typu odbiorcom, ponieważ pomyśl o problemach inaczej”. Ponownie była to platforma wideo, więc może musieli zainwestować w inne treści.
Ale skończyło się na czymś prostszym. Aplikacja działała zbyt wolno w tych krajach, ludzie byli sfrustrowani, ponieważ filmy były zbyt buforowane, a to po prostu nie było dobre doświadczenie. Mogli rozwiązać ten problem, mówiąc: „Hej, umieśćmy nasz produkt w większej liczbie centrów danych w AWS” lub w jakimkolwiek produkcie hostingowym, z którego korzystali. Nie jest to trywialne rozwiązanie, ale nie jest to trudne rozwiązanie w porównaniu z koniecznością wymyślenia zupełnie nowych treści dla różnych międzynarodowych odbiorców. Otworzyło to nowe rynki dla tego produktu bez konieczności przechodzenia przez inne rodzaje eksperymentów, które pierwotnie planowali, kiedy zdali sobie sprawę, że odniosły sukces w niektórych krajach, a nie w innych.
Liam: Absolutnie. To świetny przykład.
Benn: Jeśli chodzi o historie z negatywnymi danymi, myślę, że jest kilka przykładów. Z pewnością są przypadki, w których ludzie będą próbować podejmować decyzje oparte na danych i kończą na zrobieniu czegoś, co nie działa. Częścią tego jest natura tego, czym są dane – mówią ci coś mniej lub bardziej probabilistycznie. Jeśli zapytasz: „Czy powinienem postawić na to, że rzucę kostką i że dostanę od jednego do pięciu lub sześciu?” Mógłbym ci powiedzieć: „Właściwą rzeczą, którą powinieneś zrobić, to obstawiać od jednego do pięciu, twoje szanse są na to znacznie wyższe”. To właściwa analiza oparta na danych, ale czasami możesz stracić. Jeśli tworzysz produkt lub podejmujesz decyzję dla firmy, którą możesz podjąć tylko raz, nie możesz wrócić i powiedzieć: „Właściwie zróbmy to jeszcze raz i kontynuuj, aż uzyskasz jeden do pięciu”. Może postawiliśmy od jednego do pięciu i wyrzuciliśmy szóstkę. Tak to idzie.
„To część gry polegającej na dążeniu do większego zorientowania na dane jako produkt i firma — nie zawsze uda się to zrobić dokładnie dobrze”
Istnieje wiele przykładów tego rodzaju rzeczy, w których dane nie są doskonałe. Dane nie przepowiadają przyszłości. Może dać ci pewne wyobrażenie o tym, co może się wydarzyć, ale jest wiele historii o ludziach podejmujących decyzje, prawdopodobnie przeprowadzających analizę naprawdę dobrze, podejmujących słuszną decyzję przed jej podjęciem, a wynik po prostu nie jest układać się. Jedną z rzeczy, o których rozmawiamy z wieloma ludźmi, jest akceptacja tego. To część gry polegającej na dążeniu do większego zorientowania na dane jako produkt i biznes – nie zawsze uda się to zrobić dokładnie. Po prostu nie możesz stracić wiary w to, czym są dane, oczekując, że zawsze będą ci mówić dokładnie, jaka będzie przyszłość.
Syf na wejściu, syf na wyjściu
Liam: Cóż, z drugiej strony, jak ważne jest rozważenie podróży, którą podążają dane, aby dotrzeć na koniec do pulpitu nawigacyjnego?
Benn: Zdecydowanie jest w tym wszystkim proces typu „śmieci wchodzą, wyrzucają śmieci” i myślę, że jest to całkiem dobrze zrozumiane. Większość ludzi rozumie, że jakość danych ma znaczenie. Załóżmy, że próbujemy podejmować decyzje dotyczące naszego lejka sprzedaży i tego, jak dobrze różni klienci poruszają się w lejku sprzedaży oraz które etapy lejka sprzedażowego sprawdzają się dobrze, a które nie, możesz dojść do wniosku, że transakcje zawsze się zawieszają sprawdzamy bezpieczeństwo, gdy rozmawiamy z osobami zajmującymi się IT i bezpieczeństwem o tym, czy nasz produkt spełnia ich standardy, a więc musimy się na tym bardziej skoncentrować. Jeśli nasz wniosek opiera się na danych wprowadzonych ręcznie przez zespół sprzedaży, może to być po prostu część procesu, w której zespół sprzedaży jest niechlujny we wprowadzaniu tych danych do Salesforce, a zatem wniosek ten nie jest odzwierciedleniem rzeczywistości. Musisz wykonać całą pracę z góry, aby upewnić się, że Twoje dane są rzeczywiście dokładne, zanim będziesz mógł wyciągnąć jakiekolwiek rzeczywiste wnioski na ich temat.
„Niekoniecznie fałszują liczby lub używają złych danych – po prostu, gdy szukasz czegoś interesującego, jesteś znacznie bardziej skłonny to znaleźć”
Sądzę, że istnieje inny sposób, w jaki istnieje podobna dynamika wokół tego „śmieci wchodzą, śmieci wychodzą”. Możesz przeprowadzić wiele różnych analiz i powiedzieć, że patrzysz na jakiś problem z 10 różnych perspektyw, a sposób, w jaki na to patrzysz, będzie miał znaczenie. Będzie jakaś perspektywa, która pojawi się w określony sposób i ta analiza sama w sobie może być słuszna. Ale jeśli nie powiesz ludziom: „Hej, próbowaliśmy 10 rzeczy, dziewięć z nich zasugerowało jedną, ale ta dziesiąta zasugerowała coś innego”, a następnie dziesiąta rzecz, która sugerowała coś, co jest odstające, wydaje się być bardzo pozytywna…
Wiele się o tym słyszy w badaniach typu „p-hacking” akademicki, w których ludzie zasadniczo piszą artykuły naukowe i pojawia się pytanie: „Czy szukają wyników?” Odpowiedź brzmi, oczywiście, że są. Nauczyciele akademiccy są za to opłacani. Chcą znaleźć coś interesującego. Niekoniecznie fałszują liczby lub używają złych danych – po prostu szukając czegoś interesującego, jesteś o wiele bardziej skłonny to znaleźć, nawet jeśli ta interesująca rzecz niekoniecznie jest prawdziwa .
Analitycy mogą cierpieć z powodu tej samej tendencji. Naszym zadaniem jest znalezienie czegoś ciekawego. Chcemy być tym, który wstaje na wielkim spotkaniu i mówi: „Sprawdź ten wykres, który pokazuje tę naprawdę dramatyczną rzecz”. Jeśli zawsze szukasz tych rzeczy, znowu, dziewięć razy na 10, nie możesz ich znaleźć. Ale za dziesiątym razem, kiedy to robisz, ważne jest, aby powiedzieć: „Hej, najpierw wypróbowaliśmy kilka innych rzeczy”. To pomaga zrozumieć, czy to, o czym myślisz, że znajdujesz, jest prawdziwe, czy nie.
Liam: W przypadku start-upów, w jaki sposób dane mogą być wykorzystywane do napędzania wzrostu?
Benn: Kilka sposobów. Większość ludzi używa tego jak Growth hacking, który ludzie pejoratywnie nazywają marketingiem, ale możesz go używać w ten sposób. Możesz go użyć, aby lepiej zrozumieć swoich klientów, wiedzieć, z kim rozmawiać. Duży wzrost polega po prostu na znalezieniu właściwych ludzi i przekazaniu im odpowiedniego komunikatu we właściwym czasie, przynajmniej ze szczytu lejka marketingowego. Dane mogą być w tym bardzo ważne. Jak możesz zrozumieć, od tego, kto wchodzi na twój lejek, co mówią i jak daleko zajdą? Kim są ci ludzie i jak docierasz do większej liczby osób, które tak wyglądają?
„Duży wzrost polega na znalezieniu właściwych ludzi i przekazaniu im odpowiedniego przekazu we właściwym czasie, przynajmniej ze szczytu lejka marketingowego. Dane mogą być w tym bardzo ważne”.
Jednak ważniejsze dźwignie często dotyczą zrozumienia, co próbują zrobić Twoi klienci. Ludzie często tworzą produkty i oczekują, że będą używane w określony sposób lub oczekują, że ludzie je polubią z tego czy innego powodu, a ludzie nie zawsze lubią to z tych powodów. Istnieje wiele funkcji, które zbudowaliśmy w Mode lub które słyszeliśmy od naszych klientów, którzy mówili: „O tak, to będzie świetna rzecz dla X”. I okazuje się, że to nie jest powód, dla którego ludziom się to podoba, ale może im się to spodobać dla Y. Chyba że patrzysz na dane, aby zrozumieć zachowania ludzi i próbujesz zrozumieć, co motywuje ich do robienia tych rzeczy, często myślisz: „Świetnie, uruchomiliśmy funkcję, która była naprawdę dobra do tego i dlatego ludzie jej używają. Tak więc naprawdę będziemy się do tego skłaniać”. Ale może być tak, że grasz przeciwko sposobowi, w jaki ludzie próbują używać produktu, i zamiast tego powinieneś powiedzieć: „Hej, używają go dla Y. Zbudujmy naprawdę sposoby, aby umożliwić im to Rzecz w tym.

„Chodzi o znalezienie rzeczywistego dopasowania produktu do rynku, a nie tego, który zakładasz, że masz”
Na przykład była taka firma, która była rodzajem czatu zasadniczo do pracy. Był to produkt oparty na współpracy, rodzaj produktu typu Slack, który był skoncentrowany na urządzeniach mobilnych. Początkowo myśleli, że będzie to świetny sposób komunikowania się pracowników pierwszej linii. Byłby to świetny sposób na komunikację dla osób, które nie mają adresów e-mail. Jeśli jesteś kasjerem w 7-11, możesz nie mieć adresu e-mail 7-11, ale potrzebujemy sposobu, aby móc rozmawiać z tymi osobami w firmie. To była aplikacja do tego. Dostali pewną adopcję i myśleli, że to z powodu tych ludzi, którzy nie mieli adresów e-mail, ale po przejrzeniu wielu danych zdali sobie sprawę, że w rzeczywistości byli to ludzie, którzy musieli być w biurze i poza nim. . Najbardziej użyteczną rzeczą nie było to, że nie mieli adresu e-mail – po prostu byli z dala od komputera. Zasadniczo używali go jako zamiennika WhatsApp dla czatu firmowego.
Tak więc, gdyby myśleli, że chodzi o ludzi bez adresu e-mail, mogliby zbudować wiele funkcji, w których rejestrujesz się za pomocą swojego numeru telefonu, gdzie robisz wiele rzeczy, które umożliwiają zrobienie tego, gdzie nie nie masz komputera stacjonarnego. Ale tym, czego ludzie naprawdę chcieli, było to doświadczenie, w którym mogliby czasami korzystać z komputera, a potem odejść od niego i mieć naprawdę świetne wrażenia z urządzeń mobilnych, gdy są w drodze, lub gdy realizują dostawę, czy cokolwiek innego. To tworzy zupełnie inną ścieżkę dla tego produktu i firmy, ale nigdy by tego nie zrozumieli, chyba że spojrzeliby na dane, aby zrozumieć ludzi, którzy faktycznie z nich korzystali i co próbowali z nimi zrobić. Chodzi o znalezienie rzeczywistego dopasowania produktu do rynku, a nie tego, który zakładasz.
Nowe narzędzia, te same problemy
Liam: Jak teraz wygląda współczesny stos danych?
Benn: Nowoczesny stos danych to termin określający nowy zestaw narzędzi do przetwarzania danych, który jest opracowywany na podstawie produktów danych przenoszonych do chmury. Sednem tego jest hurtownia danych. Przed 2010 rokiem każda firma, która potrzebowała hurtowni danych, czyli miejsca, w którym przechowujesz wszystkie swoje dane, musiałaby zazwyczaj kupić coś, fizyczną maszynę lub fizyczne oprogramowanie, na przykład na płycie CD, które następnie uruchomiłaby na maszynie, którą posiadać. Mielibyśmy serwerownię z tyłu, która jest naszą bazą danych, i uruchomilibyśmy na niej jakąś bazę danych Oracle i tak dalej. Zasadniczo dzięki Redshift, który był jednym z pierwszych hurtowni danych w chmurze, ludzie zaczęli przenosić to wszystko do chmury. Zamiast kupować maszynę lub oprogramowanie, mogę po prostu przejść do AWS i powiedzieć „Uruchom dla mnie bazę danych Redshift”, mogę to zrobić z mojej przeglądarki w 15 minut i nie muszę mieć żadnej sprzęt, aby to zrobić. Na tym pomyśle zbudowano kilka narzędzi: „A co by było, gdybyśmy wszystkie nasze dane działały w chmurze i nie musielibyśmy mieć całego tego oprogramowania, które sami uruchamiamy?” Nowoczesny stos danych opiera się na tym, jak wygląda przeniesienie danych do chmury. Można to zdefiniować na kilka sposobów. Ale ogólnie buduje te bardzo horyzontalne produkty, które po prostu pobierają dane z aplikacji innych firm.
„Doszliśmy do dramatycznej poprawy jakości technologii, ale podstawowe problemy, które próbujemy rozwiązać, są często uporczywie uporczywe”
Załóżmy, że masz dane w Salesforce, Zendesk, Marketo lub Stripe, produktach, które po prostu przyjmą te dane do magazynu. Masz produkty, które to przekształcą i zamodelują w Twoim magazynie – powiedzmy, że masz mnóstwo niechlujnych danych, które chcesz przekształcić w czyste dane, więc masz produkty, które to zrobią. Magazyn sam zrobi magazyn. Istnieją narzędzia analityczne, takie jak Mode, które znajdują się nad nim do pulpitów nawigacyjnych, do analizy, aby móc udostępniać i rozpowszechniać tę pracę. A potem istnieje wiele innych narzędzi, które zostały zbudowane, aby je obsługiwać. Teraz, gdy masz pięć lub sześć narzędzi obsługujących oprzyrządowanie danych, chcesz mieć możliwość monitorowania ich wszystkich. Czy wszystko działa dobrze? Czy potoki z punktu A do punktu B działają i działają zgodnie z oczekiwaniami? Jeśli chcę dokonać zmiany w jednej, jak mam zaaranżować tę zmianę w systemie?
To staje się coraz bardziej złożonym ekosystemem, ale wszystko opiera się na tym podstawowym przepływie, w jakiś sposób na przyjmowanie danych do hurtowni, w jakiś sposób na przekształcenie ich w hurtowni, w jakiś sposób na tworzenie zasobu danych na bazie danych w hurtowni , a następnie jakiś sposób na wysłanie go do tego, kto rzeczywiście musi go zobaczyć.
Liam: To może być tak trudne, aby wszyscy zgodzili się na liczby, gdy masz różne pulpity nawigacyjne i narzędzia, które mówią ci różne rzeczy. Czy to wyzwanie?
Benn: Tak. To jeden z paradoksów obecnego stanu współczesnego stosu danych. Teraz spędziliśmy blisko 10 lat na tworzeniu tych produktów i są one rewolucyjne pod wieloma względami. Robią rzeczy znacznie lepiej i znacznie szybciej niż 10 lat temu. Jakieś 10 lat temu, na najwyższej klasy bazy danych, trzeba by wydać, powiedzmy, milion dolarów rocznie, aby je uruchomić. Musiałbyś zapłacić za maszyny, które go obsługują. Zwykle musiałbyś mieć jedną lub dwie osoby, których praca na pełny etat polegała na zarządzaniu tym. Dzisiaj możesz zdobyć magazyny szybciej niż te, które będą kosztować 20 000 $ rocznie i nie musisz mieć nikogo, kto by nimi w pełni zarządzał. Mogę wejść na AWS, nacisnąć guzik i zapłacić dziesiątki tysięcy dolarów za coś, co kosztowało mnie prawdopodobnie kilka milionów dolarów rocznie. I to lepszy produkt.
Możesz złożyć to samo roszczenie w całym stosie. W ten sposób udoskonalono narzędzia analityczne. W ten sposób udoskonalono narzędzia do pozyskiwania danych i narzędzia do potoku. Osiągnęliśmy radykalną poprawę jakości technologii, ale podstawowe problemy, które próbujemy rozwiązać, są często uporczywie uporczywe. Jednym z tych podstawowych problemów, które mieliśmy 10 lat temu, były dwie osoby, które weszły do pokoju i stwierdziły: „Mój pulpit tak mówi”, a ktoś inny: „Mój pulpit tak mówi”. Spędzają całe spotkanie, zamiast zastanawiać się, co zrobić, kłócąc się o to, czyja liczba jest właściwa. I nadal to robimy, wciąż jest tego dużo.
„Marketing i sprzedaż istnieją od setek lat. Wciąż jesteśmy na wczesnym etapie zastanawiania się, jak to wygląda w przypadku zawodu danych”
Słyszałem przemówienie dyrektora generalnego Databricks, jednego z tych naprawdę nowoczesnych magazynów, które napędzają tę zmianę. Mówił, że jedną z najczęstszych skarg, jakie słyszysz od klientów, jest to, że ludzie spędzają cały swój czas na kłótni o liczby i która z nich jest słuszna. Myślę, że częścią rozwiązania tego problemu będzie dalsze tworzenie narzędzi, które mogą ze sobą komunikować się i lepiej ze sobą współpracować, oraz systemów, które pozwalają nam definiować rzeczy raz, tak aby patrząc na pulpit nawigacyjny, wiemy, że ciągnie się z tego samego miejsca . Ale częścią tego będzie również po prostu organizacje zastanawiające się, jak pracować z danymi. Dane to wciąż stosunkowo nowa rzecz. Większość firm zaczęła z niego korzystać w realny sposób w ciągu ostatnich 10, 15 lat. Nadal zastanawiamy się, jak to zrobić. W społeczności wciąż toczy się wiele rozmów na temat różnych ról, których potrzebujemy, do czego służą i kto jest za co odpowiedzialny.
Inżynieria nie była praktyką, która rozwinęła się z dnia na dzień. IT nie była praktyką, która rozwinęła się z dnia na dzień. Marketing i sprzedaż istnieją od setek lat. Wciąż jesteśmy na wczesnym etapie zastanawiania się, jak to wygląda w przypadku zawodu danych. Myślę, że będzie to połączenie narzędzi, które tworzymy i po prostu wszyscy zaczynają zdawać sobie sprawę: „Tak to działa, a tak nie jest”, zanim naprawdę przejdziemy przez to, co wydaje się fundamentalnymi problemami .
Liam: Absolutnie. Myślę, że każdy z różnych branż będzie miał swoje własne historie. Myślę, że metryki podcastów są prawdopodobnie dobrym przykładem komplikacji z danymi. Pobieranie zwykle nie jest równe całkowitej liczbie słuchaczy, ponieważ pojedynczy słuchacz mógł pobrać ten sam odcinek na wiele urządzeń lub mógł go pobrać z zamiarem odsłuchania, ale nigdy się do tego nie udało. Wiem, że próbują wprowadzić ustandaryzowany sposób mierzenia tych rzeczy, co prawdopodobnie będzie miało miejsce we wszystkich dziedzinach, jak sądzę, w wielu branżach.
Benn: Jeśli pomyślisz o podstawowych wskaźnikach marketingu internetowego oraz o tym, jak ludzie wyświetlają reklamy i inne rzeczy, zaczęliśmy ujednolicać niektóre z nich. Jeśli przejdziesz do panelu reklam na Facebooku lub panelu reklam Google, te rzeczy będą wyglądać całkiem podobnie. Opowiedzą mniej więcej tę samą historię, ponieważ wprowadzono pewną standaryzację tego, jak właściwie rozmawiamy i ustalamy, które reklamy są skuteczne, a które nie. Widzisz to z kilkoma innymi rzeczami. Widać to na przykład w firmach SaaS. Firmy SaaS mają teraz standardową księgę metryk, z której wszystkie czerpią. Jest kilka miejsc, w których zaczynamy widzieć tę koalescencję, ale w nadchodzących latach będzie tego znacznie więcej, gdzie zastanawiamy się, jak myślimy o podcastach? Jak myślimy o poszczególnych rodzajach produktów? Jak myślimy o mierzeniu wydajności zespołu wsparcia? Jak myślimy o tych wszystkich różnych rzeczach, które są danymi, o których mamy teraz o wiele bogatsze informacje, ale każda firma wciąż stara się rozgryźć indywidualnie?
„Będziemy dostosowywać się do najlepszych praktyk, a nie wszyscy próbują robić to od zera”
Myślę, że wokół pojawi się pewna standaryzacja: „To prawdopodobnie najlepsza praktyka do myślenia o tego rodzaju problemach”. Firmy nadal będą oczywiście miały pewne niestandardowe raporty, które muszą zrobić. Ten podcast może chcieć mierzyć rzeczy inaczej niż ten inny podcast, ponieważ możesz mieć różnych odbiorców lub różne cele. Każdy będzie miał swoje własne poprawki, ale myślę, że będzie o wiele lepsze poczucie: „Ok, tak wszyscy zgadzamy się, że działa”. Będziemy dostosowywać się do najlepszych praktyk, a nie wszyscy próbują robić to od zera. Wiele firm, które rozpoczynają swoje praktyki związane z danymi, często próbuje budować rzeczy od podstaw. Myślę, że mamy jeszcze trochę drogi, zanim dojdziemy do punktu, w którym będziecie mieli rusztowanie, na którym wszyscy możemy zbudować.
Frameworki internetowe w pewnym sensie są tego przykładem. Jeśli chcesz zbudować produkt sieciowy lub oprogramowanie, możesz skorzystać z dość dobrze zdefiniowanych schematów, z których możesz następnie dodać własną logikę, aby Twoja aplikacja była dokładnie taka, jakiej chciałeś. Analytics po prostu tego nie ma. Wszyscy zaczynają od zera, zamiast mieć taki podstawowy framework, na którym mogą budować.
Liam: Co byś powiedział startupom zniechęconym danymi, które wpatrują się w to wszystko i czują się trochę zaniepokojone?
Benn: To może się zdarzyć w przypadku start-upów, ale może się też zdarzyć w firmach dojrzałych do przetwarzania danych z indywidualnymi analitykami. Łatwo jest wpatrywać się w pustą stronę lub przeładowany arkusz kalkulacyjny Excela i myśleć: „Co u licha mam robić?” Łatwo to zrobić, jeśli jesteś doświadczonym analitykiem, który dopiero zaczyna rozumieć problem, łatwo to zrobić, jeśli jesteś firmą, która jeszcze nie wie, co zrobić z danymi, i łatwo to zrobić, jeśli jesteś młodszy analityk, który właśnie gdzieś dołączył i nie jest pewien, co robić.
„Można zacząć od rzeczy, które są naprawdę proste. To niezwykłe, ile podstawowych informacji ludzie uznają za wartościowe”
Myślę, że rozwiązanie tego jest takie samo – można zacząć od rzeczy, które są naprawdę proste. To niezwykłe, ile podstawowych informacji ludzie uznają za wartościowe. Znam faceta, który raz w tygodniu spotykał się ze swoim zespołem danych, aby zasadniczo dzielili się tym, czego nauczyli się w ciągu tygodnia. Niektóre z tych rzeczy były głupio proste. Firma była produktem stworzonym dla firm, więc była używana od poniedziałku do piątku. Stworzyli wykres pokazujący, ile osób używa go w dzień tygodnia, i hej, większość ludzi nie używa go w weekendy, a wiele osób używa go w dni powszednie. Nie odkrywasz tam jakiegoś niesamowitego wglądu. Wszyscy już wiedzieli, jak to działa, ale widząc te liczby i dokładnie, jak bardzo spadło w weekendy – były weekendy, w których nie spadało zbyt wiele, a niektóre weekendy, w których spadło tony – wygenerowało mnóstwo pytań i ciekawości wokół tego, co napędza takie zachowanie. Dlaczego ten weekend jest taki, w którym ludzie często go używają? Co tu się stało? To było zalążek wielu słów: „W porządku, kontynuujmy naukę. Zadawajmy dalej pytania. Kontynuujmy kopanie.”
W ten sposób zachęcam ludzi do rozpoczęcia. Po prostu zacznij od podstawowych rzeczy, nawet jeśli są to założenia, które robisz. Gdy tylko zaczniesz patrzeć na liczby, zobaczysz rzeczy, które sprawią, że zaczniesz myśleć, drapać się po głowie i uświadamiać sobie, że jest tu o wiele więcej rzeczy, których nie rozumiesz, że jesteś ciekawy. Wiele z tego to po prostu poddanie się tej ciekawości i nie mówienie: „Muszę odkryć jakąś niesamowitą rzecz. Muszę znaleźć tę igłę w stogu siana, która zmieni trajektorię firmy już pierwszego dnia”. You're not going to find that right away. The way you're going to find it is by just poking around, seeing things that are interesting, and letting yourself explore those interesting things when you find them.
Always tinkering
Liam: You're clearly so passionate about data. I was just wondering where that came from.
Benn: Part of it is working in it for a long time and just getting to know it. Part of it, though, is that I think it's fun to figure stuff out like this. I was talking to someone about flying from New York to San Francisco a couple days ago, and it's a flight that I've made a good bit, and they had made it a good bit, too. They were saying that when they were flying back on a Delta flight, it felt way faster than when they were flying on a United flight. Why is Delta faster on this? And it made me think: are there some airlines that are just able to fly faster? It doesn't seem like that would be true, but does that actually hold up? The Department of Transportation releases raw data on every flight in the US. Where it started, where it ended, what time it took off, when it landed – all of that stuff.
“I'm just naturally prone to want to play around with that and understand it. I don't really have an explanation as to why that is other than I find it fun”
I just started playing around with it, trying to figure this out. I looked at different routes and was like, “Are there changes in the speed of different airlines? Are planes flying faster at different times of day, at different times of the year?” As you get into it, it just became interesting to see… I don't know any of this stuff. I don't know how fast planes fly or why they fly at different speeds on the same routes or whatever, but it was interesting. There were actually some airlines that were consistently a couple minutes faster. I don't know why that would be. It was never by much, but it was basically like 90 seconds of difference fairly consistently between a couple airlines. I don't know, maybe they just have different guidelines or something. That sort of thing, I think, is what makes me interested in it. I'm just naturally prone to want to play around with that and understand it. I don't really have an explanation as to why that is other than I find it fun. That really drew me to the job in the first place. Then, once you get into it, you start to see all these other things that you could be doing that are fascinating and fun.
Liam: That's great. Co dalej? Have you any particular plans or projects for 2022?
Benn: I mean, continuing to do the Mode thing. I think there's a lot of stuff on that front that we're excited about, a lot of new things we're building. The direction of the space is one we're very excited about. Personally, last year I basically started writing a lot more on Substack, and that's been fun. It's been good to get some of the thoughts out about these ideas, have conversations with the people in the community and see where things go. We're planning on being much more involved in that. I don't know exactly where that goes, and part of this is, again, letting myself be curious about it, do the things I enjoy, and if I find stuff that's fun and other people seem to enjoy, then giving myself the permission to continue to do it.
Liam: I was going to ask where our listeners can go to keep up with you and your work, definitely the Substack. I think it's Benn.substack.com. Is that right?
Benn: That's correct. The two places would be mainly there and Twitter. I'm not the most active Twitter person in the world, so Substack is better for some of the more interesting things. But my Twitter handle is @BennStancil, and there's also LinkedIn if you want to connect professionally.
Liam: I've been reading lots of your posts and they're great, so I would definitely recommend everyone go and subscribe to Benn's Substack. Thank you so much for chatting with us, Benn.
Benn: For sure. Thanks again for having me. This was fun.