Benn Stancil, pendiri Mode, tentang bagaimana ilmu data dapat membantu kita membuat keputusan yang lebih baik

Diterbitkan: 2022-05-06

Analisis data bukan tentang memuntahkan dasbor mewah – ini adalah proses kolaboratif yang panjang, berulang, yang membantu Anda untuk lebih memahami apa yang diinginkan pelanggan, dan cara mencapainya.

Atau lebih tepatnya, seharusnya begitu. Gambaran stereotip dari sebuah ruangan yang penuh dengan monitor dan dasbor yang rumit di mana semua keputusan dibuat tidak nyata, dan sudah saatnya kita menjauh darinya. Menurut Benn Stancil, salah satu pendiri dan Chief Analytics Officer di balik Mode, sebuah platform yang dirancang untuk membantu analis data dan ilmuwan data menganalisis, memvisualisasikan, dan berbagi data, banyak pekerjaan sehari-hari mereka yang sebenarnya melibatkan duduk bersama manajer produk dan pemimpin bisnis, mengutak-atik berbagai hal, mencoba memecahkan masalah bisnis bersama.

Faktanya, data science sebagai sebuah bidang masih tergolong baru. Jadi, banyak pemimpin bisnis merasa tidak yakin bagaimana memulai, bagaimana memanfaatkannya, atau apa yang harus dilakukan ketika semua dasbor dan alat tampaknya menunjuk pada solusi yang berbeda. Namun seperti yang ditunjukkan Benn, masa depan analisis data bukanlah diagram arsitektur atau pemimpin bisnis yang melihat dasbor – melainkan membangun pengalaman, dan pada saat itu sangat menarik.

Minggu ini, kami dengan senang hati mengobrol dengan Benn tentang tumpukan data modern dan bagaimana data dapat – dan yang lebih penting, harus – digunakan untuk mendorong pertumbuhan.

Jika Anda kekurangan waktu, berikut adalah beberapa takeaways cepat:

  • Meskipun ilmu data tidak dapat memprediksi masa depan, itu pasti dapat membantu Anda memfokuskan sumber daya, memecahkan masalah, dan bahkan membuka pasar baru.
  • Wawasan apa pun dari analisis data hanya akan sebaik data itu sendiri. Pastikan data Anda akurat sebelum Anda menarik kesimpulan apa pun tentangnya.
  • Kecuali Anda melihat data untuk memahami mengapa pelanggan Anda menggunakan produk Anda, hindari membuat keputusan berdasarkan ekspektasi Anda tentang motivasi mereka.
  • Seperti yang kita lihat lebih banyak standarisasi atas praktik terbaik untuk menangani data, tidak perlu lagi merancang proses dari awal, melainkan membangun di atas dan menyesuaikannya dengan setiap kasus penggunaan.
  • Melihat baris dan kolom tanpa akhir dapat menjadi hal yang menakutkan bahkan untuk seorang analis data berpengalaman. Jika ragu, mulailah mengaduk-aduk beberapa asumsi produk dasar dan mulai dari sana.

Jika Anda menikmati diskusi kami, lihat lebih banyak episode podcast kami. Anda dapat mengikuti di iTunes, Spotify atau mengambil umpan RSS di pemutar pilihan Anda. Berikut ini adalah transkrip episode yang diedit dengan ringan.


Masuk ke analitik

Liam Geraghty: Benn, terima kasih banyak telah bergabung dengan kami hari ini.

Benn Stancil: Senang berada di sini.

Liam: Pertama-tama, bisakah Anda memberi tahu kami sedikit tentang latar belakang Anda, apa yang Anda lakukan dan bagaimana Anda sampai pada titik ini?

Benn: Pada dasarnya saya memulai karir saya di dunia yang sama sekali berbeda. Saya mulai di dunia kebijakan sebagai peneliti ekonomi di sebuah think tank. Saya menghabiskan beberapa tahun di sana, sangat menyukai pekerjaan itu, dan menyukai gagasan yang pada dasarnya mencoba memecahkan masalah dengan data. Tugas saya adalah melihat apa yang terjadi dalam ekonomi dunia – seperti tahun 2010 saat itu, dan semuanya berantakan – dan kemudian melihat data tentangnya dan mencoba memberikan rekomendasi tentang apa yang harus dilakukan oleh pembuat kebijakan .

Secara konseptual itu sangat menarik, tetapi jika Anda membuat rekomendasi tentang apa yang harus dilakukan The Fed sebagai orang junior di sebuah lembaga think tank, tidak ada yang benar-benar memperhatikan Anda. Saya suka ide melakukan pekerjaan semacam itu, tetapi saya ingin melakukannya dengan cara yang lebih langsung terkait dengan masalah yang coba dipecahkan orang, di mana Anda benar-benar dapat melihat apakah ide atau rekomendasi Anda berhasil. Begitulah cara saya akhirnya pindah dari pekerjaan itu ke pekerjaan analitik di sebuah perusahaan teknologi di San Francisco. Itu adalah pekerjaan pertama saya di bidang teknologi. Saya bekerja di sana selama beberapa tahun sebagai analis atau ilmuwan data. Saya adalah tipe orang yang tugasnya bekerja dengan pemasar, manajer produk, atau orang-orang operasi untuk membantu mereka membuat keputusan tentang produk mana yang akan dikirim, audiens mana yang akan ditargetkan, atau apakah bisnis berkinerja baik di area tertentu dan tidak baik di yang lain. Itu mirip dengan apa yang saya lakukan di DC tetapi diterapkan ke domain yang sangat berbeda.

“Perjalanan sebuah perusahaan yang terdiri dari tiga orang yang bekerja dari ruang tamu seseorang menjadi sesuatu yang terdiri dari ratusan orang adalah perjalanan di mana Anda terus-menerus menemukan hal-hal baru”

Dari sana, saya bertemu dengan beberapa orang, mulai menyadari kebutuhan orang-orang seperti saya dan alat seperti apa yang kami inginkan, alat apa yang belum ada, dan akhirnya membuat Mode berdasarkan visi itu.

Liam: Apakah sulit untuk mencapai titik ini dengan Mode dalam perjalanan startup?

Ben: Pasti . Setiap startup akan menjadi tantangan, dan Mode tidak berbeda. Mode telah mengalami banyak pasang surut. Di satu sisi, ini sangat menantang. Setiap hari Anda mengerjakan masalah yang berbeda, hal-hal yang tidak pernah Anda antisipasi sebelumnya. Seperti yang saya yakin Anda ketahui dengan baik, perjalanan sebuah perusahaan yang terdiri dari tiga orang yang bekerja dari ruang tamu seseorang menjadi sesuatu yang terdiri dari ratusan orang adalah perjalanan di mana Anda terus-menerus menghadapi hal-hal baru, di mana masalah yang Anda hadapi di bulan pertama adalah berbeda dari masalah yang Anda miliki di bulan kedua.

Setiap hari, Anda harus mempelajari beberapa hal baru yang belum pernah Anda pikirkan untuk dipecahkan sebelumnya. Ini tidak seperti, "Saya akan menjadi sangat baik dalam hal khusus ini." Sama seperti Anda menjadi baik dalam hal itu, Anda ke yang berikutnya. Dalam hal ini, itu sangat menantang. Namun, kami memiliki tim yang hebat. Ada orang-orang hebat yang mendukung perusahaan, apakah mereka karyawan atau bukan, apakah mereka pelanggan awal atau bukan, apakah mereka hanya teman dan keluarga, dan tipe orang yang tahan dengan Anda sebagai Anda akan bersama dengan itu. Ini merupakan kerja keras, tetapi ini merupakan pengalaman yang sangat bagus, mendapat dukungan dari begitu banyak orang untuk melakukannya. Saya pikir orang-orang di Silicon Valley sangat istimewa memiliki seluruh ekosistem yang didedikasikan untuk membantu mereka dan perusahaan mereka sukses. Jika Anda melakukan ini di tempat lain, saya pikir itu akan jauh lebih sulit.

Data apa yang bisa dan tidak bisa dilakukan

Liam: Ilmu data adalah semua tentang bisnis yang ingin meningkatkan pengambilan keputusan mereka dengan menggunakan informasi yang sudah mereka kumpulkan di aplikasi dan sistem lainnya. Di sinilah Mode perusahaan Anda masuk. Bisakah Anda memberi tahu kami sedikit tentang platform yang Anda buat dan bagaimana hal itu membantu ilmuwan data?

Ben: Pasti . Perusahaan menggunakan data dalam banyak cara yang berbeda. Cara mudah untuk memikirkannya adalah dengan memikirkan apa yang Anda lihat dalam karikatur di film dan lainnya, seperti ruangan yang penuh dengan dasbor dan bagan tempat orang membuat keputusan. Itu jelas tidak terjadi. Orang-orang memiliki dasbor dan kami semua memeriksa bagaimana kinerja perusahaan dan hal-hal semacam itu. Tetapi banyak pekerjaan sehari-hari yang sebenarnya menggunakan data secara efektif berasal dari pakar data yang duduk dengan pakar bisnis yang mencoba memecahkan masalah bersama dan menjawab pertanyaan yang mereka miliki untuk membantu mereka membuat beberapa keputusan.

“Manajer produk tidak akan melihat layar dan berkata, 'Aha, inilah yang kami butuhkan'”

Bayangkan Anda adalah seorang manajer produk yang ingin memutuskan produk mana yang akan dibuat. Anda mungkin ingin memahami bagaimana orang menggunakan fitur saat ini yang ingin Anda ubah. Apakah tipe orang yang berbeda menggunakannya dengan cara yang berbeda? Apakah ada hal-hal yang mereka coba lakukan tetapi mereka kesulitan? Bisakah mereka mencapai tujuan yang mereka miliki? Semua hal itu memerlukan pertanyaan yang sangat khusus ini, dan ini bukan proses yang akan Anda jawab dengan melihat dasbor. Manajer produk tidak akan melihat ke layar dan berkata, "Aha, inilah yang kami butuhkan." Ini adalah proses yang panjang dan berulang untuk memahami lebih banyak dan lebih banyak lagi apa yang diinginkan pelanggan mereka, kemudian mengambil keputusan dan berkata, “Hei, saya pikir kita harus membangun ini. Mari lakukan beberapa analisis untuk mencari tahu apakah menurut kami itu fitur yang tepat untuk dibuat.”

Mode benar-benar tentang memungkinkan orang melakukan itu. Ini tentang memungkinkan analis itu melakukan pekerjaan semacam itu sehingga mereka dapat dengan cepat dan mudah membantu menjawab pertanyaan orang lain. Dan kemudian, bagaimana mereka mendistribusikannya dan memastikannya kolaboratif dengan orang-orang itu juga – seorang analis tidak bisa begitu saja masuk ke dalam lubang dan menjawab pertanyaan-pertanyaan ini, mereka harus bekerja bersama manajer produk untuk melakukannya. Itulah yang benar-benar ingin kami aktifkan. Dan begitu Anda memiliki jawaban seperti itu, dapatkah Anda mengubahnya menjadi sesuatu yang dapat digunakan kembali? Bisakah Anda membuatnya sehingga mudah untuk kembali dan dapat diaudit dan semua hal semacam itu? Pada intinya, ini tentang membantu orang-orang yang perlu memahami sesuatu tentang bisnis mereka dan menjawab pertanyaan dengan memungkinkan mereka bekerja lebih lancar dengan analis yang sering kali mendorong jawaban tersebut.

Liam: Apa cerita atau contoh data yang memiliki hasil yang bahagia dan yang tidak? Hanya untuk orang-orang seperti saya yang mencelupkan kaki mereka ke dalam kumpulan data, misalnya.

Benn: Beberapa hasil yang menyenangkan. Ada perusahaan yang pada dasarnya menyajikan video ke sekelompok pelanggan mereka – produk mereka adalah platform video global. Mereka mencoba mencari cara untuk membuatnya lebih baik bagi orang-orang di seluruh dunia, dan mereka menyadari bahwa beberapa negara cenderung berkinerja sangat baik dan beberapa negara tidak, dan mereka tidak yakin mengapa. Mereka seperti, “Oh, kami hebat di negara ini dan hebat di negara ini, tapi tidak hebat di negara lain ini.

“[Penelitian kami] membuka pasar baru untuk produk ini tanpa mereka harus melalui eksperimen jenis lain yang awalnya mereka rencanakan”

Setelah melakukan banyak analisis dan menggali ke dalamnya, mereka menyadari bahwa video terlalu lambat di negara tertentu karena lokasi pusat data atau lingkungan AWS mereka. Mereka mengira mungkin itu sesuatu yang bersifat budaya, sesuatu tentang internasionalisasi, bahwa mungkin mereka telah melakukan sesuatu yang salah di sana. Mungkin itu adalah sesuatu tentang produk yang tidak beresonansi dengan audiens tertentu atau yang diadopsi oleh tipe orang yang berbeda dengan kasus penggunaan yang berbeda di negara yang berbeda. Mereka memiliki banyak hal berbeda yang dapat mereka coba selesaikan, seperti, “Mungkin kita harus menginvestasikan sejumlah besar internasionalisasi, mungkin kita harus berinvestasi dalam fitur yang berbeda jika kita ingin menjual ke jenis audiens ini karena mereka memikirkan masalah secara berbeda.” Sekali lagi, itu adalah platform video, jadi mungkin mereka harus berinvestasi dalam konten yang berbeda.

Tapi itu akhirnya menjadi sesuatu yang lebih sederhana. Aplikasi ini terlalu lambat di negara-negara ini, orang-orang menjadi frustrasi karena video akan buffer terlalu banyak, dan itu bukan pengalaman yang baik. Mereka dapat menyelesaikannya dengan mengatakan, “Hei, mari letakkan produk kami di lebih banyak pusat data di AWS,” atau di produk hosting apa pun yang mereka gunakan. Ini bukan solusi sepele, tapi ini bukan solusi sulit dibandingkan dengan harus mencari cara untuk membuat konten yang sama sekali baru untuk audiens internasional yang berbeda. Ini membuka pasar baru untuk produk ini tanpa mereka harus melalui jenis eksperimen lain yang awalnya mereka rencanakan ketika mereka menyadari bahwa mereka berhasil di beberapa negara dan tidak di negara lain.

Liam: Tentu saja. Itu contoh yang bagus.

Benn: Dalam hal cerita data negatif, saya pikir ada beberapa contoh. Pasti ada kasus di mana orang akan mencoba membuat keputusan berdasarkan data dan akhirnya membuat sesuatu yang tidak berhasil. Bagian dari itu adalah sifat dari apa itu data – ia memberi tahu Anda sesuatu yang kurang lebih secara probabilistik. Jika Anda bertanya, “Haruskah saya bertaruh pada saya melempar dadu dan saya mendapatkan antara satu dan lima atau enam?” Saya dapat memberi tahu Anda, “Hal yang benar yang harus Anda lakukan adalah bertaruh pada satu sampai lima, peluang Anda jauh lebih tinggi untuk itu.” Itu adalah analisis berbasis data yang tepat, tetapi terkadang Anda mungkin kalah. Jika Anda sedang membangun sebuah produk atau membuat keputusan untuk bisnis yang hanya dapat Anda buat sekali, Anda tidak dapat kembali dan berkata, “Sebenarnya, mari kita gulung lagi dan terus bergulir sampai Anda mendapatkan satu sampai lima.” Mungkin kami bertaruh pada satu sampai lima dan kami menggulung enam. Begitulah caranya.

“Itu bagian dari permainan untuk mencoba lebih berorientasi pada data sebagai produk dan bisnis – Anda tidak selalu akan melakukannya dengan benar”

Ada banyak contoh hal semacam itu di mana data tidak sempurna. Data tidak akan memberi tahu Anda masa depan. Ini dapat memberi Anda gambaran tentang apa yang mungkin terjadi, tetapi ada banyak cerita tentang orang yang membuat keputusan, mungkin melakukan analisis dengan sangat baik, membuat keputusan yang tepat sebelum dibuat, dan hasilnya tidak berjalan baik. Salah satu hal yang kami bicarakan dengan banyak orang adalah baik-baik saja dengan itu. Itu bagian dari permainan untuk mencoba lebih berorientasi pada data sebagai produk dan bisnis – Anda tidak akan selalu melakukannya dengan benar. Anda tidak bisa kehilangan kepercayaan pada data apa itu dengan mengharapkannya untuk selalu memberi tahu Anda apa yang akan terjadi di masa depan.

Sampah masuk sampah keluar

Liam: Nah, di balik itu, seberapa pentingkah untuk mempertimbangkan perjalanan yang diikuti data untuk mencapai dasbor di akhir?

Benn: Pasti ada jenis proses "sampah masuk, sampah keluar" untuk semua ini, dan saya pikir itu cukup dipahami. Kebanyakan orang memahami bahwa kualitas data penting. Katakanlah kami mencoba membuat keputusan tentang jalur penjualan kami dan seberapa baik pelanggan yang berbeda bergerak melalui jalur penjualan dan tahap mana dari saluran penjualan yang berkinerja baik dan mana yang tidak, Anda mungkin sampai pada kesimpulan bahwa kesepakatan selalu terhenti dalam tinjauan keamanan ketika kami berbicara dengan orang-orang di TI dan keamanan tentang apakah produk kami memenuhi standar mereka atau tidak, jadi, kami perlu lebih fokus pada hal itu. Jika kesimpulan kami didasarkan pada data yang dimasukkan secara manual oleh tim penjualan, mungkin itu bagian dari proses di mana tim penjualan lebih ceroboh dalam memasukkan data tersebut ke Salesforce, dan oleh karena itu, kesimpulan itu bukan cerminan. dari kenyataan. Anda harus melakukan semua pekerjaan di muka untuk memastikan data Anda benar-benar akurat sebelum Anda dapat menarik kesimpulan nyata tentangnya.

“Bukan berarti mereka memalsukan angka atau menggunakan data yang buruk – hanya saja ketika Anda mencari sesuatu yang menarik, Anda cenderung menemukannya”

Ada cara lain di mana saya pikir ada dinamika serupa di sekitar "sampah masuk, sampah keluar." Anda dapat melakukan banyak analisis yang berbeda, dan mengatakan Anda melihat beberapa masalah dari 10 perspektif yang berbeda, cara Anda melihatnya akan penting. Akan ada beberapa perspektif yang muncul dengan cara tertentu, dan analisis itu, dengan sendirinya, mungkin masuk akal. Tetapi kecuali Anda memberi tahu orang-orang, "Hei, kami mencoba 10 hal, sembilan di antaranya menyarankan satu hal, tetapi yang ke-10 ini menyarankan sesuatu yang lain," dan kemudian hal ke-10 yang menyarankan hal yang outlier tampaknya sangat positif...

Anda sering mendengar tentang ini dalam jenis studi p-hacking akademik di mana orang pada dasarnya menulis makalah akademis, dan ada pertanyaan, "Apakah mereka mencari hasil?" Jawabannya adalah, tentu saja, mereka. Akademisi dibayar untuk melakukan itu. Mereka ingin menemukan sesuatu yang menarik. Bukan berarti mereka memalsukan angka atau menggunakan data yang buruk – hanya saja ketika Anda mencari sesuatu yang menarik, Anda lebih cenderung menemukannya, meskipun hal menarik itu belum tentu nyata. .

Analis dapat menderita dari kecenderungan yang sama. Tugas kita adalah menemukan sesuatu yang menarik. Kami ingin menjadi orang yang berdiri di pertemuan besar dan berkata, "Lihat bagan ini yang mengungkapkan hal yang sangat dramatis ini." Jika Anda selalu mencari hal-hal itu, sekali lagi, sembilan dari 10, Anda tidak menemukannya. Tetapi untuk ke-10 kalinya, ketika Anda melakukannya, penting untuk mengatakan, "Hei, kami mencoba banyak hal lain terlebih dahulu." Itu membantu memahami apakah hal yang Anda pikir Anda temukan ini nyata atau tidak.

Liam: Untuk startup di luar sana, bagaimana data dapat digunakan untuk mendorong pertumbuhan?

Benn: Banyak cara. Kebanyakan orang menggunakannya seperti peretasan pertumbuhan, yang oleh orang-orang disebut sebagai cara baru untuk menyebut pemasaran, tetapi Anda dapat menggunakannya dengan cara seperti itu. Anda dapat menggunakannya untuk lebih memahami pelanggan Anda, untuk mengetahui siapa yang harus diajak bicara. Banyak pertumbuhan hanya dengan menemukan orang yang tepat dan memberi mereka pesan yang tepat pada waktu yang tepat, setidaknya dari atas sisi saluran pemasaran. Data bisa sangat penting dalam hal itu. Bagaimana Anda bisa memahami, dari siapa yang datang ke corong Anda, apa yang mereka katakan dan seberapa jauh mereka dapatkan? Siapa orang-orang itu, dan bagaimana Anda menjangkau lebih banyak orang yang terlihat seperti itu?

“Banyak pertumbuhan hanya dengan menemukan orang yang tepat dan memberi mereka pesan yang tepat pada waktu yang tepat, setidaknya dari atas sisi saluran pemasaran. Data bisa sangat penting dalam hal itu.”

Namun, pengungkit yang lebih penting sering kali seputar memahami apa yang coba dilakukan pelanggan Anda. Orang akan sering membuat produk dan mengharapkannya untuk digunakan dengan cara tertentu atau mengharapkan orang menyukainya karena satu dan lain alasan, dan orang tidak selalu menyukainya karena alasan tersebut. Ada banyak fitur yang kami buat di Mode atau yang kami dengar dari pelanggan kami di mana mereka seperti, "Oh ya, ini akan menjadi hal yang hebat untuk X." Dan ternyata bukan itu alasan orang menyukainya, tetapi mereka mungkin menyukainya untuk Y. Kecuali jika Anda melihat data untuk memahami perilaku dari apa yang dilakukan orang dan mencoba memahami apa yang memotivasi mereka untuk melakukan hal itu, Anda akan sering berpikir, “Oh, bagus, kami meluncurkan fitur yang sangat bagus untuk ini, dan itulah mengapa orang-orang menggunakannya. Jadi, kami akan benar-benar bersandar pada itu.” Tapi mungkin Anda sebenarnya bermain melawan cara orang mencoba menggunakan produk, dan Anda seharusnya mengatakan seperti, “Hei, mereka menggunakannya untuk Y. Mari kita benar-benar membangun cara untuk memungkinkan mereka melakukannya Hal-hal di atasnya. ”

“Ini tentang menemukan kecocokan produk-pasar yang sebenarnya daripada yang Anda anggap Anda miliki”

Sebagai contoh, ada perusahaan ini yang merupakan semacam produk obrolan yang pada dasarnya untuk bekerja. Itu adalah jenis produk tipe Slack yang kolaboratif yang berfokus pada seluler. Mereka awalnya berpikir itu akan menjadi cara yang bagus bagi pekerja garis depan untuk berkomunikasi. Ini akan menjadi cara yang bagus bagi orang-orang yang tidak memiliki alamat email untuk berkomunikasi. Jika Anda seorang kasir di 7-11, Anda mungkin tidak memiliki alamat email 7-11, tetapi kami membutuhkan cara untuk dapat melakukan pembicaraan korporat dengan orang-orang itu. Ini adalah aplikasi untuk itu. Mereka mendapatkan beberapa adopsi, dan mereka pikir itu karena orang-orang ini yang tidak memiliki alamat email, tetapi setelah melihat banyak data, mereka menyadari bahwa sebenarnya orang-orang yang harus masuk dan keluar kantor banyak . Hal yang paling berguna bukanlah karena mereka tidak memiliki alamat email – melainkan karena mereka sering jauh dari komputer. Mereka pada dasarnya menggunakannya sebagai pengganti WhatsApp untuk obrolan perusahaan.

Jadi, jika mereka mengira ini tentang orang-orang tanpa alamat email, mereka mungkin telah membangun banyak fitur di mana Anda mendaftar dengan nomor telepon Anda, di mana Anda melakukan banyak hal yang memungkinkan untuk membuat hal ini di mana Anda tidak tidak memiliki komputer desktop. Tetapi yang sebenarnya diinginkan orang adalah pengalaman di mana mereka kadang-kadang dapat menggunakan komputer, dan kemudian meninggalkannya dan memiliki pengalaman seluler yang sangat hebat saat mereka dalam perjalanan, atau mereka melakukan pengiriman atau apa pun. Itu menciptakan jalur yang sangat berbeda untuk produk dan perusahaan itu, tetapi mereka tidak akan pernah mengerti itu kecuali mereka melihat data untuk memahami orang-orang yang benar-benar menggunakannya dan apa yang mereka coba lakukan dengannya. Ini tentang menemukan kecocokan produk-pasar yang sebenarnya daripada yang Anda asumsikan Anda miliki.

Alat baru, masalah yang sama

Liam: Seperti apa tumpukan data modern saat ini?

Benn: Data stack modern adalah istilah umum untuk kumpulan alat data baru yang sedang dikembangkan di belakang produk data yang dipindahkan ke cloud. Inti dari ini adalah gudang data. Sebelum 2010, setiap perusahaan yang menginginkan gudang data, tempat Anda menyimpan semua data Anda, biasanya harus membeli sesuatu, mesin fisik atau perangkat lunak fisik, seperti pada CD, yang kemudian akan dijalankan pada mesin yang mereka gunakan. memiliki. Kami akan memiliki ruang server di belakang yang merupakan database kami, dan kami akan menjalankan beberapa database Oracle di dalamnya, dan semua itu. Pada dasarnya, dengan Redshift, yang merupakan salah satu gudang data cloud pertama, orang-orang mulai memindahkan semua itu ke cloud. Daripada saya harus membeli mesin atau perangkat lunak, saya cukup pergi ke AWS, katakan "Putar database Redshift untuk saya," saya bisa melakukannya dari browser saya dalam 15 menit, dan saya tidak perlu benar-benar memilikinya. perangkat keras untuk melakukannya. Sekelompok alat telah dibangun di atas gagasan untuk mengatakan, "Bagaimana jika kami melakukan semua data kami bekerja di cloud dan tidak harus memiliki semua perangkat lunak yang kami jalankan sendiri?" Tumpukan data modern adalah semacam gagasan tentang seperti apa data dipindahkan ke cloud. Ada banyak cara Anda dapat mendefinisikannya. Tetapi secara umum, telah membangun produk yang sangat horizontal ini yang hanya akan menyerap data dari aplikasi pihak ketiga.

“Kami telah mengalami peningkatan dramatis dalam kualitas teknologi ini, tetapi masalah inti yang kami coba pecahkan sering kali tetap bertahan”

Katakanlah Anda memiliki data di Salesforce atau Zendesk atau Marketo atau Stripe, produk yang hanya akan menyerap data tersebut ke gudang Anda. Anda memiliki produk yang akan mengubahnya dan memodelkannya di gudang Anda – katakanlah Anda memiliki banyak data berantakan yang ingin Anda ubah menjadi data bersih, jadi Anda memiliki produk yang akan mengelolanya. Gudang itu sendiri akan melakukan penyimpanan. Ada alat analitik, seperti Mode, yang ada di atasnya untuk dasbor, untuk analisis, untuk dapat berbagi dan mendistribusikan pekerjaan itu. Dan kemudian, ada banyak alat lain yang dibuat untuk mendukungnya. Sekarang Anda memiliki lima atau enam alat yang menjalankan alat data Anda, Anda ingin dapat memantau semuanya. Apakah semuanya bekerja dengan benar? Apakah jalur pipa dari titik A ke titik B aktif dan berjalan serta berkinerja seperti yang saya harapkan? Jika saya ingin membuat perubahan, bagaimana cara mengatur perubahan itu ke sistem?

Ini menjadi ekosistem yang jauh lebih kompleks, tetapi semuanya dibangun di atas aliran inti ini dari beberapa cara untuk menyerap data di gudang, beberapa cara untuk mengubahnya di gudang, beberapa cara untuk membangun aset data di atas data di gudang , dan kemudian beberapa cara untuk mengirimkannya kepada siapa pun yang benar-benar perlu melihatnya.

Liam: Akan sangat sulit untuk membuat semua orang menyetujui angka-angka ketika Anda memiliki dasbor dan alat yang berbeda yang memberi tahu Anda hal yang berbeda. Apakah itu sebuah tantangan?

Ben: Ya. Ini adalah salah satu paradoks dari keadaan tumpukan data modern saat ini. Kami sekarang telah menghabiskan hampir 10 tahun untuk membangun produk ini, dan mereka revolusioner, dalam banyak hal. Mereka melakukan hal-hal secara dramatis lebih baik dan secara dramatis lebih cepat daripada yang mereka lakukan 10 tahun yang lalu. Sekitar 10 tahun yang lalu, untuk database top-of-the-line, Anda harus menghabiskan, katakanlah, satu juta dolar setahun untuk menjalankannya. Anda harus membayar untuk mesin yang menjalankannya. Anda biasanya harus memiliki satu atau dua orang yang pekerjaan penuh waktunya adalah mengelolanya. Hari ini, Anda bisa mendapatkan gudang lebih cepat daripada gudang yang akan menghabiskan biaya $20.000 per tahun, dan Anda tidak perlu memiliki siapa pun yang mengelolanya sepenuhnya. Saya bisa pergi ke AWS, menekan tombol dan membayar puluhan ribu dolar untuk sesuatu yang biasanya menghabiskan biaya beberapa juta dolar setahun. Dan itu adalah produk yang lebih baik.

Anda dapat membuat klaim yang sama di seluruh tumpukan. Alat analitik telah meningkat dengan cara itu. Alat penyerapan data dan alat saluran telah ditingkatkan dengan cara itu. Kami telah mengalami peningkatan dramatis dalam kualitas teknologi ini, tetapi masalah inti yang kami coba pecahkan seringkali terus-menerus. Salah satu masalah inti yang kami alami 10 tahun lalu adalah dua orang masuk ke sebuah ruangan dan berkata, "Dasbor saya mengatakan ini," dan orang lain berkata, "Dasbor saya mengatakan ini." Mereka menghabiskan seluruh pertemuan, daripada mencoba mencari tahu apa yang harus dilakukan, berdebat tentang nomor siapa yang benar. Dan kami masih melakukan itu, masih banyak yang seperti itu.

“Pemasaran dan penjualan telah ada selama ratusan tahun. Kami masih dalam tahap awal untuk mencari tahu seperti apa profesi data”

Saya mendengar ceramah dari CEO Databricks, salah satu gudang modern yang mendorong banyak perubahan ini. Dia mengatakan bahwa salah satu keluhan paling umum yang Anda dengar dari pelanggan adalah bahwa orang-orang menghabiskan seluruh waktu mereka untuk bertengkar tentang angka dan mana yang benar. Saya pikir bagian dari pemecahan masalah itu akan terus membangun alat yang dapat berbicara satu sama lain dan bekerja lebih baik bersama-sama, dan sistem yang memungkinkan kita untuk mendefinisikan sesuatu sekali sehingga jika kita melihat dasbor, kita tahu itu menarik dari tempat yang sama . Tetapi bagian dari itu, juga, hanya akan menjadi organisasi yang mencari tahu cara bekerja dengan data. Data masih merupakan hal yang relatif baru. Sebagian besar perusahaan telah mulai menggunakannya secara nyata dalam 10, 15 tahun terakhir. Kami masih mencari cara untuk membuatnya bekerja. Masih banyak percakapan di masyarakat tentang berbagai peran yang kita butuhkan, untuk apa peran itu, dan siapa yang bertanggung jawab untuk apa.

Teknik bukanlah praktik yang berkembang dalam semalam. TI bukanlah praktik yang berkembang dalam semalam. Pemasaran dan penjualan telah ada selama ratusan tahun. Kami masih dalam tahap awal mencari tahu seperti apa profesi data. Saya pikir ini akan menjadi kombinasi dari alat yang kami buat dan semua orang mulai menyadari, "Beginilah cara kerjanya, dan ini tidak," sebelum kita benar-benar dapat mengatasi apa yang tampak seperti masalah mendasar .

Liam: Tentu saja. Saya pikir semua orang dari semua jenis industri akan memiliki cerita mereka sendiri. Metrik podcast, menurut saya, mungkin merupakan contoh yang baik dari komplikasi data. Sebuah unduhan biasanya tidak sama dengan jumlah total pendengar karena satu pendengar mungkin telah mengunduh episode yang sama di beberapa perangkat, atau mereka mungkin mengunduhnya dengan maksud untuk mendengarkannya tetapi tidak pernah melakukannya. Saya tahu mereka mencoba memperkenalkan cara standar untuk mengukur hal-hal ini, yang mungkin akan terjadi secara menyeluruh, saya kira, untuk banyak industri.

Benn: Jika Anda berpikir tentang metrik pemasaran web dasar dan bagaimana orang menjalankan iklan dan lainnya, kami telah mulai menstandarkan beberapa di antaranya. Jika Anda membuka dasbor iklan Facebook atau dasbor iklan Google Anda, hal-hal tersebut akan terlihat sangat mirip. Mereka akan menceritakan kepada Anda cerita yang kurang lebih sama karena ada beberapa standarisasi tentang bagaimana kita sebenarnya membicarakan dan mencari tahu iklan mana yang berkinerja baik dan tidak. Anda melihat ini dengan beberapa hal lain. Anda melihat ini dengan perusahaan SaaS, misalnya. Perusahaan SaaS sekarang memiliki buku metrik standar yang mereka semua ambil. Ada beberapa tempat di mana kita mulai melihat penggabungan ini, tetapi akan ada lebih banyak lagi di tahun-tahun mendatang, seperti, bagaimana pendapat kita tentang podcast? Bagaimana pendapat kita tentang jenis produk tertentu? Bagaimana pendapat kita tentang mengukur kinerja tim pendukung? Bagaimana kita memikirkan semua hal yang berbeda ini yang merupakan data yang sekarang kita miliki jauh lebih kaya informasinya tetapi setiap perusahaan masih mencoba mencari tahu secara individual?

“Kami akan beradaptasi dari praktik terbaik alih-alih semua orang mencoba melakukan ini dari awal”

Saya pikir akan ada beberapa standarisasi di sekitar, "Ini mungkin praktik terbaik untuk memikirkan masalah semacam ini." Perusahaan jelas masih akan memiliki beberapa pelaporan khusus yang perlu mereka lakukan. Podcast ini mungkin ingin mengukur sesuatu secara berbeda dari podcast lainnya karena Anda mungkin memiliki audiens yang berbeda atau tujuan yang berbeda. Setiap orang akan memiliki penyesuaian mereka sendiri, tetapi saya pikir akan ada perasaan yang jauh lebih baik dari, "Oke, ini adalah cara kita semua setuju bekerja." Kami akan beradaptasi dari praktik terbaik alih-alih semua orang mencoba melakukan ini dari awal. Banyak perusahaan yang memulai praktik data mereka sering mencoba membangun sesuatu dari bawah ke atas. Saya pikir kita memiliki sedikit cara untuk pergi sebelum kita sampai pada titik di mana Anda memiliki perancah yang kita semua dapat membangun di atasnya.

Kerangka kerja web, dalam beberapa hal, adalah contohnya. Jika Anda ingin membangun produk web atau perangkat lunak, ada garis besar yang cukup jelas yang dapat Anda gambar dari mana Anda kemudian menambahkan logika Anda sendiri untuk membuat aplikasi Anda persis seperti yang Anda inginkan. Analytics tidak cukup memiliki itu. Semua orang memulai dari nol daripada memiliki kerangka kerja inti semacam itu yang dapat mereka bangun di atasnya.

Liam: Apa yang akan Anda katakan kepada startup yang gentar dengan data yang menatap semuanya dan merasa sedikit cemas tentang hal itu?

Benn: Ini bisa terjadi di perusahaan rintisan, tetapi juga bisa terjadi di perusahaan yang matang datanya dengan analis individu. Sangat mudah untuk menatap halaman kosong atau spreadsheet Excel yang kelebihan beban dan berpikir, "Apa yang harus saya lakukan?" Itu mudah dilakukan jika Anda seorang analis berpengalaman yang baru mulai memahami suatu masalah, mudah dilakukan jika Anda adalah perusahaan yang belum tahu apa yang harus dilakukan dengan data, dan mudah dilakukan jika Anda seorang analis junior yang baru saja bergabung di suatu tempat dan tidak yakin apa yang harus dilakukan.

“Tidak apa-apa untuk memulai dengan hal-hal yang sangat sederhana. Sungguh luar biasa betapa banyak informasi dasar yang dianggap berharga oleh orang-orang”

Saya pikir solusi untuk itu semua sama – tidak apa-apa untuk memulai dengan hal-hal yang sangat sederhana. Sungguh luar biasa betapa banyak informasi dasar yang menurut orang berharga. Saya mengenal seorang pria yang, seminggu sekali, akan mengadakan pertemuan dengan tim datanya sehingga mereka pada dasarnya akan membagikan hal-hal yang mereka pelajari selama seminggu. Beberapa hal ini sangat sederhana. Perusahaan adalah produk yang dibuat untuk bisnis, jadi digunakan dari Senin hingga Jumat. Mereka membuat bagan untuk berapa banyak orang yang menggunakannya pada hari dalam seminggu, dan hei, kebanyakan orang tidak menggunakannya pada akhir pekan dan banyak orang menggunakannya pada hari kerja. Anda tidak benar-benar mengungkap beberapa wawasan luar biasa di sana. Semua orang sudah tahu itu cara kerjanya, tetapi melihat angka-angka itu dan persisnya berapa banyak yang turun di akhir pekan – ada beberapa akhir pekan yang tidak terlalu banyak turun, dan beberapa akhir pekan turun satu ton – menghasilkan banyak pertanyaan dan rasa ingin tahu tentang apa yang mendorong perilaku itu. Mengapa akhir pekan itu di mana orang-orang tampaknya sering menggunakannya? Apa yang terjadi disana? Itu adalah benih untuk lebih banyak lagi, “Baiklah, mari kita terus belajar. Mari terus bertanya. Ayo terus menggali.”

Itulah cara saya mendorong orang untuk memulai. Mulailah dengan hal-hal dasar, bahkan jika itu asumsi yang Anda buat. Segera setelah Anda mulai melihat angka-angka, Anda akan melihat hal-hal yang membuat Anda berpikir dan menggaruk-garuk kepala dan membuat Anda menyadari bahwa ada lebih banyak hal di sini yang tidak Anda mengerti yang membuat Anda penasaran. Banyak dari itu hanya membiarkan diri Anda terbawa oleh rasa ingin tahu itu dan tidak mengatakan, “Saya harus mengungkap beberapa hal yang menakjubkan. Saya perlu menemukan jarum di tumpukan jerami yang akan mengubah lintasan perusahaan pada hari pertama.” You're not going to find that right away. The way you're going to find it is by just poking around, seeing things that are interesting, and letting yourself explore those interesting things when you find them.

Always tinkering

Liam: You're clearly so passionate about data. I was just wondering where that came from.

Benn: Part of it is working in it for a long time and just getting to know it. Part of it, though, is that I think it's fun to figure stuff out like this. I was talking to someone about flying from New York to San Francisco a couple days ago, and it's a flight that I've made a good bit, and they had made it a good bit, too. They were saying that when they were flying back on a Delta flight, it felt way faster than when they were flying on a United flight. Why is Delta faster on this? And it made me think: are there some airlines that are just able to fly faster? It doesn't seem like that would be true, but does that actually hold up? The Department of Transportation releases raw data on every flight in the US. Where it started, where it ended, what time it took off, when it landed – all of that stuff.

“I'm just naturally prone to want to play around with that and understand it. I don't really have an explanation as to why that is other than I find it fun”

I just started playing around with it, trying to figure this out. I looked at different routes and was like, “Are there changes in the speed of different airlines? Are planes flying faster at different times of day, at different times of the year?” As you get into it, it just became interesting to see… I don't know any of this stuff. I don't know how fast planes fly or why they fly at different speeds on the same routes or whatever, but it was interesting. There were actually some airlines that were consistently a couple minutes faster. I don't know why that would be. It was never by much, but it was basically like 90 seconds of difference fairly consistently between a couple airlines. I don't know, maybe they just have different guidelines or something. That sort of thing, I think, is what makes me interested in it. I'm just naturally prone to want to play around with that and understand it. I don't really have an explanation as to why that is other than I find it fun. That really drew me to the job in the first place. Then, once you get into it, you start to see all these other things that you could be doing that are fascinating and fun.

Liam: That's great. Apa berikutnya? Have you any particular plans or projects for 2022?

Benn: I mean, continuing to do the Mode thing. I think there's a lot of stuff on that front that we're excited about, a lot of new things we're building. The direction of the space is one we're very excited about. Personally, last year I basically started writing a lot more on Substack, and that's been fun. It's been good to get some of the thoughts out about these ideas, have conversations with the people in the community and see where things go. We're planning on being much more involved in that. I don't know exactly where that goes, and part of this is, again, letting myself be curious about it, do the things I enjoy, and if I find stuff that's fun and other people seem to enjoy, then giving myself the permission to continue to do it.

Liam: I was going to ask where our listeners can go to keep up with you and your work, definitely the Substack. I think it's Benn.substack.com. Is that right?

Benn: That's correct. The two places would be mainly there and Twitter. I'm not the most active Twitter person in the world, so Substack is better for some of the more interesting things. But my Twitter handle is @BennStancil, and there's also LinkedIn if you want to connect professionally.

Liam: I've been reading lots of your posts and they're great, so I would definitely recommend everyone go and subscribe to Benn's Substack. Thank you so much for chatting with us, Benn.

Benn: For sure. Thanks again for having me. Ini sangat menyenangkan.

Inside Intercom Podcast – gambar terbaru 2019