Maaaring magawa ang malaking data: Paano i-tulay ang agwat sa pagitan ng mga siyentipiko at mga inhinyero

Ang buzz sa paligid ng malaking data ay lumikha ng isang malawak na maling kuru-kuro: na ang pagkakaroon lamang nito ay maaaring magbigay ng isang kumpanya na may aksyon na pananaw at positibong kinalabasan sa negosyo. Ang katotohanan ay medyo mas kumplikado. Upang makakuha ng halaga mula sa malaking data, kailangan mo ng isang may kakayahang koponan ng mga siyentipiko ng data upang mabukasan ito. Para sa karamihan, nauunawaan ito ng mga korporasyon, tulad ng napatunayan ng paglago ng 15x - 20x sa mga trabaho sa syentipiko ng data mula 2016 hanggang 2019. Gayunpaman, kahit na mayroon kang isang may kakayahang pangkat ng mga siyentipiko ng data sa kamay, kailangan mo pa ring limasin ang pangunahing sagabal ng paglalagay ng mga ideyang iyon sa paggawa. Upang mapagtanto ang tunay na halaga ng negosyo, kailangan mong tiyakin na ang iyong mga inhinyero at data ng mga siyentipiko ay gumana sa isa't isa. Sa kanilang pangunahin, ang mga siyentipiko ng data ay mga tagabago na kumukuha ng mga bagong ideya at saloobin mula sa data ng iyong kumpanya na sumisiksik sa pang-araw-araw na batayan, habang ang mga inhinyero naman ay nagtatayo ng mga ideyang iyon at lumikha ng mga napapanatiling lente kung saan titingnan ang aming data. Ang mga siyentipiko ng datos ay tungkulin sa pag-deciphering, pagmamanipula, at data ng pangangalakal para sa mga positibong kinalabasan ng negosyo. Upang maisakatuparan ang gawaing ito, nagsasagawa sila ng iba't ibang mga gawain mula sa pagmimina ng data hanggang sa istatistikong pagsusuri. Ang pagkolekta, pag-aayos, at pagpapakahulugan ng data ay tapos na sa hangarin na makilala ang mga makabuluhang mga uso at may-katuturang impormasyon. Habang ang mga inhinyero ay tiyak na nakikipagtulungan sa mga siyentipiko ng data, mayroong ilang natatanging pagkakaiba sa pagitan ng dalawang tungkulin. Ang isa sa mga pangunahing pagkakaiba ay ang mga inhinyero ay naglalagay ng mas mataas na halaga sa "pagiging handa ng paggawa" ng mga system. Mula sa pagiging matatag at seguridad ng mga modelo na nabuo ng mga siyentipiko ng data hanggang sa aktwal na format at scalability, nais ng mga inhinyero na maging mabilis at maaasahan ang kanilang mga system. Sa madaling salita: Ang mga siyentipiko ng data at mga pangkat ng engineering ay may iba't ibang mga alalahanin sa pang-araw-araw. Humihingi ito ng tanong, paano mo mai-posisyon ang parehong mga tungkulin para sa tagumpay at sa huli makuha ang pinaka makabuluhang pananaw mula sa iyong data? Ang sagot ay namamalagi sa pag-aalay ng oras at mga mapagkukunan sa pag-perpekto ng data at engineering relasyon. Tulad ng mahalagang bawasan ang kalat o "ingay" sa paligid ng mga hanay ng data, mahalaga din na makinis ang anuman at lahat ng alitan sa pagitan ng dalawang koponan na gumaganap ng mahahalagang papel sa tagumpay ng iyong negosyo. Narito ang tatlong kritikal na hakbang upang gawin itong isang katotohanan. Hindi sapat na maglagay lamang ng ilang mga siyentipiko at ilang mga inhinyero sa isang silid at hilingin sa kanila na malutas ang mga problema sa mundo. Kailangan mo munang maunawaan ang mga ito sa mga terminolohiya ng bawat isa at simulan ang pagsasalita ng parehong wika. Ang isang paraan upang gawin ito ay upang i-cross-train ang mga koponan. Sa pamamagitan ng pagpapares ng mga siyentipiko at mga inhinyero sa mga poso ng dalawa, maaari mong hikayatin ang ibinahaging pag-aaral at masira ang mga hadlang. Para sa mga siyentipiko ng data, nangangahulugan ito ng pag-aaral ng mga pattern ng coding, code ng pagsulat sa isang mas organisadong paraan, at, marahil pinaka-mahalaga, pag-unawa sa tech stack at infrastructure trade-off na kasangkot sa pagpapakilala ng isang modelo sa paggawa. Nai-post sa 7wData.be