Разумныя вялікія дадзеныя: як пераадолець разрыў паміж навукоўцамі і інжынерамі

Шум вакол вялікіх дадзеных стварыў шырокае меркаванне: тое, што само яго існаванне можа даць кампаніі зразумелыя ўяўленні і станоўчыя вынікі бізнесу. Рэчаіснасць крыху больш складаная. Каб атрымаць каштоўнасць ад вялікіх дадзеных, вам патрэбна здольная каманда навукоўцаў, каб прасеяць яе. Па большай частцы карпарацыі разумеюць гэта, пра што сведчыць рост у 15 разоў - 20 разоў працоўных месцаў навукоўцаў з 2016 па 2019. Аднак, нават калі ў вас ёсць пад рукой здольная каманда навукоўцаў, вам усё роўна трэба ачысціць асноўныя перашкоды рэалізацыя гэтых ідэй у вытворчасці. Для таго, каб усвядоміць сапраўдную каштоўнасць бізнесу, вы павінны пераканацца, што вашы інжынеры і даследчыкі дадзеных будуць працаваць у згодзе. Па сутнасці, навукоўцы дадзеных - наватары, якія штодня вылучаюць новыя ідэі і думкі з дадзеных, якія ваша кампанія прымае, у той час як інжынеры, у сваю чаргу, ствараюць гэтыя ідэі і ствараюць устойлівыя аб'ектывы, каб праглядаць нашы дадзеныя. Навукоўцам дадзеных даручана расшыфраваць, маніпуляваць і гандляваць дадзенымі для дасягнення станоўчых вынікаў бізнесу. Для выканання гэтага подзвігу яны выконваюць розныя задачы, пачынаючы ад майнінга дадзеных і статыстычнага аналізу. Збор, арганізацыя і інтэрпрэтацыя дадзеных ажыццяўляецца ў мэтах выяўлення значных тэндэнцый і адпаведнай інфармацыі. У той час як інжынеры, безумоўна, працуюць у згодзе з навукоўцамі дадзеных, ёсць некалькі розных адрозненняў паміж двума ролямі. Адно з прынцыповых адрозненняў заключаецца ў тым, што інжынеры надаюць значна большае значэнне "вытворчай гатоўнасці" сістэм. Ад эластычнасці і бяспекі мадэляў, створаных навукоўцамі дадзеных, да рэальнага фармату і маштабаванасці, інжынеры хочуць, каб іх сістэмы былі хуткімі і надзейна функцыянальнымі. Іншымі словамі: даследчыкі дадзеных і інжынерныя брыгады штодня хвалююць розныя праблемы. Гэта выклікае пытанне, як вы можаце размясціць абедзве ролі для поспеху і ў канчатковым выніку атрымаць найбольш важныя ідэі са сваіх дадзеных? Адказ заключаецца ў выдзяленні часу і рэсурсаў на ўдасканаленне дадзеных і тэхнічных адносін. Гэтак жа, як важна паменшыць непатрэбнасць і "шум" вакол набораў дадзеных, важна таксама згладзіць любыя і трэнні паміж гэтымі двума камандамі, якія гуляюць жыццёва важную ролю ў поспеху вашага бізнесу. Вось тры крытычныя крокі, каб зрабіць гэта рэальнасцю. Недастаткова проста змясціць у памяшканне некалькіх навукоўцаў і некалькіх інжынераў і папрасіць іх вырашыць сусветныя праблемы. Спачатку трэба прымусіць іх зразумець тэрміналогію адзін аднаго і пачаць размаўляць на адной мове. Адзін са спосабаў зрабіць гэта трэніраваць каманды. Злучыўшы навукоўцаў і інжынераў на два струкі, вы можаце стымуляваць сумеснае навучанне і разбураць бар'еры. Для навукоўцаў дадзеных гэта азначае вывучэнне шаблонаў кадавання, напісанне кода больш арганізаваным спосабам і, мабыць, самае галоўнае, разуменне тэхналагічнага стэка і кампрамісаў інфраструктуры, звязаных з увядзеннем у вытворчасць мадэлі. Апублікавана ў 7wData.be