Съвети към начинаещи инженери по данни.

Попаднах на някои интересни въпроси в множество форуми като интервюта, общи дискусии и уебинари. Мислех да сложа моя прием-

Que- Какво е инженер по данни и какво правят?
Ans-A инженер по данни е техническо лице, което отговаря за архитектурата, изграждането, тестването и поддръжката на системата за данни. Те са отговорни за намирането на последните тенденции в наборите от данни и създаването на ефективни алгоритми, за да направят данните по-полезни. Те се нуждаят от необходимите умения като програмиране, математика и компютърни науки, опит, както и меки умения, за да комуникират тенденциите на данните, които помагат на растежа на бизнеса.

Data Engineering прави Data Science по-продуктивна. Инженерите по данни са отговорни за намирането на тенденции в наборите от данни и разработването на алгоритми, за да направят необработените данни по-полезни за предприятието. И така, Data Engineering изисква пълно разбиране на технологиите, инструментите, по-бързо изпълнение на сложни набори от данни с надеждност.

Въпрос – Какви са ключовите отговорности на инженера по данни?
Отговор – Някои от ключовите отговорности са:
› Придобиване на набори от данни, които са в съответствие с бизнес нуждите
› Разработване на алгоритми за трансформиране на данните в полезни, действащи информация
› Изграждане, тестване и поддържане на тръбопроводни архитектури на бази данни
› Сътрудничество с ръководството за разбиране на целите на компанията
› Създаване на нови методи за валидиране на данни и инструменти за анализ на данни
› Осигуряване на съответствие с данните политики за управление и сигурност

Въпрос – Какви са ключовите умения за учене?
Отговор – Уменията за инженерство на данни са предимно същите като уменията, необходими за софтуерно инженерство и инженерство на бази данни.
› Езици за програмиране (Python, Scala и PySpark)
› Бази данни (SQL, NoSQL)
› Облачно инженерство (Azure, AWS, Google Cloud)

Въпрос – Може ли някой да смени кариерата си с инженеринг на данни?
Отговор – Няма „научете инженеринг на данни за 4 седмици“ или „станете инженер на данни за 2 месеца“.
Няма дестинация. Наистина има само едно пътуване.
Не бързайте. Потърсете подходящ наставник, който е правил това преди. В интернет има много шум, толкова трудно за начинаещите да идентифицират правилния път и правилното съдържание.

Изградете нещо вълнуващо и лесно, за да приложите наученото.

Необходими са огромни количества търпение, ангажираност и любопитство, за да научите НЕЩО.

Въпрос – Кои са често срещаните грешки в автобиографиите на инженерите по данни?
Отговор – Фокусиране единствено върху детайлите на техническото внедряване без обяснение или разбиране на компромисите, направени при проектирането на системата (напр. „Използвах Data Factory, защото моят мениджър ми каза така”) и по-голямата картина на проекта. Имайте предвид, че интервюиращите не познават бизнес проблемите и инфраструктурата на данните на предишната ви компания като вас, така че трябва да предоставите достатъчно контекст, за да им помогнете да разберат техническата сложност и въздействието на вашите проекти.