데이터 엔지니어링

Data Engineering

데이터를 수집·변환·저장·제공하는 파이프라인(Pipeline)을 설계하고 운영하는 역량. 조직의 데이터 기반 의사결정을 뒷받침하는 인프라를 구축하는 핵심 능력이다.

데이터 엔지니어링은 다양한 소스에서 데이터를 수집하고, ETL/ELT 파이프라인을 설계·구현하며, 데이터 웨어하우스(Data Warehouse)와 데이터 레이크(Data Lake)를 구축·운영하는 역량입니다. 스키마 설계, 데이터 품질 관리, 워크플로우 오케스트레이션(Orchestration), 실시간 스트리밍(Streaming) 처리까지 포괄하며, 데이터 분석가와 과학자가 신뢰할 수 있는 데이터를 적시에 활용할 수 있도록 안정적인 데이터 인프라를 제공하는 것이 핵심입니다.

Technology & Digital

7개 레벨

발행: 2026년 3월 13일 · 업데이트: 2026년 3월 13일 · v2

레벨

데이터 엔지니어링이라는 분야에 처음 진입하여 핵심 개념을 탐색하는 단계입니다. SQL 기초 문법을 익히고, 데이터 파이프라인의 개념과 ETL(Extract, Transform, Load)의 기본 흐름을 이해합니다. 관계형 데이터베이스(Relational Database)의 테이블 구조를 파악하고, 간단한 데이터 추출과 변환을 안내에 따라 수행할 수 있습니다.

SQL의 SELECT, WHERE, JOIN, GROUP BY를 사용하여 2개 이상의 테이블에서 데이터를 조회할 수 있다
ETL의 추출(Extract), 변환(Transform), 적재(Load) 3단계를 각각 설명할 수 있다
관계형 데이터베이스의 기본키(Primary Key)와 외래키(Foreign Key) 관계를 도식으로 표현할 수 있다
CSV, JSON 등 일반적인 데이터 형식의 차이를 설명하고 적절한 형식을 선택할 수 있다
안내에 따라 스크립트를 실행하여 소규모 데이터를 하나의 소스에서 다른 저장소로 이동할 수 있다
데이터 웨어하우스와 데이터 레이크의 차이를 설명할 수 있다

참고 자료

SFIA Foundation역량 프레임워크

Defines Data Engineering from Level 2 (Assist) to Level 6 (Initiate, influence), specifying pipeline design, implementation, and strategic responsibility scope at each level.

SFIA 8 — Data Engineering Skill Definition (Levels 2-6)

UK Government Digital and Data Profession역량 프레임워크

Provides a skill proficiency matrix (Awareness/Working/Practitioner/Expert) across Data Engineer, Senior, Lead, and Head roles, directly informing checklist design.

UK Government DDaT — Data Engineer Role Levels

GitLab숙련도 모델

Details technical requirements, responsibility scope, and autonomy levels across Junior, Intermediate, Senior, Staff, and Principal stages for L1-L7 mapping.

GitLab Data Engineer Career Ladder (Junior → Principal)

Google Cloud인증 체계

Validates mid-to-senior engineer competency across 5 domains: data processing system design, ingestion/processing, storage, analysis readiness, and workload automation.

Google Cloud Professional Data Engineer Certification

Databricks인증 체계

Two-tier certification — Associate (ETL fundamentals, pipeline building) to Professional (advanced streaming, security, CI/CD, schema management) — providing concrete behavioral criteria at the intermediate-to-advanced boundary.

Databricks Certified Data Engineer Associate & Professional

DAMA Internationaltextbook

Defines 11 data management knowledge areas (governance, quality, metadata, etc.), providing authoritative grounding for L5-L6 governance/strategy checklists and L4 schema/quality management items.

DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition)

IEEE/ACM CAIN Conferenceacademic_research

Systematic mapping of 25 papers classifying data engineering lifecycle activities (collection, transformation, storage, serving) with technical solutions and architectures, grounding L3-L5 checklist behaviors.

What About the Data? A Mapping Study on Data Engineering for AI Systems (CAIN 2024)

데이터 엔지니어링

레벨

레벨 1#SQL#DataPipeline#ETLBasics#SchemaDesign데이터 엔지니어링에 관심을 가지고 기본적인 데이터 처리 개념과 SQL을 학습하기 시작하는 단계. 데이터가 어떻게 흐르는지 이해한다.

레벨 2#BatchProcessing#DataWarehouse#VersionControl#DataCleaning기본적인 배치 파이프라인을 구축하고 데이터 품질을 검증하는 단계. 안내에 따라 정형 데이터를 처리하고 적재할 수 있다.

레벨 3#Orchestration#DataModeling#DataLake#Monitoring오케스트레이션 도구로 파이프라인을 자동화하고 데이터 모델을 독립적으로 설계하는 단계. 일상적인 데이터 엔지니어링 업무를 자율적으로 수행한다.

레벨 4#StreamProcessing#SchemaEvolution#CostOptimization#CI-CD실시간 스트리밍 파이프라인을 설계하고 스키마 진화를 관리하는 단계. 복잡한 데이터 아키텍처 의사결정을 맥락에 따라 수행한다.

레벨 5#DataMesh#Governance#TeamMentoring#PlatformDesign데이터 플랫폼을 설계하고 거버넌스 체계를 수립하며 팀을 리드하는 단계. 프로세스와 방법론을 개선하고 후배를 멘토링한다.

레벨 6#DAMA-DMBOK#DataStrategy#ComplianceArchitecture#GDPR업계 수준의 데이터 전략을 수립하고 산업 표준에 기여하는 단계. 사고 리더십으로 업계 데이터 엔지니어링 방향을 제시한다.

레벨 7#ApacheFoundation#DataParadigm#OpenSourceFramework데이터 엔지니어링 분야에 새로운 패러다임을 창시하고 후대에 영향을 미치는 유산을 남기는 단계. 세대를 넘어 영향을 미친다.

참고 자료