D.Hub학습 센터

KOEN

← 분석가 코스

첫 컬렉션 만들고 데이터셋 등록하기

비어 있는 컬렉션을 만들고 CSV 한 개를 데이터셋으로 등록한 뒤 메타데이터를 정리합니다.

8분

데이터를 찾을 줄 알게 됐으면 자기 작업 공간을 만들 차례입니다. 컬렉션은 분석 프로젝트 한 건의 폴더에 가까운 개념입니다. "분석 프로젝트 한 건 = 컬렉션 한 개"가 가장 흔한 단위.

컬렉션 만들기

포털 우측 상단의 + 만들기 메뉴에서 컬렉션을 고릅니다.
이름을 정합니다. 다른 사람도 검색으로 찾을 수 있으니, 프로젝트 맥락이 드러나는 이름이 좋습니다 (예: 2026Q3-리텐션-분석).
설명에 한두 줄로 컬렉션의 목적을 적어 둡니다. 트리에서 마우스를 올렸을 때 미리보기로 뜨고, 검색에도 잡힙니다.

만들기를 누르면 좌측 트리에 바로 뜹니다. 새로고침은 필요 없습니다.

첫 데이터셋 등록하기

빈 컬렉션 안에서 데이터셋 추가를 누르면 출처를 세 가지 중 하나로 고릅니다.

CSV / JSON 업로드 — 가장 빠른 길. 1만 행 이하 샘플 데이터에 적합.
외부 커넥터 — DB, S3, REST API 등 운영 시스템에서 직접.
다른 컬렉션의 자원 복사 — 이미 등록된 데이터셋을 작업 공간으로 끌어옵니다.

이번에는 CSV 업로드로 갑니다. 손에 적당한 CSV가 없다면 dhub2-examples 리포지토리의 작은 시나리오에서 한 파일 가져와도 됩니다.

업로드가 끝나면 데이터셋이 컬렉션 안에 추가되고, 클릭하면 미리보기 표와 열 타입 추정이 함께 보입니다.

메타데이터 한 줄 정리

데이터셋 메타데이터는 다른 사람이 이 자원을 찾고 신뢰하게 만드는, 가장 싼 작업입니다.

설명 — 한 줄. "어떤 시점의, 어떤 단위의, 무엇 데이터인지".
태그 — 검색에 가장 큰 효과. 도메인·팀·주기 정도면 충분.
책임자 — 본인 또는 데이터 owner.

자가 점검

새 컬렉션이 좌측 트리에 새로고침 없이 보이는가
업로드한 CSV가 데이터셋으로 등록되고 미리보기 표가 정상으로 뜨는가
데이터셋 설명·태그·책임자가 한 줄씩이라도 채워져 있는가

다음 레슨

이 데이터셋 위에 첫 대시보드 위젯을 얹습니다.