첫 컬렉션 만들고 데이터셋 등록하기
비어 있는 컬렉션을 만들고 CSV 한 개를 데이터셋으로 등록한 뒤 메타데이터를 정리합니다.
8분
데이터를 찾을 줄 알게 됐으면 자기 작업 공간을 만들 차례입니다. 컬렉션은 분석 프로젝트 한 건의 폴더에 가까운 개념입니다. "분석 프로젝트 한 건 = 컬렉션 한 개"가 가장 흔한 단위.
컬렉션 만들기
- 포털 우측 상단의 + 만들기 메뉴에서 컬렉션을 고릅니다.
- 이름을 정합니다. 다른 사람도 검색으로 찾을 수 있으니, 프로젝트 맥락이 드러나는 이름이 좋습니다 (예:
2026Q3-리텐션-분석). - 설명에 한두 줄로 컬렉션의 목적을 적어 둡니다. 트리에서 마우스를 올렸을 때 미리보기로 뜨고, 검색에도 잡힙니다.
만들기를 누르면 좌측 트리에 바로 뜹니다. 새로고침은 필요 없습니다.
첫 데이터셋 등록하기
빈 컬렉션 안에서 데이터셋 추가를 누르면 출처를 세 가지 중 하나로 고릅니다.
- CSV / JSON 업로드 — 가장 빠른 길. 1만 행 이하 샘플 데이터에 적합.
- 외부 커넥터 — DB, S3, REST API 등 운영 시스템에서 직접.
- 다른 컬렉션의 자원 복사 — 이미 등록된 데이터셋을 작업 공간으로 끌어옵니다.
이번에는 CSV 업로드로 갑니다. 손에 적당한 CSV가 없다면 dhub2-examples 리포지토리의 작은 시나리오에서 한 파일 가져와도 됩니다.
업로드가 끝나면 데이터셋이 컬렉션 안에 추가되고, 클릭하면 미리보기 표와 열 타입 추정이 함께 보입니다.
메타데이터 한 줄 정리
데이터셋 메타데이터는 다른 사람이 이 자원을 찾고 신뢰하게 만드는, 가장 싼 작업입니다.
- 설명 — 한 줄. "어떤 시점의, 어떤 단위의, 무엇 데이터인지".
- 태그 — 검색에 가장 큰 효과. 도메인·팀·주기 정도면 충분.
- 책임자 — 본인 또는 데이터 owner.
자가 점검
- 새 컬렉션이 좌측 트리에 새로고침 없이 보이는가
- 업로드한 CSV가 데이터셋으로 등록되고 미리보기 표가 정상으로 뜨는가
- 데이터셋 설명·태그·책임자가 한 줄씩이라도 채워져 있는가
다음 레슨
이 데이터셋 위에 첫 대시보드 위젯을 얹습니다.