문제의 시작
아래와 같은 테이블이 있다고 하자. 이 테이블이 만약 정제된 결과라면 훌륭하겠으나, raw데이터라면 큰 문제를 가지고 있다. 글로 설명하기는 힘들지만, 예를 들어 이 테이블을 가지고 2차 가공하여 추가 요약 테이블을 만들어야하는 경우, 큰 어려움이 발생한다. 이는 컬럼레이블이 "월"이라는 레이블 아래 값으로 들어가야 하는 놈들이 들어가 있기 때문이다.;;;
(뭔말..? 유식하게 표현하지 못하겠다.) 이 때문에, 추가 요약 테이블을 만들 때 수식이 복잡해진다는 뜻이다.
파워쿼리
아직 파워쿼리를 자유자재로 사용할만큼 실무단계에서의 데이터가 복잡하지는 않았기에, 대부분 위에 기술한 상황에서 전처리를 위한 도구로 사용하고 있다. 이는 딱 버튼 하나면 된다. 일단 해당 테이블(범위)을 파워쿼리로 불러온다.
꽤 오래전에는 이 또한 별도 설치를 해줘야 했는데, 2019버전을 쓰니, 데이터 메뉴안에 들어와 있다.
불러온 화면은 아래와 같다. 각 컬럼(열)에 대한 데이터 포맷이 자동으로 지정이 되었다.
뭔지 모를 버튼들이 엄청 많지만, 앞서 말한 것처럼, 버튼 하나만 사용할 것이다. 흩어져 있는 컬럼(1월, 2월, 3월)을 선택하고, 열 피벗 해제 버튼을 누르면 되는데, 옵션 중 선택한 열만 피벗 해제로 선택한다.
결과는 아래와 같다. 달라진 점이 눈에 보일지 모르겠다. 피벗 테이블(요약 테이블) 형태의 값을 각 요인별로 분리하여, DB테이블로 만드는 과정? (아... 놔..) 이라고 해두자. R에서는 reshape 패키지에서 이런 전처리를 진행하는 것으로 알고 있다.
홈 메뉴에서 닫기 및 로드를 통해 다시 엑셀 화면으로 돌아오면 끝이다. 한결 수식을 사용하기 편하다는 것을 알 수 있고 원본 DB같은 느낌이 풀풀 풍긴다.
2013을 쓸때 같은 주제로 글을 쓴 적이 있었는데, 2019버전에서 좀 달라진게 있나 했더니, 처리속도가 좀 빨라진것 같고, 뭐 비슷비슷한것 같음.
그나저나 엑셀보다, 한글이 더 어렵다.
끝.