본문 바로가기

Data Scientist

(39)
태블로(테이블 계산식, LOD표현식(세부수준 표현식) 테이블 계산식은 "Raw Data"를 "집계한 값(Aggregation)"을 가지고 "테이블 계산(Table Calculation)"을 실행한다. DAY4 국가별 가격 변동 비율 차이 시트를 열어서 함께 살펴볼까요? 우리는 국가별 가격 변동 비율을 구하기 위해서... (1) Dollar Price(Raw Data)의 합계(Aggregation) 를 구하고, (2) 그 합계 값을 가지고 “구성비율”이라는 테이블 계산식(Table Calculation)을 통해 변동 비율을 계산했습니다. 즉, 이미 집계된 Dollar Price 합계 값을 가지고 ‘재계산’ 했죠. 그런데 여기서 잠깐!!!!! Dollar Price는 무엇을 기준으로 합계 값을 구했었나요? Dollar Price의 합계를 구한 기준은 연도(Da..
태블로(맵핑, 백그라운드 이미지사용, MakePoint, MakeLine) 매개변수와 계산된 필드를 만들어 준 뒤에 평균(X)와 평균(Y)를 각각 열과 행에 드래그앤 드랍해주면 이미지가 나타난다. 그리고 색상과 크기를 계산된 필드로 주면 다음과 같이 지하철 노선도가 나타난다. MAKEPOINT(Latitude,Longitude) MAKEPOINT(Latitude,Longitude) MakePoint를 사용하면 데이터 원본을 공간을 지원하도록 만들어 공간 조인을 통해 공간 파일과 조인할 수 있다. MakePoint를 사용하려면 데이터에 위도 및 경도 좌표가 포함되어 있어야 한다. 계산된 필드 만들기에서 Makepoint 함수와 Makeline 함수를 사용해야 한다. MAKELINE(MAKEPOINT([Lat],[Long]),MAKEPOINT([Dest Lat],[Dest Lng]..
태블로 (하이라이트 테이블, 퀵테이블계산 : 비율 차이, 바벨차트 = DNA차트 = 덤벨차트) 하이라이트 테이블로 시도 별 월 별 미세먼지 패턴 확인하기 1. 기준년월의 월을 열 선반에 놓는다 - Window : 기준년월에서 마우스 오른쪽 버튼을 클릭하고 열 선반으로 드래그 - MAC : Option 키를 누르고 기준년월을 열 선반으로 드래그 위쪽에 있는 월을 선택 2. 시도를 행 선반에 드래그앤드랍 3. 마크의 모양은 사각형을 선택해 준다. 4. 마크의 색상을 평균 PM10 수치로 표현한다. 미세먼지가 높을 수록 붉은색으로 미세먼지가 낮을수록 파란색으로 표현한다 퀵테이블 계산에서 비율차이를 이용하면 빅맥가격이 얼마나 올랐는지 비율 계산이 가능하다. 시작연도인 2000년과 끝 연도인 2020년만 유지하도록 남겨두고, 국가이름을 참고하도록 Name을 세부정보에 드래그앤 드랍해준다. 그리고 달러가격(..
태블로 (워드클라우드, 박스플롯, 계산된 필드) 이번엔 메뉴에 따른 칼로리를 워드클라우드로 나타내보자. 우선 열과 행에 메뉴명과 칼로리를 넣어준다. 그리고 우측에 표현방식에서 트리맵으로 변경해준다. 트리맵으로 변경하면 다음과 같이 나타난다. 마크가 자동으로 되어있는데, 이를 텍스트로 변경해주고 색상을 좀 바꿔주면 간단하게 워드클라우드가 생성된다. 진한 빨간색일수록 칼로리가 높은 것인데 한 눈에 칼로리가 높은 적들이 눈에 띈다. 제주 까망 크림 프라푸치노... 이름만 봐도 맛있고 살찔 것 같다. 박스플롯 또한 간단하게 표현방식에서 변경해주는 방식으로 사용가능하다. 열과 행에 카테고리와 칼로리를 넣어주고 카페인이 높은 것을 빨간색으로 나타나게 해준다. 메뉴명을 세부정보에 넣어주면 메뉴 별 로 카페인이 색으로 표시되고 칼로리는 박스플롯으로 최대, 최소 평균..
태블로 (매개변수, 계산된 필드, 마우스오버) 매개변수: 계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜 또는 문자열과 같은 전역 자리 표시자 값이다. 통합문서의 상호작용 기능과 유연성을 추가할 수 있으며 최종사용자가 값을 제어할 수 있는 수식의 변수. 필터에 드래그앤 드랍 후에 필터 편집을 눌러서 들어간다. 그 중 상위 탭으로 들어가서 필드 기준에 새 매개 변수를 만들 수 있다. 현재의 예시에선 매출이 높은 고객 상위 10명을 사용했다. 매개변수는 통합문서 전체에 적용되며 여러 위치에서 사용 가능하다. 오른쪽에서 조절 가능할 수 있는 것을 확인할 수 있다. 5로 조절하니 상위 5명만 나타난다. 제품을 마우스 우클릭 후 만들기 - 집합을 선택한 후 상위 제품을 만들어보자 필드 기준을 상위에 상위N 매개변수를 사용한다. 상위 제품..
태블로 (막대차트, 분산차트, 대시보드) 태블로가 동작하는 원리 1. 필드는 차원과 측정값으로 구분된다. - 차원: 측정값을 쪼개어 보는 관점 - 측정값: 숫자 형태로 집계가 되는 데이터 2. 측정값은 집계(Aggregate)되어 표현된다. 집계는 합계, 평균, 중앙값, 카운트, 카운트(고유), 최소값, 최대값, 백분위수, 표준편차, 분산을 의미한다. 집계의 형태를 변경해주는 방법은 1) 행 또는 열, 마크 선반에 놓여진 알약에서 마우스 오른쪽 버튼 클릭 후 측정값의 집계 형태를 변경 2) 측정값을 가져올 때부터 집계 형태를 변경 - Windows : 측정값에서 마우스 오른쪽 버튼을 누른 상태로 드래그 - Mac : Option키 누른 상태로 드래그 3. 알약을 행 선반에 놓으면 Y축에 표현, 열에 놓으면 X축에 표현된다. 4. 마크 카드에 있..
tableau-online experiences * 태블로 웹세미나 내용을 정리한 내용입니다. Why tableau? 데이터 시각화를 통해 데이터를 보다 정확하게 이해하고 분석할 수 있도록 도와주는 태블로 시각화를 통한 분석과정이 비즈니스 의사결정에 매우 유용하다고 볼 수 있다. 도입형태와 제품군(prep, desktop, server&online) 실습 데이터 다양한 지원을 하는 것을 확인할 수 있다. 기본적으로 엑셀, 텍스트 파일, 제이슨, pdf도 지원하며 서버에 연결하여 사용하는 것도 가능하다. 파일 열기 실습파일의 경우 엑셀파일이었는데, 파일을 열면 다음과 같은 화면이 나온다. 좌측에 시트의 데이터를 단순히 드래그앤드랍으로 자료를 나타낼 수 있다. 간단한 응용 주문 번호 열을 보면 코드로 작성되어 있는 것을 확인할 수가 있다. 이 중에서 IN..
파이썬( while 반복문) while반복문 리스트 또는 딕셔너리 내부의 요소를 모두 순회하는 경우, 즉 특정 횟수만큼 반복하는 경우에는 for 반복문을 사용하지만 while 반복문 또한 존재한다. # 기본 형태 while Boolean 표현식: 문장 무한 반복문 while True: # '.'을 출력 # 기본적으로 end가 '\n'이라 줄바꿈이 일어나는데 # 빈 문자열 ''로 바꿔서 줄바꿈이 일어나지 않게 한다. print('.', end='') 실행하면 무한하게 ' . '이 출력되게 되는데 프로그램이 종료되지 않는다. 일반적으로 윈도우 사용시 파워쉘이나 프롬프트 창에서 실행하고, 맥에서는 터미널에서 해보는 것을 권장한다. Ctrl + C를 눌러서 종료해준다. while 반복문을 for 반복문처럼 사용하기 i = 0 while i..