BLOG

샘플 데이터 사용하여Amazon QuickSight 에서 10가지 시각화 자료 만들어보기
작성일: 2018-05-17

Amazon QuickSight를 사용하여 비즈니스 통찰력에 빠르게 액세스 할 수 있도록 시각화를 작성하는 방법에 익숙하지 않은 분들은 이 포스팅을 참고하세요. 이 게시물에서는 샘플 데이터 세트를 사용하여 몇 가지 일반적인 시나리오를 살펴보고 yuor 데이터를 연결하고 고급 분석을 수행하며 모든 웹 브라우저 또는 모바일 장치에서 결과에 액세스하는 방법에 대한 개요를 제공합니다.

 

다음 시각화 자료들은 아래 링크에서 사용할 수 있는 공개 데이터 세트를 기반으로 구축되었습니다. 본격적으로 시작하기에 앞서 지원되는 데이터 소스, 파일 형식 및 일반적인 QuickSight 워크 플로를 살펴보고 시각화를 작성해 봅시다.

 

 

Amazon QuickSight에서 지원하는 데이터 소스는 무엇입니까?

 

게시 할 때 다음 데이터 방법들을 사용할 수 있습니다.

다음을 포함한 AWS 데이터 소스에 연결하십시오.

 

  • Amazon RDS
    • Amazon Aurora
    • Amazon Redshift
    • Amazon Athena
    • Amazon S3
  • 엑셀 스프레드 시트 또는 플랫 파일 업로드 (CSV, TSV, CLF 및 ELF)
  • Teradata, SQL Server, MySQL 및 PostgreSQL과 같은 사내 구축 형 데이터베이스에 연결
  • Salesforce 및 Snowflake와 같은 SaaS 애플리케이션에서 데이터 가져오기
  • Spark 및 Presto와 같은 대형 데이터 처리 엔진 사용

 

이 목록은 계속 증가하고 있습니다. 자세한 내용은 지원되는 데이터 소스를 참조하세요!

 

빠른 답변 기능

 

SPICE는 ad hoc 데이터 시각화를 위해 특별히 설계된 Amazon QuickSight 초고속, 병렬, 메모리 계산 엔진입니다. SPICE는 고 가용성을 위해 설계된 시스템에 데이터를 저장하며, 삭제할 때까지 저장됩니다. 직접 데이터베이스 쿼리를 사용하는 대신 데이터를 SPICE로 가져 와서 데이터베이스 데이터 집합의 성능을 향상시킵니다. 데이터 세트에 필요한 SPICE 용량을 계산하려면 SPICE 용량 관리를 참조하십시오.

 

일반적인 Amazon QuickSight 작업 과정

 

분석 작업을 할 때 일반적인 워크 플로는 다음과 같습니다.

 

  1. 데이터 소스에 연결 한 다음 새 데이터 세트를 만들거나 기존 세트를 선택하십시오.
  2. (선택 사항) 새 데이터 집합을 만든 경우 데이터를 준비합니다 (예: 필드 이름이나 데이터 형식을 변경하여).
  3. 새 분석을 작성하십시오.
  4. 시각화 할 필드를 선택하여 분석에 시각을 추가하십시오. 특정 시각적 유형을 선택하거나 AutoGraph를 사용하여 Amazon QuickSight에서 선택한 필드의 수와 데이터 유형에 따라 가장 적합한 시각적 유형을 선택하십시오.
  5. (선택 사항) 필터를 추가하거나 시각적 유형을 변경하는 등의 요구 사항에 맞게 수정합니다.
  6. (선택 사항) 분석에 시각 자료를 추가하십시오.
  7. (선택 사항) 기본 스토리에 장면을 추가하여 분석 데이터의 일부 측면에 대한 설명을 제공합니다.
  8. (선택 사항) 분석을 대시보드로 게시하여 다른 사용자와 인사이트를 공유하십시오.

 

다음 그래픽은 일반적인 Amazon QuickSight 작업 과정을 보여줍니다.

 

 

 

샘플 데이터 세트로 Amazon QuickSight에서 생성 된 시각화

 

데이터 분석가를 위한 시각화 자료

 

소스:  https://data.worldbank.org/
다운로드 & 리소스:  https://datacatalog.worldbank.org/dataset/world-development-indicators

데이터 카탈로그 : 세계 은행은 국가, 지역 및 세계 수준에서 여러 개발 프로젝트에 투자합니다. 데이터 분석가를 위한 훌륭한 정보 소스입니다.

 

다음 그래프는 아시아, 아프리카, 중동 및 라틴 아메리카에서 2000 년 동안 전기에 액세스 할 수 있는 인구의 비율을 보여줍니다.

 

 

다음 그래프는 현금으로 지불되는 헬스케어 비중을 보여줍니다 (사비용 대 공공비용). 그래프를 통해 자세한 통계를 한눈에 볼 수 있습니다.

 

 

트레이딩 분석가를 위한 시각화 자료

 

Source:  Deutsche Börse Public Dataset (DBG PDS)

Download and resources:  https://aws.amazon.com/public-datasets/deutsche-boerse-pds/

데이터 카탈로그 : DBG PDS 프로젝트는 Deutsche Börse의 거래 시장 시스템에서 파생 된 실시간 데이터를 일반인에게 무료로 제공합니다. 이러한 상세한 금융 시장 데이터가 소스 공급자로부터 자유롭고 지속적으로 공유되는 것은 최초입니다.

 

다음 그래프는 EU 국가 별 최대 거래량의 시장 추세를 보여줍니다. 다양한 주식, 자금 및 파생 상품으로 구성된 XETRA 엔진에서 사용 가능한 데이터를 기반으로 합니다. 이 그래프를 스크롤하여 한 시간 이상 거래를 시각화 할 수 있습니다.

 

 

다음 그래프는 보안 유형별로 그룹화 된 일정 기간 동안의 최대 거래량을 상회하는 통상적인 기간을 보여줍니다.

 

 

데이터 과학자를 위한 시각화 자료

 

Source:  https://catalog.data.gov/

Download and resources:  https://catalog.data.gov/dataset/road-weather-information-stations-788f8

데이터 카탈로그: 도시 교량과 지표 거리에 배치 된 다른 센서 스테이션에서 파생된 데이터는 핵심 정보 소스입니다. 도로 기상 정보 스테이션은 도로 표면의 온도를 측정하는 온도 센서를 가지고 있고 또한 매초마다 스테이션의 대기 온도를 측정하는 센서가 있습니다.

 

다음 그래프는 다양한 RWI 스테이션 센서에서 시애틀의 현재 최대 기온을 보여줍니다.

 

 

다음 그래프는 서로 다른 시간에 도로 표면의 최저 온도를 보여 주며, 특정 연도의 도로 상태를 예측하는 데 도움이 됩니다.

 

 

 

데이터 엔지니어를 위한 시각화 자료

 

Source:  https://www.kaggle.com/

Download and resources:  https://www.kaggle.com/datasnaek/youtube-new/data

데이터 카탈로그: Kaggle은 공개 데이터 세트를 기부할 수 있는 플랫폼을 개발했습니다. 데이터 엔지니어 및 기타 커뮤니티 회원은 이러한 데이터 세트에 공개적으로 액세스 할 수 있으며 개방형 데이터 이동에 기여할 수 있습니다. 총 350 개 이상의 데이터 세트가 있으며 200 개 이상의 추천 데이터 세트가 있습니다. 플랫폼에 다른 장소에없는 몇 가지 흥미로운 데이터 세트가 있으며 다른 열정적인 애호가와 연결해주는 플랫폼입니다.

 

다음 그래프는 유행하는 YouTube 동영상을 보여주고 상위 20 개 채널의 최대 좋아요 수를 나타냅니다. 이는 데이터 엔지니어에게 가장 인기있는 데이터 세트 중 하나입니다.

 

 

다음 그래프는 특정 기간 동안 게시 된 동영상 제목의 최대 조회수에 대한 YouTube 일일 통계를 보여줍니다.

 

 

 

비즈니스 사용자를 위한 시각화 자료

 

Source:  New York Taxi Data

Download and resources:  https://data.cityofnewyork.us/Transportation/2016-Green-Taxi-Trip-Data/hvrh-b6nb

데이터 카탈로그 : NYC Open 데이터는 모든 뉴욕 주민들에게 매우 인기있는 공개 데이터 세트를 호스팅합니다. 이 플랫폼을 사용하면 몇 가지 유용한 시각화를 끌어 내기 위해 데이터 세트에 깊이 관여 할 수 있습니다. 2016 그린 택시 여행 데이터 세트에는 2016 년 뉴욕시의 녹색 택시로 완료된 모든 여행 기록이 포함됩니다. 기록에는 승, 하차의 날짜 / 시간, 픽업 및 드롭 위치, 여행 거리, 항목 별 운임, 요금 유형, 지불 유형 및 운전자가보고 한 승객 수 등을 포함합니다.

 

다음 그래프는 하루 중 일정 기간 동안 승객 수에 따라 그룹화 된 최대 운임을 나타냅니다. 비즈니스 요구 사항에 따라 달의 다른 날까지 확대될 수 있습니다.

 

 

다음 그래프는 2016 년 1 월부터 뉴욕 택시 데이터를 보여 주며 모든 유형의 택시에서 2016 년 1 월 23 일에 탔던 택시 수의 감소를 보여줍니다.

 

 

날짜와 지역에 대한 써치는 다음의 뉴스 리포트를 보여줍니다.

 

 

결론

 

Amazon QuickSight를 사용하면 시각화를 작성하고, 임시 분석을 수행하고, 통찰력을 신속하게 생성하여 시계열 데이터 전체의 패턴을 볼 수 있습니다. 오늘 시도해 보시기 바랍니다!

 

원문 URL: https://aws.amazon.com/ko/blogs/big-data/10-visualizations-to-try-in-amazon-quicksight-with-sample-data/

** 메가존 TechBlog는 AWS BLOG 영문 게재글중에서 한국 사용자들에게 유용한 정보 및 콘텐츠를 우선적으로 번역하여 내부 엔지니어 검수를 받아서, 정기적으로 게재하고 있습니다. 추가로 번역및 게재를 희망하는 글에 대해서 관리자에게 메일 또는 SNS페이지에 댓글을 남겨주시면, 우선적으로 번역해서 전달해드리도록 하겠습니다.