Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
data_analysis:data_engineering [2020/01/14 02:18] – [SQL on Hadoop] prgram | data_analysis:data_engineering [2025/07/07 14:12] (current) – external edit 127.0.0.1 | ||
---|---|---|---|
Line 34: | Line 34: | ||
Long Time Query 지원 여부는 해당 시스템이 데이터 웨어하우스 인프라스트럭처(Data Warehouse Infrastructure)에 적합한 시스템인지, | Long Time Query 지원 여부는 해당 시스템이 데이터 웨어하우스 인프라스트럭처(Data Warehouse Infrastructure)에 적합한 시스템인지, | ||
- | | \\ | + | **Data Warehouse Infrastructure** |
- | | \\ * ETL 작업: 데이터 변환 및 노이즈 제거, 파티셔닝 \\ | + | |
- | * 다수 데이터 소스에 대한 통합 | + | |
- | * 애드혹 질의(Ad-hoc Query) | + | |
- | * 타조(Tajo), | + | |
- | | \\ * 수 초에서 수 분 까지 걸리는 쿼리를 수행하는 데 최적화 \\ | + | |
- | * 빠른 응답을 가지는 애드혹 질의 | + | |
- | * 중간 데이터 크기와 지원에 따라 질의가 다소 제약됨 | + | |
- | * 임팔라(Impala), | + | |
- | | | + | |
- | ~~DISCUSSION~~ | + | 수 시간 이상 걸리는 쿼리 수행 가능\\ |
+ | ETL 작업: 데이터 변환 및 노이즈 제거, 파티셔닝\\ | ||
+ | 다수 데이터 소스에 대한 통합\\ | ||
+ | 애드혹 질의(Ad-hoc Query)\\ | ||
+ | 타조(Tajo), | ||
+ | |||
+ | **Distributed Query Engine ** | ||
+ | |||
+ | 수 초에서 수 분 까지 걸리는 쿼리를 수행하는 데 최적화\\ | ||
+ | 빠른 응답을 가지는 애드혹 질의\\ | ||
+ | 중간 데이터 크기와 지원에 따라 질의가 다소 제약됨\\ | ||
+ | 임팔라(Impala), | ||
\\ | \\ | ||
+ | ~~DISCUSSION~~ | ||