data_analysis:data_engineering

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
data_analysis:data_engineering [2020/01/14 02:17] prgramdata_analysis:data_engineering [2025/07/07 14:12] (current) – external edit 127.0.0.1
Line 34: Line 34:
 Long Time Query 지원 여부는 해당 시스템이 데이터 웨어하우스 인프라스트럭처(Data Warehouse Infrastructure)에 적합한 시스템인지, 아니면 빠른 쿼리만을 처리하기 위한 분산 쿼리 엔진(Distributed Query Engine)인지를 결정한다. Long Time Query 지원 여부는 해당 시스템이 데이터 웨어하우스 인프라스트럭처(Data Warehouse Infrastructure)에 적합한 시스템인지, 아니면 빠른 쿼리만을 처리하기 위한 분산 쿼리 엔진(Distributed Query Engine)인지를 결정한다.
  
-| \\ ** Data Warehouse Infrastructure** \\  | \\ **Distributed Query Engine ** \\  | +**Data Warehouse Infrastructure**
-|* 수 시간 이상 걸리는 쿼리 수행 간ㅇ +
-  * ETL 작업: 데이터 변환 및 노이즈 제거, 파티셔닝 +
-  * 다수 데이터 소스에 대한 통합 +
-  * 애드혹 질의(Ad-hoc Query) +
-  * 타조(Tajo), 하이브(Hive) +
-|* 수 초에서 수 분 까지 걸리는 쿼리를 수행하는 데 최적화 +
-  * 빠른 응답을 가지는 애드혹 질의 +
-  * 중간 데이터 크기와 지원에 따라 질의가 다소 제약됨 +
-  * 임팔라(Impala), 프레스토(Presto) +
-|+
  
-~~DISCUSSION~~+수 시간 이상 걸리는 쿼리 수행 가능\\ 
 +ETL 작업: 데이터 변환 및 노이즈 제거, 파티셔닝\\ 
 +다수 데이터 소스에 대한 통합\\ 
 +애드혹 질의(Ad-hoc Query)\\ 
 +타조(Tajo), 하이브(Hive) 
 + 
 +**Distributed Query Engine ** 
 + 
 +수 초에서 수 분 까지 걸리는 쿼리를 수행하는 데 최적화\\ 
 +빠른 응답을 가지는 애드혹 질의\\ 
 +중간 데이터 크기와 지원에 따라 질의가 다소 제약됨\\ 
 +임팔라(Impala), 프레스토(Presto)
  
 \\ \\
 +~~DISCUSSION~~
  
  
  • data_analysis/data_engineering.1578968261.txt.gz
  • Last modified: 2025/07/07 14:12
  • (external edit)