data_analysis:sql:impala_performance

This is an old revision of the document!


Impala 성능개선 포인트

  • Partitioned 테이블의 경우, 파티션 조건 설정
  • 통계 정보 생성
    • Non-Partitioned 경우

 COMPUTE STATS [TABLE];

  • Partitioned 경우

 COMPUTE INCREMENTAL STATS [TABLE] PARTITION(파티션정보);

  • Not in 대신 EXISTS 사용 : Exists 는 T/F만 Return
  • like, or 은 CPU 리소스를 많이 사용
  • Join 시 큰테이블부터 작은 테이블 순으로 : A Left join B 대신 B Right join A
  • 불필요한 order by 사용 X
Enter your comment:
G A N J J
 
  • Last modified: 2025/07/07 14:12