본문 바로가기

Data

[InfluxDB] Why Flux?

InfluxDB 2.* 에서는 InfluxQL 이 없어지고 Flux 가 전면에 등장했다. 왜 이런 방향을 잡았나 궁금해서 좀 찾아보는 중. 

마침 눈에 띄는 기사가 있다.

But when you’re working with time series data, you don’t necessarily care about the specific point in time record; What you care about is an aggregation of data over time and looking at the change of that over time and so that that simply requires a different way of working with data. In terms of working with the data, you typically want to look at a specific time range and then apply a certain mathematical formula or filter on top of that. And then I want to present the series that fall out of that. And, and so that sort of style and language is just super different from the way that SQL works. So we sort of took a step back and said, you know what? What are the kinds of goals and motivations in terms of working with time series data that we’d like to aim for?

특정 데이터를 찾는데는 SQL 이 요긴하다. 하지만 time series 데이터를 사용할 때는 시간에 따른 변화 상태, 경향 등을 파악하기 위해 특정 시간 범위에 수학적 기법 등을 효율적으로 적용할 수 있는게 더 필요하고 이런 부분에서는 SQL 과 전혀 다른 접근 방식이 필요하다는게 핵인 듯 싶다.

새로운 얘기는 아니다. 장비가 과열로 사고난 시점은 SQL 로 쉽게 찾을 수 있겠지만 사고가 나기 전 장비 온도의 이상 징후를 파악하려면 온도의 변화 추이를 용이하게 볼 수 있어야 하고 그런 면에서는 SQL 은 불편한게 사실 아니던가.

그런데 이게 TSDB 가 각광받는 이유 중 하나인건 이해 가지만 '그래서 왜 Flux 인가?'까지는 잘 모르겠고 좀 더 파봐야 뭔가 올 듯.

참고로 Flux vs InfluxQL : https://docs.influxdata.com/flux/v0.65/introduction/flux-vs-influxql/