Lastest Update: 20250413

문제상황

틱데이터를 다루는 Operations

  1. Vectorized Processing(Stateless, 1:1 Mapping)
  2. Event Driven Processing(Stateful, 1:N Mapping)

문제해결 #1: Pandas

I/O 부분

Pandas2.0 에서도 문제가 많음.

  1. Read시 Python interpreter에서 pyObj를 Allocation 함. (Dict/List 사용시)
  2. Read시 Pyarrow(parquet, C++ Based)사용하면 Read 속도는 증가.

Vectorized Ops

결과적으로 Aggregator, Div, Mul, Add, Sub 모두 느림. (single Processor)

Event-Driven Ops