퀀트 투자의 7대 죄악

실무에서 일하는 사람들도 백테스트를 할 때, 흔히 저지르는 실수들

<퀀트 투자와 7대 죄악>

1. 생존 편향

2. 미래참조 편향

3. 스토리텔링의 죄악

4. 데이터 마이닝과 데이터 스누핑의 편향

5. 신호의 감소와 회전율

6. 이상치

7. 비대칭적 패턴과 공매도 비용

1. 생존 편향

생존 편향은 투자자들이 흔히 저지르는 실수
편의를 위해(혹은 데이터를 구하지 못해) 현재 상장된 회사만을 사용하여 투자 전략을 백테스트
파산, 상장폐지 또는 인수로 인해 투자 유니버스에서 사라진 주식은 백테스트에 포함하지 않음
생존 편향은 종종 지나치게 좋은 결과를 보여주거나 때로는 실제와 완전히 반대되는 결과를 보여줌
그림 3: 1986년 12월 31일에 Russell 3000 지수에 있었고 오늘날까지 살아남은 회사. 지난 28년 동안 지수의 3,000개 주식 중 500개 미만의 주식만이 살아남음.
지수에서 제외된 주식은 대부분 파산, 상장폐지 또는 장기간의 실적 부진으로 인한 것이기 때문에 살아남은 주식들의 평균은 전체 지수보다 월등히 우수함.

Russell 3000의 전체 주식과 생존 편향이 있는 주식을 대상으로 머튼의 부도 팩터로 구성된 상위 및 하위 포트폴리오의 성과
생존 평향으로 인해 그림 5,6 같이 완전히 반대되는 결과가 나타남.
- 파랑색 : 우량성이 높은 종목
- 빨강색 : 우량성이 낮은 종목

백테스트에서 현재 지수의 구성 종목만을 사용하는 것은 현재 구성 편향의 영향을 받음
- ex) 2023년에 코스피 200에 포함된 종목을 과거에도 코스피 200에 포함되었다고 가정하고 백테스트를 돌려버리는 것.
일반적으로 실적이 저조한 종목은 지수에서 제외되고 실적이 우수한 종목은 지수에 추가됨
현재 지수의 종목을 백테스트에서 과거 시점에 사용하는 것은 미래에 성과가 좋을 회사(지수에 추가될 회사)에 대해 미리 알고 있음을 의미.
변동성이 낮은 주식이 변동성이 높은 주식보다 성과가 뛰어난 변동성 이상현상이 존재
- 그림 9 : 각 시점마다 S&P500에 포함된 종목을 가지고 수익률을 측정(정상)
- 그림 10 : 현재 S&P500에 포함된 종목을 가지고 과거부터 백테스트 한 결과(오류)
  - 빨강색 : 저변동성
  - 파랑색 : 고변동성
현재 S&P500 지수에 포함된 주식을 사용하면 정확히 그 반대 결과가 나옴.
- -> 모든 상승에 대해서는 포착하지만 하락에 대해서는 고려하지 않음.

생존 편향(현재 구성 편향)을 피하기 위해 해야할 것
- 백테스트용 유니버스는 상장폐지된 기업을 모두 포함해야 함
- 지수(예 : S&P500, MSCI World)를 사용하는 경우
  백테스트 시점에 지수에 포함된 종목만을 사용해야 하며, 나중에 지수에 추가된 종목은 제외해야 함.

2. 미래참조 편향

백테스팅이 수행되는 시점에 알려지지 않았거나 사용할 수 없는 정보 또는 데이터를 사용하여 발생
기업들의 재무제표 데이터에는 미래참조 편향이 있는 경우가 많음.
- 회사들은 분기별, 반기별 또는 매년 재무 상태를 보고함
- 기업이 회계연도가 끝난 뒤 재무제표를 작성해 공시하는 데는 평균 1~2개월이 걸리며, 간혹 더 오래 소요되는 경우도 있음(중소기업의 경우 3개월 꽉 채워서 발표하기도 함)
  - 그림 12 : 미국 기업의 분기 재무제표를 발표하는데 걸리는 기간 (평균 28~30일)
  - 그림 13 : 전 세계 기업의 분기 재무제표를 발표하는데 걸리는 기간 (평균 35~37일)

일반적으로 백테스트에는 시간 지연을 적용
- 회계 기간 종료 후 x개월 후까지는 재무제표를 알지 못한다고 가정
일반적으로는 백테스트에서 3개월의 시간 지연을 적용
보다 복잡한 형태의 미래참조 편향은 재작성 편향
- 기업들은 종종 다양한 이유로 재무제표를 다시 작성함
- 일반적으로 사용되는 많은 데이터 소스는 최종적으로 수정된 데이터만 저장

재작성 편향을 해결하는 이상적인 해결책은 공급업체가 원래 보고된 데이터와 날짜를 보관 하고, 데이터가 수정될 때 마다 이를 추적하는 PIT(point-in-time) 데이터베이스를 사용하는 것
- 최초 발표 및 수정 시점이 모두 저장되기 때문에 좀 더 실제에 가까운 백테스트가 가능.

팩터 프리미엄을 평가하기 위해 사용하는 일반적인 접근법 중 하나는 IC(information coefficient)
- 1) 주어진 날짜의 팩터 점수를 기반으로 한 주식의 순위(ex. PBR을 기준으로 1등 부터 2000등까지 순위 구함)
- 2) 다음 기간(일반적으로 다음달)의 수익률을 기반으로 한 주식의 순위 간의 상관관계
  - PBR 기준으로 상관관계가 1이 나오면, PBR을 보고 투자하는게 다음달 수익률을 예측하는데 좋은 지표라고 생각할 수 있음. 즉, IC 값이 높을 수록 좋은 팩터.
PIT가 아닌 데이터, 즉 편향된 데이터는 밸류 팩터의 성과를 약 60% 가량 부풀림
- 그림 14 : PIT가 아닌 데이터로 백테스트 -> IC 값이 평균 8.12%
- 그림 15 : PIT 데이터로 제대로 된 백테스트 -> IC 값이 평균 5.11%

PIT 데이터를 사용할 수 없을 때, 투자자들은 일반적으로 일종의 보고 지연을 적용
- PIT 데이터는 가격이 너무 비싸기 때문에 쉽게 사용할 수 없음. 또한, 데이터가 있어도 핸들링이 어려움.
- 보고 지연 : 재무제표를 몇개월 뒤부터 확인하고 쓸 수 있는가에 대한 가정
  - 지연을 너무 짧게 설정한다면, 잠재적으로 미래 참조 편량을 겪게 됨.(ex. 1개월)
  - 지연을 너무 길게 설정하면 너무 오래된 데이터를 사요할 수 있음.(ex. 6개월)
지연 가정을 1개월에서 3개월로 연장함에 따라 ROE 팩터의 성과는 9% 감소
- 성과가 나빠져도 3개월 정도 보수적으로 지연을 주는 것이 현실에 가까운 백테스트

분할 조정 계수는 잠재적으로 미래참조 편향을 생성할 수 있음
- 분할 조정 계수란? 예를들어, 삼성전자는 250만원이던 주가가 액면분할로 인해 5만원이 됨. 그러면 수정주가를 계산하기 위해서는 과거 250만원에 1/50을 곱해야 됨. '1/50'이라는 값이 분할 조정 계수를 의미.
회사는 유동성을 개선하거나 특정 유형의 고객을 유치하기 위해 주식 분할
- 분할 조정된 데이터(예: 수정주가, 수정BPS)를 사용하면 상당히 미묘한 형태의 미래참조 편향이 발생할 수 있음
예를 들어, 수년에 걸쳐 여러 주식 분할을 한 주식은 수정주가가 매우 낮음(대표적 사례 : 테슬라)
- 기업들은 일반적으로 주가가 유동성에 부정적인 영향을 미칠 정도로 높은 수준으로 상승했기 때문에 주식분할을 선택
- 그런데, 백테스트에서 수정주가 기준 '저가' 주식을 산다는 것은 향후 25년 동안 분할될 주식을 미리 알고 사는 것을 의미
- 이러한 정보는 과거 시점에서 주식을 투자할 당시에는 분명히 알지 못하는 사실
S&P500 지수에서 가격이 가장 낮은 25개 종목의 누적 성과(흔히 '꽁초 전략'이라고 불림 )
수정 주가를 사용할 경우 수익률이 2.5배 좋으며, 샤프 지수는 30%가 더 좋음(실제 S&P500 주가와 차이가 크게 나타남) - 파란색 그래프
- 실제 주가 기준 '꽁초' 전략 구현 - 빨간색 그래프
- 수정주가를 사용하면 수익률이 좋게 나오는 이유는 과거 시점에서 수정주가가 낮은 종목을 선택한다는 뜻은 그 종목이 미래에 수익률이 굉장히 좋아서 주가가 오르고, 그것 때문에 액면분할을 할 주식이라는 점을 미리 알고서 투자한다는 가정이기 때문.
낮은 가격의 주식을 사는 것이 좋은 전략이라는 잘못된 결론을 쉽게 도출

백테스팅을 제대로 하는 적절한 방법은 조정되지 않은 가격, 즉 투자 당시의 "원래" 가격을 사용하는 것
- 그림 19 : 수정주가가 아닌 현실에 가까운 원래 가격을 사용하면, S&P500 지수와 크게 차이나지 않음
- 그림 20 : 샤프지수 관점에서는 오히려 꽁초전략이 변동성이 너무 높기 때문에 S&P500보다 샤프지수가 월등히 낮은 전략
- 그래서 제대로 백테스트를 할려면 지표를 계산할 때는 일반적인 주가(원래 데이터)를 사용하고, 지표를 기준으로 투자 수익률을 측정할때는 수정주가를 사용해야함.
'저가' 주식의 연간 수익률은 벤치마크와 거의 같지만 변동성을 두 배 이상
- -> 저가 주식을 사는 것은 전혀 좋은 전략이 아님

미래참조 편향을 피하기 위해 해야할 것
- 가능한 한 PIT 데이터를 사용
- PIT 데이터를 사용할 수 없을 경우, 보수적으로 (3개월 정도의)지연을 설정
- 분할조정(ex. 수정주가)을 사용할 경우 조심할 것
- 백테스팅 결과가 직관에 어긋날 때는 다시 생각할 것
- 가장 좋은 건, 전략을 실시간으로 실행하여 성과가 백테스트와 일치하는지 확인할 것

3. 스토리텔리의 죄악

이해할 수 있고 직감을 가지고 있는 것에 투자하는 것이 더 편함
- 문제는, 일단 패턴을 찾으면 거의 항상 그것을 설명할 이야기를 생각해 수 있음
- 그러나 무언가를 설명할 수 있다는 사실은 그것의 표본 외 성과와는 아무 상관이 없음
재무 레버리지가 높은 기업(예: 장기 부치/총자산)에 따라 수익률에 차이가 있는가?
- 레버리지가 높은 기업이 본절적으로 더 위험하다고 주장할 수 있으므로, 더 높은 요구 수익률이 필요
- 행동재무의 스토리텔링을 통해 레버리지가 높은 회사의 수익률이 낮아야 하는 이유도 찾을 수 있음
- 부채/총자산(혹은 부채/자본) 비율에 관한 백테스트를 할 경우, 시점이나 유니버스에 따라 성과가 상이하게 나타남
확증 편향: 이전 믿음을 뒷받침하는 정보를 찾고 그렇지 않은 정보는 무시
새로운 데이터에 대한 일반적인 비판 : "데이터가 불과 몇 년 밖에 되지 않으며 역사가 충분히 길지 않다"
물리 과학과 달리 경제 및 금융 분야에서는 시간에 따른 관측치가 하나만 존재(실험이 불가능하기 때문)
데이터가 정상성이 있더라도 월간 단위로 긴 데이터, 혹은 일이나 틱 단위로 적당한 기간의 데이터가 필요
작은 표본에서 오는 편향을 극복하기 위해 최소한 몇 번의 경제 사이클에 백테스트를 적용해야
그러나 문제는 경제 데이터가 종종 비정상성이 있다는 것을 알고 있으며 따라서 20년 전(또는 심지어 몇 년 전)에 일어난 일은 오늘날과 관련이 없을 수 있음
- 국면이 바뀌는 것은 금융에서는 흔한 일
그림 22 : 1987년부터 1997년까지는 벨류 팩터의 성과가 굉장히 좋은 것으로 나옴.
그림 23 : 1997년 말부터 2000년 중반: IT 버블 기간의 기술 섹터에서 가치 전략은 -70% 손실
- 낡은 사업 모델이 곧 이른바 '새로운 경제'로 완전히 대체될 것이라는 믿음
- 사람들은 '닷컴'이라는 이름과 함께 가치가 더이상 무의미하다고 생각
그림 24 : 2000년 중반부터 2002년 후반: 가치 스타일이 강하게 회복(IT 버블 이후 기술 섹터에서 가치주 전략)
- 즉, 똑같은 가치 전략이 이간을 어떻게 보느냐에 따라 사람들은 거기에 맞는 스토리텔링을 적용함.

20년의 역사: 기술 섹터에서 가치 전략은 아무 효과가 없는 것 처럼 보임
기술 섹터에서 전형적인 가치 전략의 샤프 비율은 상당히 나쁘기도 하며 상당히 좋기도 함
- 대체 어떤 이야기를 믿어야 하는가?
더 큰 문제는 사람들이 '작동하는' 팩터만 발표하고 그렇지 않은 팩터는 무시하는 경향이 있음

기간 편향을 피하기 위해 해야할 것
- 가능한 한 오랜 기간을 사용하여, 가능한 한 많은 경제 및 정책 주기에 백테스트
  - 그래서 최근에 발표되는 팩터 전략들은 100~200년 기간을 대상으로 백테스트
- 다양한 경제 사이클에서 성과가 어떻게 달라지는지 이해하고 정부 정책의 개입이 잠재적으로 새로운 레짐을 만드는지를 조사

4. 데이터 마이닝과 데이터 스누핑 편향

데이터 마이닝: 컴퓨터 과학 및 통계 분야에서 정교한 통계 기법, 게산 알고리즘 및 대규모 데이터베이스 시스템과 관련된 대규모 데이터 세트에서 패턴을 발견하는 계산 프로세스
금융에서는 애널리스트가 보여주고자 하는 패턴을 찾기 위해 데이터나 모델을 '조작'하는 것을 의미(=과최적화)
데이터 스누핑, 즉 표본 내 모델에 완벽하게 맞는 패턴이나 규칙을 광범위하게 검색하는 행동
모델의 변수를 미세하게 조정하고 백테스트에서 수익률이 높은 변수를 선택
충분하게 데이터 조작을 한다면, 인 샘플에서 매우 잘 작동하는 모델은 얼마든지 만들 수 있음
그림 28, 29 : 2009년 5월 31일부터 2014년 6월 30일까지 72개 팩터의 성과를 백테스트하고, 6개 스타일 버킷(가치, 성장, 모멘텀/반전, 센티먼트, 퀄리티, 기타)에서 각각 가장 좋은 팩터를 선택하고 6개 팩터에 동이라헥 가중치를 부여한 멀티 팩터 모델을 만듦
- 파랑색 그래프 : 2009년 이전에 성과가 좋았던 팩터를 선택한 후 2009년까지 투자. -> 성과가 굉장히 안좋음. 즉, 빨강색 그래프는 과최적화된 모델.
- 이러한 실수는 트레이딩 하는 사람들이 흔히 저지르는 실수
2009년 5월 31일부터 2014년 6월 30일까지 같은 기간 동안 이 모델의 성능을 백테스트

데이터 스누핑 편향을 피하기 위해 해야할 것
- 미래 참조 편향을 피하기 위해 모델과 백테스트 전략을 구축할 때 point-in-time 데이터 사용
- 한 국가의 주식 데이터와 같이 하나의 데이터 집합을 사용하여 모델을 구축한 후 동일한 방법을 변수에 대한 최적화가 없이 다른 국가나 지역에도 적용
- 단일 국가(예: 미국 주식 또는 일본 주식)를 다루는 경우, 일련의 표본 외 데이터를 준비. 절대로 "검즐 샘플"을 만지지 말고 최종 모델 성능을 확인하는 데만 사용
- 진정한 테스트는 실제 성과!

5. 신호의 감소와 회전율

백테스팅은 종종 거래 비용이 없고 회전율 제약이 없으며 무제한으로 롱숏이 가능하다고 가정
현실적으로 모든 투자자들에게는 제약 사항이 존재
신호가 빠르게 감소하는 팩터에서 매력적인 수익을 거두기 위해서는 상당한 회전율이 필요
- 높은 회전율은 더 많은 거래를 의미하며, 거래에는 비용이 발생
단기 반전: 최근에 실적(=수익률)이 좋았던 주식(예: 지난 달)이 그 다음 달에 하락할 가능성이 더 높음
반전 팩터는 수수료를 고려하지 않을 경우 상당히 훌륭한 주식 선택 전략
거래 당 비용을 Obps에서 30bps로 늘리면 PBR 팩터의 초과 수익은 완만하게 떨어지는 반면, 반전 전략의 알파는 음수로 떨어짐.
- 반전 전략은 매달 포트폴리오를 교체해야 하므로 회전율이 상당히 높음. 그래서 비용에 큰 영향을 받음.

빠른 신호 감소 및 높은 성과를 보이는 팩터
- 엄격한 회전율 제약 조건을 추가하여 거래 비용을 제한하면서 에측력을 포착할 수 있음
예측력과 감소 / 회전율, 비용 사이의 균형이 중요
탁월한 예측력을 가진 모델의 경우 거래 비용 후에도 많은 거래를 통해 더 높은 수익을 창출 할 수 있음.
현실적으로 모든 매니저가 원하는 만큼 거래할 수 있는 것은 아님
대부분의 기관 포트폴리오 관리자들은 어느 정도의 회전율에 대한 제약이 존재
- 회전율 제약 조건은 모델의 성과에 상당한 영향을 미칠 수 있음.
  - 빨강색 그래프 : 회전율 제약 조건이 120%일 경우
  - 제약이 떨어질 수록 성과가 훅 떨어

회전율 제약이 엄격하다고 해서 반드시 리벨런싱 빈도가 매우 느려야 한다는 뜻은 아님
연간 36% 이하의 상당히 엄격한 회전율 제약이 있는 롱-온리이면서 가치주에 틸트된 공모 펀트 포트폴리오를 운용한다고 가정
Russell 3000 지수를 추종하면서 PER 팩터에 틸트를 하며, 연간 추적 오차를 4%로 제한
- 파랑색 그래프 : 1년에 한번 리밸런싱하는 펀드 수익
- 빨강색 그래프 : 월간 단위로 리밸런싱(월 3% 이하 제약)
- 즉, 리밸런싱 주기를 매월로 가져가고, 반면 한 번 리밸런싱을 할 때 회전율을 낮게 가져가는 전략이 좋음.

알파의 감소가 빠른 팩터는 높은 회전율을 요구하는 반면 회전율이 높으면 거래 비용이 더 많이 발생
일부 신호는 너무 빨리 감소하여 알파의 기회가 몇 시간, 몇 분 또는 몇 초 내에 사라짐
1일 반전 팩터(전날 가장 많이 하락한 주식을 사는 것)의 백테스트는 단기 반전이 훌륭한 전략처럼 보임
- 문제는 팩터 자체가 시장이 마친 후에만 계산될 수 있음
- 우리가 신호에 따라 거래할 수 있는 가장 빠른 시간은 다음 날 시장이 열릴 때
그래서 흔히 백테스트를 할 때, 전일 종가와 오늘 종가를 통한 수익률을 사용하여 팩터를 계산한 후 같은 날 종가에 거래(이론적으로만 가능) -> 빨강색 그래프
전일 종가와 오늘 종가를 통한 수익률을 사용하여 팩터를 계산한 후 그 후 다음날 시초가에 거래(현실적으로 가능) -> 파랑색 그래프(수익률이 형편없음)

6. 이상치 - 극단적인 성공과 실패

이상치는 재무 데이터에서 일반적으로 발생
이상치를 샘플에서 완전히 제거(트렁케이션/트림)하거나 원저화를 통해 제한을 할 수 있음
- 트렁케이션: 이상치를 삭제
- 원저화: 특정 x 백분휘 수(종종 5%, 1% 또는 0.1%로 설정)보다 크거나 작은 데이터를 x번째 백분위 수값으로 대체
이상치는 두 데이터 모두에서 분명히 하지만 아시아 ex 재팬에서 더 뚜렷하게 나타남
금융 데이터의 품질은 일반적으로 미국 기업이 글로벌 기업보다 우수
원저화의 간단한 방법은 -100% 미만의 이율을 - 100%로 대체 (100% 이상의 이율도 동일)

Russell 3000 지수의 과거 12개월 이율: 모든 주식의 총 이율을 총 시가 총액으로 나누어 계산
기업의 펀더멘털 데이터를 시장 지수 수준으로 집계하면 이상치가 더 큰 영향을 미칠 수 있음.
- (아래 네모 영역) 이율이 너무 크거나 낮은 기업이 전체 값이 영향을 미침.
1% 수준에서 원저화를 한 후 집계하면 데이터의 흐림은 더욱 의미가 있는 것처럼 보임

한국 유니버스에서 동일하게 이율을 계산하면 매우 변동성이 크며 대부분의 기간에서 음수를 보임
- 1% 수준에서 윈저화하면 많은 변동폭이 사라짐
- 2%로 설정하면 대부분의 이상치가 사라지고 인덱스의 이율이 훨씬 더 부드러워 지지만 필연적으로 유용한 데이터도 제거될 수 있음.

윈저화를 할 때 고려사항
- 데이터 오류 또는 중요한 관측치인지 여부에 관계없이 데이터 샘플의 극단값을 제거. 이상치에는 실제로 유용하고 중요한 정보가 포함될 수 있음
- 임계 백분위 수(1% 혹은 2% 등)는 종종 주관적이고 임의로 선택되며 일률적인 해결책은 없음. 단일 팩터에 대해서도 이상치의 백분위수가 시간이 지남에 따라 변경될 수 있음. 그래서 윈저화를 할때 값을 기준으로 하는게 아닌 퍼센트를 기준으로 하는 것을 추천.
- 백테스트 결과는 우리가 선택한 컷오프 값에 민감할 수 있음.
사분범위(IQR: Inter-quartile range)를 통한 이상치의 제거
- 상위 사분위와 하위 사분위의 차이
- Q1과 Q3를 각각 하위 사분위와 상위 사분위라고 가정하고, Q3-Q1을 사분범위(IQR)라고 함
- 이상치는 범위를 벗어난 관측치로 정의되며, k는 음수가 아닌 상수
- [Q1 - k(Q3-Q1), Q3+k(Q3-Q1)]
- 데이터의 왜도가 크지 않는 한 관측치의 50%(각 측면의 25%)까지를 이상치로 제외할 수 있으며 이상치가 없는 경우 전체 표본을 유지

예를 들어 홍콩 시장의 Book-to-market(PBR의 역수)
- 원래 데이터(하늘색 그래프)를 사용할 경우 BtoM은 매우 극단적인 값을 보임.
  - 이 값이 높다는 말은 PBR이 낮다는 뜻. 그런데 IT 버블 구간에 PBR이 낮은것은 이해가 안됨.
- 윈저화를 했음에도 불구하고 2002년 이전에는 BtoM이 25이상인 이상치가 존재
  - 이걸 윈저화를 해도(파란색 그래프) BtoM이 25 이상(PBR이 지나치게 싼) 극단치가 존재. 그래서 홍콩 시장 전채의 BtoM도 높게 나타남(PBR이 낮음)
- 그래서 문제는 이상치에 대한 제어가 없거나 윈저화 기술을 사용하지 않으면 홍콩 시장은 2008년 글로벌 금융 위기때보다 2000년대 초반이 훨씬 저렴한 것 처럼 보임
  - 4분 범위를 이용한 데이터 핸들링을 해주면(빨강색 그래프) 비로소 IT버블 구간에 BtoM이 낮게 나옴(PBR이 높음)

Z-score 데이터 정규화
- 데이터를 정규화하는 가장 보편적인 방법은 Z-score를 사용
- 값을 평균으로 뺀 다음 그걸 변동성으로 나누어서 정규화하는 방법.
- 대부분의 팩터에 대해 z-score 변환 후에도 여전히 유의한 이상치가 있으며 분포는 여전히 정규분포가 아닐 수 있음
- 그래서 많은 애널리스트들은 이상치 제어를 추가로 적용(예 : 윈저화 또는 IQR 제거)
순위 변환
- 모든 주식의 팩터 점수를 기준으로 순위를 매김
- 순위 변환은 모든 분포를 균일 분포로 자동 변환
- 이를 통해 모든 이상치는 합리적인 데이터 범위로 변환
- 역정규변환(inverse normal transformation)을 한번 더 해줄 경우 팩터는 항상 평균이 0이고 표준편차가 1인 정확한 표준 정규 분포를 따르게 할 수 있음
인도네시아의 이율 팩터의 raw 데이터
- 데이터가 정규분포를 따르지 않고 이상치가 많음
- z-score 정규화를 거치면(그림 45) 이상치는 여전히 존재하지만, 분포의 왜도가 훨씬 줄어듦

그래서 여기다가 순위 정규화를 해주면 균등 분포를 보임
마지막으로 역정규변환(또는 z-score)을 해주면 표준정규분포로 모양이 바뀜.

세 가지 다른 데이터 정규화 기술을 사용하여 멀티팩터 모델의 성능을 비교
- 순위 변환은 대부분의 국가에서 Z-score 변환보다 성과가 우수
- 순위 변환을 기반으로 할 경우 모델간 신호의 평균 상관관계도 더 높음(회전율이 낮아짐)
  - 빨간색 : 순위변환
  - 파란색 : z-score
  - 결과 - 랭킹을 기반으로 멀티팩터를 계산한 것의 IC가 더 높음

정규 방법별 IC

순위 변환의 문제는 팩터 점수들 간의 거리에 포함된 정보를 잃어버림
- 주식 A의 순위가 주식 B의 순위보다 높으면 A가 B보다 1% 높던지 20% 높던지 상관이 없게 됨
- 대부분의 팩터에서 순위는 중요하지만 거리는 소음 이상의 것을 추가하지 않음(즉, 순위만 봐도 되긴함)
단, 가격 모멘텀은 예외
- 모멘텀 점수 사이의 거리가 주식의 미래 수익에 대한 유용한 정보를 포함.
  - ex. 어떤 주식의 수익률이 몇 퍼센트를 기록했다는 정보 등이 미래 수익에 대한 유용한 정보를 포함.
- 순위 변환을 하지 않은 원래의 가격 모멘텀의 수익률이 훨씬 더 높음
가격 모멘텀 팩터의 성과
- 1) 순위 변환을 거치지 않은 원래의 가격 모멘텀 점수를 사용 - IC: 4.3%
- 2) 모멘텀 점수에 순위 변환 - IC: 2.8%
  - 약 35%의 예측력 손실
가격 모멘텀 팩터를 정규화 함으로써 예측력에서 35%의 손실

왼쪽 : 순위 변환 X / 오른쪽 : 순위변환 O

7. 대칭적 패턴과 공매도 비용

팩터 성과를 측정할 때 일반적으로 두 가지 측정 기준을 살펴봄
- 롱/숏 수익률의 차이:
  일반적으로 팩터 기준에 따라 첫 번째 분위수인 상위순위의 주식을 매수하고
  동시에 최하위 분위수의 주식을 공매도하여 롱/숏 헤지 포트폴리오를 구성.
  매수 (그리고 공매도) 포트폴리오의 주식은 동일 비중 혹은 시가총액 비중으로 가중.
  분위수의 선택은 데이터 샘플의 크기에 따라 3 분위수, 4 분위수, 5 분위수, 10 분위수
  롱/숏 포트폴리오는 주기적으로 리밸런싱
  - 예를 들어 PBR이 가장 낮은 종목 n개를 매수하고, 동시에 PBR이 가장 높은 종목 n개를 공매도해서 그 수익률을 롱/숏 헤지 포트폴리오의 성과를 통해 팩터의 성과를 측정.
- 순위 정보 계수(Rank information coefficient):
  1) 주어진 날짜의 팩터 점수를 기반으로 한 주식의 순위
  2) 다음 기간(일반적으로 다음달)의 수익률을 기반으로 한 주식의 순위 간의 상관관계를 살펴봄
  해당 작업을 매 기간마다 반복
  - IC값이 높으면 팩터 점수가 향후 수익률 예측력이 있다고 판단.
그런데 만약 팩터의 성과 패턴이 대칭적이고 선형적이며 단조롭다면, 두 방법 모두 비슷한 결론을 도출
- 수익 패턴이 비대칭적인 경우가 많음
매수와 공매도에 대한 성과를 별도로 측정하기 위해 다음 두 포트폴리오의 초과수익률을 계산
- 매수 포트폴리오의 초과 수익률: 투자 유니버스의 평균(혹은 중위수) 수익률 대비
  상위 분위수 주식들을 동일 비중으로 매수한 포트폴리오의 수익률
- 공매도 포트폴리오의 초과 수익률: 투자 유니버스의 평규(혹은 중위수) 수익률 대비
  하위 분위수 주식들을 동일 비중으로 공매도한 포트폴리오의 수익
이율과 가격 모멘텀에 대한 매수와 공매도 포트폴리오의 초과 수익률
- 이율의 알파는 매수 포지션에 집중되는 반면 가격 모멘텀의 초과수익률은 공매도 포지션에 의해 좌우
- 가치 팩터는 정보 감소 / 회전율이 느릴뿐만 아니라 가격 모멘텀에 비해 알파를 포착하는 것이 더 쉬움
- 가치 프리미엄의 대부분은 공매도를 할 필요가 없이 매수를 통해서도 얻을 수 있기 때문에 단순히 매수를 통해서도 가치 프리미엄을 얻을 수 있음.
  - 밸류 팩터의 경우 롱 포트폴리오의 수익률이 좋고(왼쪽 파란색 그래프), 숏 포트폴리오의 성과는 거의 없음(왼쪽 빨강색 그래프)
  - 모멘텀 팩터의 경우 롱 포트폴리오의 수익률은 거의 없고(오른쪽 파란색 그래프), 숏 포트폴리오의 수익률이 굉장히 큼(오른쪽 빨강색 그래프), 즉 떨어지는 주식에 숏을 쳐서 얻는 수익이 큼. 현실적으로 공매도를 하기는 굉장히 어려움

왼쪽 : PER(밸류 팩터) / 오른쪽 : 가격 모멘텀(모멘텀 팩터)

미국의 28가지 팩터에 대한 매수와 공매도의 초과 수익률
"공매도 포트폴리오의 초과 수익"과 "매수 포트폴리오의 초과 수익" 사이의 스프레드를 기반으로 정렬
- 상위에 있을 수록 공매도에 대한 수요가 많고 공매도 비용이 높기 때문에 알파를 포착하는 것이 어려움
  - 파란색 : 숏 포트폴리오 수익률
  - 빨간색 : 롱 포트폴리오 수익률
  - 맨위는 모멘텀 팩터의 수익률을 나타냄. 모멘텀 팩터는 숏 포트폴리오에서 얻는 수익이 굉장히 큼
  - 맨밑은 밸류 팩터의 수익률.
  - Mean recommendation revision, 3M : 센티먼트 팩터의 수익률 -> 롱숏 대칭적
  - 결론 : 아래 팩터들은 롱 포폴만으로도 수익을 낼 수 있음.

일반적인 백테스팅에서 비용이 들지 않거나 동일한 수준의 비용으로 모든 주식을 공매도할 수 있다고 가정
- 일부 주식의 경우 차입 비용이 엄청나게 높을 수 있으며, 차입이 불가능할 수 있음
- 특정 주식이나 산업 또는 국가의 경우, 공매도를 전면 금지하는 정부 또는 거래소 규칙이 있을 수있음
Data Explorer는 전 세계 주식의 공매도의 가용성과 공매도 비용에 대한 정보를 제공(PIT 데이터)
- DCBS라 불리는 차입 비용은 매일 각 주식에 대해서 1에서 10까지의 숫자를 매김
- DCBS는 대출 기관이 부과하는 수수료를 나타내며,
  1은 가장 저렴한 것을 의미하고 10은 가장 비싼 것을 의미.
DSBS 점수 각각에 대한 비중
- 미국 주식의 거의 90%가 저렴한 혹은 쉽게 빌릴 수있는 것으로 분류
- 2008년 글로벌 금융위기 기간에는 차입비용이 급증하며, 일부 금융주는 공매도 되는 것조차 금지(빨간색 부분)

비현실적 포트폴리오: N-LASR 모델의 순위를 기반으로 상위 100개 주식을 매수하고 하위 100개 주식을 공매도.
모든 주식에 대해 공매도가 가능하다고 가정(빨간색 그래프)
현실적 포트폴리오: N-LASR 모델의 순위를 기반으로 상위 100개 주식을 매수하고 하위 100개 주식을 공매도.
공매도 포지션에서는 DCBS 점수가 1점인, 즉 차입하기 쉬운 주식에 대해서만 공매도를 한다고 가정(파란색 그래프)
- 성과가 비현실적인 포트폴리오 대비 훨씬 낮아짐.

7대 죄악을 피하는 방법 정리

생존 편향: 상장 폐지된 종목을 고려하여 백테스트를 진행
미래참조 편향 : point-in-time 데이터를 사용
스토리텔링과 데이터의 역사 : 백테스트 기간을 길게 하며, 이를 통해 다양한 경제 환경에서의 성과를 살펴봄
데이터 마이닝과 데이터 스누핑 평향: 다양한 국가와 지역 그리고 자산군에 걸쳐 테스트
신호 감소와 회전율: 빠른 감소가 있는 팩터는 피하며, 포트폴리오의 성과는 수수료를 제하고 계산
이상치 제어: 멀티 팩터 모델로 합치기 이전, 각 팩터를 표준정규분포로 치환하기 위해 정규화 기술을 사용
비대칭적 성과와 공매도 비용: 공매도의 가용성으로 인한 영향을 자세히 살펴봄.

참고

저작자표시 비영리 동일조건

코딩에듀킹

퀀트 투자의 7대 죄악

1. 생존 편향

2. 미래참조 편향

3. 스토리텔리의 죄악

4. 데이터 마이닝과 데이터 스누핑 편향

5. 신호의 감소와 회전율

6. 이상치 - 극단적인 성공과 실패

7. 대칭적 패턴과 공매도 비용

7대 죄악을 피하는 방법 정리

댓글

티스토리툴바