여기서 여러 정보를 얻기도 했고, 유학을 준비하시는 직장인 여러분께 도움이 되고자 올립니다.
학부생분들이나 대학원생분들이 리서치 경력을 갖고 지원하시는 경우가 많지만 저는 제 직장 경력을 어필해서, 현재 재직 중인 직종과 다른 분야에서 어드미션을 받았습니다.
[SOP]
저는 현직 펀드매니저입니다. 학부는 Computer Science 전공이지만, 제대 후에는 계속 자산운용사에서 지원 시점 기준 만 8년 정도를 근무하고 있었습니다. 퀀트형 펀드를 운용한 것도 아니기 때문에, CS 관련 경력도, 데이터 사이언스 관련 경력도 쓸 것이 없어서 SOP에 공을 들이고자 했습니다.
SOP를 쓴 시간은 직장인이자 아이의 아빠이기 때문에 충분하지 못했지만, 출퇴근하는 길에 아래 포인트와 그 근거를 끊임없이 고민했기 때문에 실제 작성 시간을 줄일 수 있었던 것 같습니다.
(1) 펀드운용 중 경제/시장 분석 과정에서 통계적 이론과 패키지를 사용했고
(2) 머신 러닝 알고리즘도 시도해 봤지만
(3) 내가 아는 통계이론과 머신 러닝 알고리즘에 어떤 문제점(한계점)이 있음을 인식했다(개선법 살짝 언급)
(4) 그래서 이 석사과정을 통해 (이런 저런 모델, 프로그램을 개발함으로써) 펀드 매니저의 역할을 스마트한 질문을 하는 사람으로 재정의하고자 한다.
개인적인 내용이 많긴 하지만 여러분의 꿈을 이루는 데 조금이라도 도움이 되고자 조심스럽게 SOP를 공개해 봅니다(위에 링크). 당연히 무단으로 복제하실 분은 없으리라 생각되고(불합격의 지름길이겠죠), 처음에는 막연하기만 한 SOP 작성에 도움이 되시길 바랍니다.
[Test scores]
2004년에 토플 CBT보고 IBT는 본 적이 없었는데 다행히 딱 100점 나와서 그만 보기로 했습니다.
GRE가 문제였습니다. 이것도 출퇴근 길에 인강을 많이 보고, 주말에는 육아와 병행하면서 시험을 봤습니다. 첫 시험에 버벌 156가 나와서 좋았는데, 퀀트 공부를 너무 안 해서 165가 조금 아쉬웠습니다. 사실 GRE를 한 번 더 보지는 않으려고 했습니다. 그런데 SOP 얼개를 잡다 보니까 그 메시지나 제 커리어가 “나는 펀드 매니저로서 계량적인 분석능력도 강하다”는 것이었고, 퀀트 165는 약해 보여서 한 번 더 봤습니다. 11/3일에서야 봤기 때문에 - 첫 마감일은 12/14일이었으므로 SOP도 급했죠 - 상당히 촉박했지만 그래도 어쨌든 퀀트 168점이 나와서 그냥저냥 만족한 채 GRE를 끝냈습니다. 직장인들께서는 제 GRE 후기를 참고하셔도 좋을 듯합니다(link).
[추천서]
학부 교수님과 직장 대표님(저를 뽑아 주신 분이고, 다른 회사로 이직하심), 그리고 제가 운용하는 펀드의 기관 투자자(제 고객이죠)에게 받았습니다. 개인적으로는 기관 투자자에게 받은 추천서가 호소력이 있었을 듯합니다. 그 이유는 (1) 커미티가 고객이 쓴 추천서는 별로 보질 못해서 눈에 띄었을 것 같고, 2) 펀드 운용성과가 우수했기 때문입니다.
처음에는 기관 투자자에게 추천서를 부탁하면 회사에 제가 유학을 준비한다는 사실이 알려질 수 있어서 배제하고 추천서 써 주실 분을 물색했습니다. 그렇지만 아무래도 “치열한 주식시장에서 경쟁해서 피어 그룹 중 1등을 하고 있는 펀드 매니저다”라는 추천인의 메시지가 제 프로페셔널한 경쟁력을 보여 줄 수 있고, 제 SOP를 더욱 돋보이게 할 수 있을 것 같아서 기관 투자자를 찾아갔습니다(원래 정기적으로 미팅을 하는 관계입니다). 돌이켜 보면 참 잘한 판단이었던 것 같습니다.
그래서,
SOP가 펀드 운용을 하다가 분석적 문제를 해결하면서도 새롭게 인식한 문제를 제시, 또 제 커리어 목표를 제안하는 역할을 하고
학부 교수님 추천서가 제 학업 성적이나 지적 호기심을 설명(제가 메일로 10년 전에 제가 했던 질문들, 공지한 클래스 성적, 교수님과 주고받았던 메일들, 게시판에 제가 쓴 글들을 보기좋게 편집해서 제공해 드렸습니다)하며,
대표님 추천서가 회사 내에서 보여 준 업무적 성과를(직장 생활 첫 4년)
기관 투자자 추천서가 펀드의 운용 성과를 증빙하는 것으로(직장 생활의 그 다음 4년)
이루어지도록 SOP + 추천서 모양을 그렸습니다. 그러면 대학교 4년과 직장생활 8년이 빠짐없이 커미티에 전달될 것이기 때문이니까요.
[지원결과 발표 후 느낀 점]
직장인으로서 코스웍 석사를 원했고, 코스웍 석사만 지원했지만(기회비용상 가급적 3학기 과정이나 그 미만으로), 이것도 핏이 중요한 것 같습니다. 금융권 다니는 사람이 좋아하는 컬럼비아가 목표 학교 중 하나기도 했는데, 데이터 사이언스와 통계석사 모두 어드미션을 받은 것은 제 커리어와 목표가 컬럼비아 과정들이, 졸업생들이 지향하는 바와 잘 어울렸기 때문인 듯합니다.
[학교별 결과발표 특징]
USC랑 컬럼비아 통계는 롤링 어드미션입니다. 결과 발표도 상당히 빨랐고요. 빨리 지원하시는 게 유리할 듯합니다. 다른 곳은 waitlist없이, acceptance rate(어드미션 오퍼 중 accept한 지원자의 비율)을 감안해서 어드미션을 주거나(CMU), 1차와 2차로 나누어 어드미션을 주기도 합니다(컬럼비아 데이터 사이언스가 3/26일 1차 오퍼, 4/6일 2차 오퍼, 4/9일 1차 오퍼 수락 데드라인). 하버드와 지오텍은 바로 떨어졌고 다른 정보도 못 구했습니다. 유펜은 3/15일 마감에 4월 중순 이후에나 발표날 것 같습니다. 너무 느리죠.
[입학할 과정 선정]
사실 컬럼비아 데이터 사이언스와 컬럼비아 통계 중 아직도 고민 중입니다. 데어터 사이언스 오퍼 수락 여부를 4/9일까지 정해야 되고, 컬럼비아 통계에는 벌써 3,500불 디파짓(환불 불가)을 넣어둔 상황이고요.
이 두 과정에 대해 많은 분석을 하고 있습니다.
데이터 사이언스 석사 과정을 가면 통계 석사 대비 아래 코스 수강이 가능해집니다(저의 경우)
(1) Computational Learning Theory -> 머신러닝 모델 성능을 평가하는 이론
(2) Advanced Big Data Analytics -> Probabilistic graphical models을 이용한 프로젝트 수행(EECS 코스로 응용과목임. 이론 아님. 프로젝트: Implement fast probabilistic inference in a graph data base using e.g. expectation propagation (EP) and by developing an efficient data structure for conditional densities. 제시된 총 60개 프로젝트 중 택1)
(3) Bandits and Reinforcement Learning -> 매일 변하는 자본시장에서 머신 러닝 프로그램을 만드려면, 독립 코스로 들으면 좋을 것 같은 과목
(4) 옵션1. Deep Learning(이론 중심+프로젝트, CS과목);
옵션2. Deep Learning for Computer Vision and Natural Language Processing(응용 중심+이론보완, EECS과목); or
옵션3. Topics in Learning Theory(이론 과목) -> Online learning, active learning 중심으로 배워서 역시 매일 변화하는 자본시장에서 머신 러닝 프로그램 만드는 데 도움이 될만한 과목을 들을 수 있습니다.
데이터 사이언스 석사와 통계간 공통 과목은 물론 확률, 통계, Traditional 머신러닝, 딥러닝이고, 통계석사가 전공필수 과목이 적어서 NLP나 강화학습도 수강 가능합니다.
통계 석사를 한다면, 데이터 사이언스 대비해서
(1) 해석학
(2) 베이지언 통계
(3) Machine Learning with Probabilistic Programming
과 같이 수학, 통계에 기반한 이론과 머신러닝 과목을 더 깊이 들어갈 수 있습니다.
지적 호기심은 둘 다 끌리는 데 뭐가 제 커리어에 더 도움이 될지 고민입니다. 미국 헤지펀드들 잡 포스팅이나 내부 미팅해 본 사람 이야기를 들어보면 머신러닝 분야가 아직 도입, 테스트 단계이고, 이것만으로 충분한 수익을 낸다고는 할 수 없는 단계로 보이고, 그래서 졸업 후 할 수 있는 영역은 많아 보입니다(거꾸로 업계가 시행착오만 반복하다 기대에 못 미치는 성과만 내고 끝날지도....)
어차피 이건 제가 결정해야 될 문제이지만, 그동안 비교해 둔 게 아깝고, 이 비교에 관심을 가질 만한 분도 계실 것 같아서 포스팅에 추가합니다.
그래도 혹시 어느 코멘트도 좋으니 제 결정에 도움이 되실 만한 말씀해 주시면 감사하겠습니다.
제가 석사 과정 또는 졸업 후 만들고 싶은 것은
(1) 주식시장 전략 시뮬레이터 (대용량 데이터를 읽어서, 전략을 기술하면, 포트폴리오 수익률을 시뮬레이션해 주는)
- 세부 기능으로 GAN 에서처럼 ‘적군 투자전략’이 있어서, 이런 적군을 이기는 전략을 테스트할 수 있는 프로그램
(2) 주식시장, 경제 상황 등을 분석해 주는 Automatic Statistician (애널리스트 대체재)
(3) 기업들의 전자공시 파일을 읽어서 NLP처리한 뒤, 그들이 어느 섹터들에서 영업활동을 하는지를 숫자로 표기(sum up to 1)
(4) 인간 트레이더와 알고리즘 트레이더간 매매비용을 (근)실시간으로 비교해서, 어느 쪽이 더 비용을 절약하는지를 분석하는 프로그램
등에 관심이 있습니다. 물론 혼자 이걸 다할 후는 없고, 팀으로 해내야겠지요. 혹시 비슷한 관심 있으신 분 연락 주세요. 이 글은 오래 뒤에 안 보겠지만 SOP 링크는 그보다는 더 오래 갈 것 같습니다.
그렇지만 이러면서도 아직까지, “자율주행차는 도로상황이 아무리 복잡해도 물리법칙 하에 움직이고, 빨간 신호등은 언제나 항상 같은 의미를 갖는다. 그래서 대단히 복잡하고 데이터가 많아도 결국 해결 가능한 문제이다. 하지만 자본시장은 어제 빨긴 신호등의 의미가 오늘은 정반대일 수도 있다. 머신러닝이 이런 자본시장에서도 워킹하겠는가, 얼마나 하겠는가, 이익을 얼마나 낼 수 있겠는가?” 라는 자문도 계속 하고 있습니다.