산업은행 빅데이터 기술 직무 전공필기시험 후기

2018. 10. 21. 18:24각종 후기, 리뷰들/아무 제품, 서비스

728x90


어제(10월 20일, 토요일) 금융공기업이 동시에 필기시험을 보는 이른바 A매치 데이가 있었습니다.


는 산업은행에 지원했는데 기술직무 중 빅데이터 분야로 지원했습니다.


올해는 빅데이터, 정보통신공학, 생명공학, 기계공학, 전자공학 이렇게 다섯 개 분야 10명 내외 채용이라

 평소보다 좀 더 기술분야 채용 인원 수가 많았습니다.   

 



필기시험 중 전공필기는 기업마다 조금씩 출제양식이 다른데,

기술 직무는 뽑는 인원도 적고 특히 빅데이터는 올해 처음 생긴 채용분야 정보가 너무 없어서 공부방향을 잡는데 어려움이 있었습니다.


특히 다른 기술분야와는 다르게 빅데이터는 빅데이터학이라는 것이 따로 있지 않고 통계, 전산, 경영 등이 잡다구리하게 섞여있어서 일단 뭘 공부해야 할지 감조차 잡히질 않았네요.


처음에는 R이라든가, 빅데이터 분석 방법론, 분석 알고리즘 같은 것을 공부했었는데,

채용공고를 다시보니 '빅데이터(통계학, 산업공학)' 이렇게 적혀있어서 '아차! 방향을 잘못잡았구나' 싶었죠.



그래서 시험 일주일 남겨놓고 부랴부랴 통계학의 기초적인 내용을 공부했고,

산업공학은 도저히 뭘 봐야할지 몰라서 최적화 내용(선형계획법)만 조금 들여다 봤습니다.



시험문제는 대략 아래와 같았습니다.



전공필기는 80분, 10문제로 약술 및 서술형으로 되어있었고 아래와 같은 특징이 있었습니다.



1. 10문제 모두 다분히 통계학 문제로 산업공학이나 전산학은 하나도 없음


2. 공학용계산기 활용 가능이라고 하였으나, 계산문제는 단 하나이며 그것도 NCS보다도 계산이 간단한 문제.

   대부분 증명 및 개념을 알아야 푸는 문제. 


3. 데이터마이닝이나 머신러닝같은 내용(의사결정나무, 신경망, 딥러닝, 군집분석 등)도 절대 없음.



한국은행 전산 시험은 정보처리기사 스타일의 공식이나 알고리즘 암기로 대입해서 푸는 문제들이 많았던데 반해

산업은행 빅데이터 기술 시험은 대학교 전공시험 스타일의 개념이해 문제들이 대부분인 것이 특징이였습니다.



전에 어떤 분 블로그 보고 경제 전공필기문제가 계산이 아니라 개념이해 문제여서 개념 위주로 공부하려고 하였으나

'공학용계산기 소지 가능'이란 말 때문에 계산문제 풀이도 준비했었는데 페이크였었네요... 



문제는 대략 아래와 같았습니다. 통계학 전공자라면 난해한 문제같지는 않지만

비전공자라면 기초지식이 없이 단순암기로는 어려울 수 있는 내용이였습니다.



1. 다중회귀모델 y = bX + e 에서 회귀계수 b의 정의를 행렬연산으로 증명하라. 그리고 b가 불편추정량임을 증명하라.

   

   → 완전한 증명문제로 학교시험 스타일입니다. b 정의하는 식 유도 안해봤으면 풀기 난해한...

       제가 제일 손을 못댄 문젠대 배점은 제일 높습니다. 


2. 표본분산에 관한 잘못된 공식을 주어주고 이 공식이 왜 틀렸는지(불편추정량이 아닌지) 밝히고 맞게 수정하라.


   → 표본분산은 n으로 나누는게 아니라 n-1로 나눠야 하는지를 밝히라는 문제인데, 저도 왜 n-1로 나눠야 하는지

       궁금하긴 했으나 왜 그런지는 모른채로(학교시험도 아니고 회사시험에 그런 류의 문제가 나올거라 생각을 안해서)

       시험장을 가서 급당황스러웠네요. 제 나름대로의 방식으로 간단한 논리로 답을 쓰기는 했는데,

       인터넷을 찾아보니 엄밀하게 증명하는거는 기초통계지식만 가지고 풀기에는 좀 복잡하더라구요.


3. 한 학생의 두 과목 시험점수와 각 과목의 평균, 표준편차를 주고 어느 과목을 상대적으로 더 잘했는지 보여라.


      → 표준점수 Z를 계산하는 유일한 계산문제였습니다. 숫자도 나눗셈하기 좋게 나누어 떨어지게 되어있습니다.

        


그 밖의 약술형 문제로는 아래와 같은 것이 있었습니다.


4. 상관행렬 주어주고 어느 변수가 회귀식을 선형으로 잘 나타내주는가

   그리고 서로 공선문제를 가장 많이 발생시키는 변수쌍은 무엇인가


5. 통계학 표본추출에서 무작위(random)의 의미는 무엇인가, 


6. 회귀분석 모델 생성한 결과 보여주고 회귀식의 적합도를 검정하기 위한 가설은 무엇이고 무슨 지표로 검증하는가




저는 기초통계학 책이랑 '고급통계분석론'(이희연 저) 두 책으로 공부했는데, 어쨌든 일주일 공부한 내용 중에서

꽤 많은 내용이 시험에 나와서 걱정한 것보다는 그래도 아주 못보지는 않은 것 같은데,


다분히 통계학 내용이라 전산쪽에 더 가까운 저에게는 좀 시험범위가 아쉽다는 느낌이 들었습니다.

(전산학은 전산직무 영역이라 구분하기 위해서 의도적으로 배제했을 수도 있겠네요.)



산업은행 기술직무는 매년 뽑는 분야가 약간씩 변동이 있어서 내년에도 빅데이터를 뽑을지 어떨지 모르겠으나


기술직무, 특히 빅데이터쪽 생각하시는 분들께 참고 되었으면 합니다.