ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 논문일기
    카테고리 없음 2022. 2. 24. 14:13

    졸업프로젝트로 논문을 쓰게 되었다. 

    내가 평소 관심이 전혀 없던 분야의 논문을 작성하게 되었다.

    처음에는 그저 졸업프로젝트를 해야할텐데.. 하는 막연한 고민중 제안이 들어오게 되었고, 지금 속한 조에 합류하게 되었다.

     

    추후에 생각해보면 다른 조에 들어가거나 졸업프로젝트를 하지 않고 방학동안 교육을 듣는등의 방안이 나을 수 도 있을 것이다. 

     

    내가 가고 싶은 분야는 데이터 분석가이다. 

    내가 하고 싶은 업무는 B2C, B2B 데이터를 다루며 솔루션을 제안해주는 업무를 하고 싶은데 이러한 프로젝트가 과연 관련이 있을까 막연히 고민이 들었다.

     

    고민에 빠져 프로젝트가 몇일 동안 진전이 안나온 적도 있지만 데이터분석 관련 서적들을 읽으면서 깨달은 점은 데이터 분석에서 가장 중요한건 데이터가 어떠한 방식으로 어떻게 얻어진 데이터인지 출처는 어디인지아는 데이터에 대한 끊임 없는 의구심을 갖는 것이 중요하단 것 하나와 논문 해독능력 그리고 논문의 알고리즘을 구현할 수 있는가가 가장 중요한 포인트였다. 

     

    우리 논문 역시도 메콩국가라는 다소 우리나라 국민들에게 생소한 국가들의 정보격차를 조사하는 것으로 데이터에 대한 애로사항이 가장 컸다.

     

    우선적으로 공신력있는 기관들의 데이터가 절대적으로 부족한상황이 첫번째  문제점

    이러한 데이터들이 어떠한 방식으로 수집되었는가를 알아내고 문제점을 제기하는 것이 두번째 문제점

    미얀마 같은 특정 국가는 기존 조사 데이터도 없이 항상 null값인 경우가 많았다. 이러한 경우 결측치를 어떻게 logical하게 해결할 수 있는가가 세번째 문제점이다.

    이 외에도 여러 문제점들이 있지만 대부분 문제는 데이터에서 비롯한다. 

    이러한 문제를 잘 해결한다면 훗날 데이터 관련 취업혹은 대학원 면접에서 나의 경험을 잘 풀어낼 수 있지 않을까.

     

    동기들의 경우에는 알고리즘을 개발하거나, 회사에 가서 캡스톤 프로젝트를 하는 경우가 많다.

    상대적으로 우리 논문이 졸업프로젝트 발표에선 빈약해 보이고 저거 시간 얼마 안걸리겠는데? 하는 생각을 충분히 가질 수 있기에 

     

    나는 우리 프로젝트에서 우리가 가장 열심히 다루어야할 주제는

    1. 변수들이 어떠한 목적을 가지고 선정되었는가?

    2. 데이터들은 얼만큼 공신력이 있는가?

    3. 해당 논문이 기여할 수 있는 바는 무엇인가?

    4. 분석기법에 대한 깊은 이해 (자료포락분석, 군집분석, 요인분석)

    5. 얼마나 많은 논문을 읽고 공부하였는지 보여줄 수 있어야 한다.

     

    이러한 목표 의식을 가지고 수많은 논문을 접하며 데이터가 어떠한 기준으로 선정되었고 어떻게 수집되었는지 자세히 숙지하며 이 논문을 통해 기여할 수 있는바에 대하여 자세히 설명하고 분석기법에 대한 깊은 이해가 수반된다면 우리 프로젝트는 성공적으로 끝날 수 있을 것이다.

Designed by Tistory.