안녕들 하십니까.
유게에서 라오진 캐릭터 찌찌추정하고 괴문서 작성하고 라오게에서 소설이나 쓰던 대학원생입니다.
전공이 전공이다 보니 기업 데이터를 만질 일이 많은데요.
게임에 관심이 많다 보니 한국의 게임 기업들 데이터 재무제표를 긁어 회귀분석을 돌려 보았습니다.
남궁루리가 게임산업 썰도 푼다고 들었는데, 혹시 이런 것도 콘텐츠가 되나 싶어서 유게에 물어보니까, 한 번 여기 게시판에 올려 보라더군요.
1. 샘플과 분석방법
먼저 샘플 설명부터 하겠습니다.
1) 코스닥과 코스피, 코넥스, 그리고 외감법인으로 등록된 기업들의, 2013년부터 2021년까지의 재무제표입니다. 현재 가장 마지막에 제출된 재무제표가 2021년도 재무제표이기 때문에 거기까지로 끊었습니다.
아마 이 회사들이 2022년 12월 기준으로 아직까지 살아 있는 거의 모든 한국 게임회사들일 겁니다(개인사업자 제외).
2) 2021년 기준으로 121개 회사들이 존재합니다.
2. 분석방법
통계학에서는 이러한 데이터를 패널 데이터(Panel data)라고 부릅니다. 기본적으로 패널 데이터 회귀분석방법은 연도와 개체 사이에 누락이 없는 완전균형패널(Balanced panel)을 전제하고 개발되었습니다만, 여기서는 그것을 무시하고 분석해 보겠습니다(Akay, 2009)
1) 고정효과 between 분석
패널 데이터의 내생성 문제를 해결하기 위해 고정효과 모델(fixed effect)모델을 사용하고, 그 중에서도 개체 간 비교 방법인 between model을 사용합니다. 무슨 말인지 모르시겠다고요? 그냥 2013년부터 2021년까지의 기간 전체를 단일 시점이라고 가정하고 뭉뚱그린 다음에, 기업들 간에 비교를 한 거라 보면 되겠습니다. 즉, 어떤 기업이 어떤 기업보다 X가 다를 때 Y도 차이가 있냐 아니냐를 본 겁니다.
(* 다른 고정효과 모형은 반대로 개체 내의 시계열 변화를 봅니다. 즉, 개체끼리 비교하는 게 아니라 동일 개체의 다른 시점끼리 비교합니다. 어떤 변수가 평소보다 높은 연도에 다른 연도보다 종속변수가 더 어떻다를 보는 겁니다. 저는 이 분석도 했는데, 이것까지 보여주면 너무 스압이니 안하려고 합니다)
3. 변수
1) 종속변수: 수익성
수익성을 측정하기 위해 두 가지 지표를 사용했습니다. 이것이 무엇인지에 대해서는 링크 참조
- ROI (총자본수익률): https://www.jobindexworld.com/contents/view/3432
- ROA (총자산수익률): https://dic.hankyung.com/apps/economy.view?seq=2305
- ROS (매출액 대비 당기순이익): http://m.itooza.com/view.php?ud=2011052715011153760
거의 똑같은 지표기는 한데, 기술통계값에 약간의 차이가 있고 결과에도 차이가 있으므로 분리해서 보여드리겠습니다.
단, 이 종속변수들은 한 해 지연된 변수들입니다. 다시 말해서, 독립변수들이 2013년의 변수들이라면 종속변수는 2014년의 수익률입니다. 이렇게 하는 이유는 두 가지입니다.
- 인과관계 문제. "수익성이 높으니까 매출이 높게 잡히는 게 당연한 거 아님?" 혹은 "수익성이 좋으니까 기업이 자산규모를 늘려서 자산이 높게 나온 거 아님?" 이라는 비판을 피하기 위해서입니다.
- 장기적인 수익성 문제. 저는 게임회사의 장기적인 수익성을 보여주고 싶었습니다. 2013년의 변수가 2014년의 이익을 예측할 수 있다면 어느 정도 장기적인 기업의 성과라고 할 수 있겠죠?
2) 독립변수와 통제변수
독립변수는 뭐가 좋을지 몰라 일단 일반적으로 회귀분석할 때 통제변수로 으레 넣는 것들을 넣었습니다. 참고로, 잔차(Residual)의 정규성을 얻으려는 발악(...)으로 더미변수(1 or 0으로 이분된 변수들)들을 제외하면 모두 로그(log)화된 변수들입니다. 큰 수의 법칙에 의거해서 관측치가 충분히 많으니 괜찮겠지만요....아마.
- 매출액
- 총자산
- 1인당 인건비
- 종업원 수
- 기업의 나이
- 부채비율
- 소속코드(해당 기업이 코스피에 상장되어 있느냐, 코스닥에 상장되어 있느냐 등을 통제하는 더미변수)
- 그룹코드(해당 기업이 예컨대 현대나 삼성 같은 기업그릅 소속이냐를 통제하는 더미변수)
- 기업규모(해당 기업이 중소기업, 대기업, 중견기업, 기타 중 어디에 속해있냐를 통제하는 더미변수)
실제 분석한 결과는 이미 나왔습니다만, 그래프로 정리하는 데 시간이 좀 필요합니다. 새벽이니, 한 잠 자고 나서 그래프로 정리해서 보여드리겠습니다.
어......이게 콘텐츠가 될 만하다면요....이거를 분석한 결과가 방송 콘텐츠가 될까요....?
그 동안 다른 궁금한 변수(ex: "IP의 영향력이 궁금해요!" or "직원들 받는 급료는 영향이 있나요?" or "노동생산성이나 자본생산성은 어떤가요?")가 있으시다면 덧글로 달아주십시오. 데이터에 있는 변수라면 포함해서 분석해 드리겠습니다.
후편: https://bbs.ruliweb.com/userboard/board/700324/read/7004