이 논문은 2009년 6월부터 2017년 12월까지 한국증권 시장에 신규 상장된 기업이 제출한 증권발행신고서의 텍스트를 머신러닝 기법을 통해 긍정적 또는 부정적으로 분류하는 작업을 수행한 것이다. 분류된 어조에 대한 분석 결과 증권발행신고서 중 투자위험요소에 있어 부정적인 어조가 많은 회사는 최초 공모희망가액에 대비 최종 공모가격 비율을 높게 설정하는 경향이 나타났다. 이런 결과는 최초 공모희망가액 밴드가 낮게 설정되었음을 시사한다. 한편, 증권발행신고서의 어조와 상장 직후 수익률 간에는 통계적으로 유의한 관계가 나타나지 않는다. 이 논문은 한국 금융시장에서 기업이 제출한 비정형화된 텍스트에 나타난 어조를 최초로 분석했다는 점에서 의미가 있다. 또한, 이 논문은 향후 한국어 텍스트 분석을 시도하는 학자들에게 도움이 되고자 비정형화된 텍스트 분석에 사용한 프로그램을 제시한 점에서 의미가 있다.
주제어: 텍스트 분석, 한국어 어조, 머신러닝, 증권발행신고서, IPO 기업