초록 열기/닫기 버튼
본 연구는 비정형 텍스트 데이터인 112 신고내용을 각각의 사건유형별로 벡터화하고 유사도에 따라 군집하여, 신고내용 상에서 유사한 특성을 가지는 사건유형이 무엇인지 확인하고자 하였다. 분석을 위하여 A 지역의 지방경찰청에서 약 1년간 수집한 약 425만여 건의 112 신고 자료 중 전처리과정을 통해 178만여 건을 추출하였으며 ‘신고내용’과 ‘종결 시 사건코드’를 활용하였다. 신고내용을 벡터화하여 유사성 거리에 기반한 군집분석을 실시한 결과 6개의 군집이 구성되었다. 아동학대, 스토킹 등이 살인과 같은 중대범죄와 함께 한 군집으로 분류되었으며 가정폭력과 데이트폭력은 주거침입, 협박과 함께 군집되었다. 기타경찰업무로 분류되는 실종, 가출, 납치감금 유형은 변사자 유형과 동일한 군집으로 분류되었으며 살인, 강도 등 범죄 유형과는 근접하게 분포하는 것으로 나타났다. 이러한 결과는 가벼운 유형의 사건으로 분류된 신고와 심각한 사건으로 분류된 신고가 내용상으로는 유사할 가능성을 시사하며, 따라서 초기대응 시 사건유형의 유사성을 고려하여 대응 범위를 설정해야 할 필요성이 있음을 의미한다. 본 연구는 신고내용이 유사한 사건유형들을 군집하여 경찰 초기대응의 범위를 설정하는 데 도움을 줄 수 있다는 점과 일부 사건유형이 심각한 사건으로 확대될 가능성을 고려하여 면밀한 대응을 할 수 있도록 지원한다는 점에서 의의가 있다.
This study was conducted to explore the similarity between incident types by vectorizing 112 reports, which are unstructured text data, into each event type and clustering them according to the similarity to determine what incident types have similar characteristics in reporting contents. For analysis, 1.78 million cases of 112 reports were extracted from 4.25 million cases collected by the local police agency in A region through the pre-processing process and the 'report contents' and 'case codes' were used. As a result of the cluster analysis based on similarity distance by vectoring the report contents, six clusters were formed. Child abuse and stalking were grouped together with serious crimes such as murder, while domestic violence and violence in close relationship were grouped together with home invasion and intimidation. The types of missing, runaway, and kidnapping/detention that were classified as other police duties were classified as the same clusters as those of the ‘dead by unknown reason’ and were found to be distributed in close proximity to types of crimes such as murder and robbery. These results suggest that reports classified as minor types of incidents and reports classified as serious incidents can be similar in terms of reporting contents. Therefore in the initial response, it is necessary to establish a range of responses, taking into account the similarity of the incidents types. This study is meaningful in that it can help the police to set the scope of the initial response by clustering similar incident types and in that it supports a meticulous response in consideration of the possibility that some types of incidents may escalate into serious cases.
키워드열기/닫기 버튼
112 report contents, incident type at closing, incident types of 112 report, text-mining, TF-IDF, t-SNE, cluster analysis