메뉴 건너뛰기

“미성년 김새론 안 만나” 증거지만 허점·한계 존재
배우 김수현(왼쪽)이 지난달 31일 서울 마포구 스탠포드호텔에서 기자 회견을 열고 배우 고(故) 김새론이 미성년자였을 당시 교제하지 않았다고 주장하고 있다. 연합뉴스
배우 김수현이 지난 31일 기자회견에서 한 주장의 핵심은 그가 배우 고(故) 김새론이 미성년자였을 당시 교제하지 않았다는 것이다. 김수현은 그 증거로 유튜브 채널 가로세로연구소 측이 공개한 2016년, 2018년 카카오톡 메시지 속 문체가 2025년 자신의 문체와 달라 동일인이 아니라는 분석 결과를 제시했다.

이는 진술 분석 전문 기관 ‘트루바움’이 수행한 것으로 저자 동일인 식별 분석 방식을 통해 “92% 신뢰 수준에서 해당 카톡은 김수현이 쓴 게 아니다”라는 결론이 담겨 있다. 하지만 국민일보 취재를 종합하면 이 분석 결과에는 허점과 한계가 존재한다.

트루바움의 저자 동일인 식별 분석 검증은 가세연이 공개한 2016년, 2018년 카톡과 2025년 김수현이 직접 제공한 메시지를 비교 분석하는 방식으로 이뤄졌다. 검증에는 한국어 자연어 처리에 쓰이는 파이선 패키지 ‘KoNLPy’의 Okt 형태소 분석기와 한국어 분석 프로그램 ‘K-LIWC’가 쓰였다.

Okt 형태소 분석기는 ‘연락해’라는 표현에서 ‘연락’과 ‘해’, ‘말해줘’라는 표현의 ‘말’과 ‘해줘’ 등 단어와 조사, 어미 등을 형태소 단위로 쪼갠다. 한국어 문체를 분석할 때 필수적인 기초 분석 도구다. K-LIWC는 메시지 작성자가 ‘싫어’ ‘내가 갈래’와 같은 감정 표현이나 자아 중심 표현어를 쓸 때 어떤 단어를 선택하는지 패턴을 파악한다. 정치인 연설 내용이나 범죄자 발언을 분석할 때 쓰일 정도로 유용한 문체 분석 도구로서 인정받고 있다.

문제는 김수현 카톡 문체를 분석할 때 쓰인 데이터의 양이 너무 적다는 점이다. 검증에는 가세연이 공개한 2016년, 2018년 카톡만 쓰였다. 관련 학계에서는 메시지가 월 100건 이상 오갔을 때 이 방식으로 검증하기에 적합, 결과에 힘이 실린다고 본다. 반면 메시지가 월 10건 미만이라면 검증에 쓰기 부적합하다. 김수현의 경우 적합 사례보다는 부적합에 가깝다는 평가다. 이 사실은 트루바움의 보고서에도 “(텍스트 양이 적어) 분석 대상이 되는 표본의 크기가 제한적인 바, 해석에 한계가 있다”고 명시돼 있다.

문체는 시간이 지남에 따라 바뀔 수 있다는 점도 중요한 변수다. 김수현의 경우 첫 번째 데이터가 2016년인데 검증하는 데 쓰인 비교 데이터는 2025년 것으로 9년이라는 간격이 존재한다. 이 기간 개인의 취향이나 심리 상태가 달라지면 문체는 얼마든지 바뀔 수 있다. 게다가 검증에 사용된 프로그램이 개인의 언어 패턴을 정교하게 분석한다고 하더라도 해당 도구의 특성과 분석 원리를 잘 아는 사람의 도움을 받아 검증을 회피할 가능성을 완전히 배제할 수 없기도 하다.

논란을 더 키우는 것은 김수현이 2024년 팬 소통 플랫폼 ‘버블’에 직접 올린 메시지 속 문체가 가세연이 공개한 카톡과 비슷하다는 점이다. 버블에서는 ‘ㅇㅅㅇ’ ‘ㅎㅅㅎ’ 등 한글 초성 이모티콘이 자주 사용됐는데 이는 가세연 공개 카톡에서도 동일하게 등장한다. 또 ‘할 것 같다’라는 표현을 ‘할거같다’라고 쓰는 등 사소한 맞춤법 습관까지 일치하는 사례가 포착된다.

익명을 요구한 통계 전문가는 1일 국민일보에 “이모티콘이나 일부 표현을 흡사하게 쓴다고 해 전문 기관이 한 저자 동일인 식별 분석 결과 자체를 부정할 수는 없다”면서도 “검증에 쓰인 텍스트 양이 적거나 오랜 시간이 지났다면 정확도가 떨어질 수 있고 문체를 의도적으로 숨기는 것 또한 가능하다”고 말했다.

트루바움은 국민일보에 “검증에 쓸 수 있는 데이터 양이 부족했던 것은 맞는다. 그래서 보고서에도 다수의 자료로 분석하면 결과가 달라질 수 있다고 명시한 것”이라면서도 “저자 동일인 식별 분석 방식은 오랜 전통이 있어 세계에서 두루 쓰이고 있으므로 신뢰도가 떨어진다고 보기는 어렵다”는 입장을 밝혔다.

국민일보

번호 제목 글쓴이 날짜
48173 [탄핵심판 선고 D-1] 尹 대통령 파면 여부 결정할 5대 쟁점… 위헌·위법 중대성 여부가 핵심 랭크뉴스 2025.04.03
48172 "日, 위안부 통해 한국에 좋은 유전자 줬다" 망언 유튜버…서경덕 "당장 추방해야" 랭크뉴스 2025.04.03
48171 '교제살인' 박학선 2심도 무기징역…"참혹 살해에 엄벌 필요" 랭크뉴스 2025.04.03
48170 尹 탄핵, ‘인용’이냐 ‘기각’이냐...챗GPT에게 물었더니 랭크뉴스 2025.04.03
48169 “부부합산 월급800만원” 연금 월500만원 따박따박 들어오네 랭크뉴스 2025.04.03
48168 ‘중국인 스파이’한테 포섭당한 병사…“돈 줄게”란 말에 한미훈련 정보를… [지금뉴스] 랭크뉴스 2025.04.03
48167 한국 관세율, 발표는 25% 행정명령은 26%?…1%P 높아진 이유 답 없는 미국 랭크뉴스 2025.04.03
48166 '다방업주 2명 살해' 이영복 2심도 무기징역 랭크뉴스 2025.04.03
48165 韓관세, 행정명령 부속서엔 25% 아닌 26%…백악관 "부속서 따라야"(종합) 랭크뉴스 2025.04.03
48164 상호 관세 발표 때도 막무가내… 왜곡·거짓 쏟아낸 트럼프 랭크뉴스 2025.04.03
48163 은행 대출 문턱 높아진다…금리 인상·다주택 주담대 중단 랭크뉴스 2025.04.03
48162 여야 지도부, 국회서 尹 탄핵 심판 생중계 본다… 尹은 불출석 랭크뉴스 2025.04.03
48161 '尹 감성팔이' PK서도 철퇴‥뼈아픈 김성태 "잠 못 자" 랭크뉴스 2025.04.03
48160 “‘묻지마 살인’ 박대성 10년 뒤 가석방될 수도… 사형해야” 랭크뉴스 2025.04.03
48159 韓관세, 행정명령 부속서엔 25% 아닌 26%‥백악관 "행정명령 따라야" 랭크뉴스 2025.04.03
48158 尹대통령 탄핵선고일 헌재 안 간다… 관저서 생중계 볼듯 랭크뉴스 2025.04.03
48157 韓관세, 행정명령 부속서엔 25% 아닌 26%…백악관 "부속서 따라야" 랭크뉴스 2025.04.03
48156 서울인데 '31%p' 차이 당선? 수도권 표심 봤더니‥ 랭크뉴스 2025.04.03
48155 이재명 “4·3 단죄 못해 또 계엄…국가폭력 시효배제법 필요” 랭크뉴스 2025.04.03
48154 관세 폭탄 던져놓고…미 재무장관 “보복하지 않으면 여기서 끝” 랭크뉴스 2025.04.03