악성 댓글 유형 분석

Vincentj83
발행일 2024-05-29 조회수 73

1. 관심 있는 문제와 데이터

*들여다보고 싶은 데이터, 데이터와 관련한 문제를 하나로 정의해보세요.
*문제와 관련해, 관심 있는 문제나, 관련 있는 데이터, 필요하다고 생각하는 데이터 목록을 나열해보세요.

  • 주제(문제) : 악플 분석
  • 데이터
    • . 네이버 뉴스에서 무작위로 추출한 1000명의 유저 댓글
    • . 혐오 표현 샘플링 > 사용 횟수
    • . 전체 작성 댓글 수

 

2. 수집 계획, 무엇을 어떻게?

*공개된 데이터인가요? 어디서 찾을 수 있나요? 찾아서 어떻게 변환, 정제할 수 있을까요?
*따로 모아두지 않은 데이터라면 어떻게 수집할 건가요? 누구와 얼마나 함께 해야 할까요?

  • 네이버 댓글창에서 무작위로 수집한 유저의 ID댓글 내역 URL 1000개를 기준으로 데이터 크롤링
  • 자주 사용되는 혐오 표현을 샘플링하고 카운팅
  • (옵션) 해당 유저의 정치성향을 분석하여 정치성향별 혐오 표현 사용현황을 파악

 

3. 오늘 내가 시도해 본 작업

*오늘의 시도에서 느낀 점, 앞으로의 과제와 발전시키고 싶은 방향 등을 자유롭게 메모해주세요.
*텍스트, 이미지, 표나 스프레드시트 링크를 붙여도 좋아요.

  • Naver에서 무작위로 유저 1000명의 URL을 수집
  • 각 URL에 대하여 데이터 크롤링 시도 > 실패(아이패드에서 데이터 크롤링이 가능한 수단을 찾지 못함)
  • .

Comment (1)

작년 언론인권센터에서 진행한 '언론보도 댓글 클린업 프로젝트'도 생각이 나네요!

https://www.mediatoday.co.kr/news/articleView.html?idxno=314847