프로젝트
문화예술/미디어
여성 표현 수치화를 통한 성평등 의식 개선 프로젝트

프로젝트 소개

뉴스와 미디어에서 여성 차별을 ‘얼마나’ 하는지 구체적인 수치를 보여주고자 데이터를 분석하고 결과를 만듭니다. 이를 통해 앞으로 여성차별을 없애고 양성평등을 위한 긍정적인 방향을 제안합니다.

#뉴스속여성 #미디어성차별 #성별프레임

어떻게 시작하게 되었나요?

저희는 데이터 처리 및 분석을 재밌어하는 컴퓨터공학과 동기 4명이며, 1학년때부터 친한 친구입니다. 평소 저희는 화나는 일에는 함께 분노하고 기쁜 일에는 함께 기뻐하며 여성 인권에 대한 의견을 자주 나누곤 하였습니다.
저희는 과거에 형량 예측 프로젝트 라는 것을 진행했었고 판결을 조사하며 범죄 관련 뉴스를 자주 접했는데 여성이 피해자이건 가해자이건 여성만을 강조하는 제목을 많이 보았습니다. 이를 통해 미디어속에 여성차별을 확인할 수 있었고 이를 다룰 수 있도록 기사에 초점을 맞춘 프로젝트를 계획하게 되었습니다. 

프로젝트에 어떤 의미가 담겨있나요?

미국의 배우이자 미디어양성평등연구소를 운영 중인 지나 데이비스는 사람들이 무의식적으론 여성차별을 인지하고 있더라도 그들이 ‘얼마나’ 차별을 받는지는 모른다고 합니다. 이를 수치화 했을 때, 여성과 남성 모두가 놀랐다고 합니다. 다들 그 정도일줄은 몰랐다는 겁니다. 구체적인 수치를 보여주자 사람들은 양성평등을 위한 행동을 시작했고, 지나 데이비스는 미디어의 여성 차별을 모두 수치화 하였고, 지나 데이비스가 디즈니에서 이에 대해 강연을 하고 난 뒤에 디즈니에서는 최초로 여성 2명이 주인공인, ‘겨울왕국’의 제작을 시작했습니다. 여성 차별의 수치화는 단순히 수치만으로도 사람들이 양성평등 의식을 재고하게 해주고, 양성평등을 위한 노력에 의의를 부여해줍니다. 저희 팀은 우리의 전공과 지식을 활용하여 사회 현상을 분석하고, 20년간 뉴스에 나타난 여성의 언급방식을 비교, 분석하여 앞으로의 작성 방향을 제안합니다. 또한 사회 현상 속의 여성 차별을 수치화하고, 이를 사회에 알려 대중의 양성평등 의식 향상에 긍정적인 영향을 줍니다. IT지식을 이용해 기울어진 운동장에서 여성이 어디에 있는지 찾아 사람들에게 알리고 대중의 양성평등 의식 향상에 긍정적인 영향을 끼치고자 합니다.  

프로젝트 주요 활동

데이터 수집

분석에 필요한 데이터수집 단계에서 여성에 대한 키워드는 "여성","여자"를, 남성에 대한 키워드는 "남성","남자"로 선정하여 지난 20년 간의 기사 크롤링하였습니다. 데이터 전처리 과정을 거쳐, 총 1000만 건의 기사를 수집하였습니다. 

긍정/부정 사전을 이용해 기사의 긍정/부정을 1차 예측하고, 예측된 score가 높은 데이터를 추출하여 기사의 긍정/부정을 예측하는 딥러닝 모델을 구현하였습니다. 이 모델을 활용해 2차로 긍정/부정을 예측하여 기사 긍정/부정 예측 결과의 신빙성을 높였습니다. 

무분별하게 수집한 기사들이 뉴스의 어떤 섹션에 해당하는지 예측하는 딥러닝 모델을 구현하기 위해 네이버 뉴스의 카테고리별 데이터를 크롤링했습니다. 카테고리별 데이터를 통해 모델을 학습 시켜 수집한 여성 뉴스와 남성 뉴스의 카테고리 예측 및 분석에 사용하였습니다.

(사진 : 데이터 분석 수집 자료 화면)

멘토링

기사의 긍정/부정과 카테고리 예측을 위해 언어모델 BERT모델을 활용하였습니다. 하지만 초기에 팀원들 모두 BERT에 대한 개념 외에 구현에 대한 지식이 전무하여 조언을 구할 분이 필요했습니다. 버터나이프크루측에서 지원해주는 멘토링을 활용하여 저희는 BERT 구현 코드에 대해 도움을 주실 멘토분을 컨택했습니다. 멘토분과 주에 한번씩 총 세번 멘토링을 진행하여 필요한 지식을 습득했고 프로젝트에 적용하여 프로젝트의 퀄리티를 높였습니다. 

(사진 : 온라인 멘토링 진행 화면)

딥러닝 모델 학습

방대한 데이터를 주어진 시간 안에 빠르게 학습하기 위해, 가상 클라우드 컴퓨팅을 사용했습니다. 다양한 서비스 중 Google Cloud Platform을 선택하였습니다. 모델 학습 환경은 GPU 4 x NVIDIA Tesla V100, n1-standard-8, Ubuntu 16.04 로 설정하였습니다.

(사진 : 딥러닝 모델 학습 과정)

4. 분석 결과 웹사이트&sns 채널 배포

성별이 언급된 기사의 각 카테고리별 여성, 남성 언급 빈도와 긍부정 비율를 시각화하여 분석 결과를 웹사이트에 배포하였습니다. 추후 SNS 채널에도 분석 결과를 배포할 예정입니다. 

웹사이트 바로가기 : newmedia

팀 소개

팀을 한문단으로 소개한다면?

데이터 처리 및 분석을 재밌어하는 컴퓨터공학과 동기 4명이 뉴스 속 성차별을 수치화하기 위해 모였습니다. 뉴스 속 여성은 어떻게 자리잡고 있을지 타당한 근거를 통해 알아보고 사회의 전반적인 변화를 요구하는 목소리를 내겠습니다.

팀 채널

전체 팀원 소개

  • 조유미 : 팀의 대표를 맡아 데이터 수집 및 관리, 딥러닝 모델을 설계하고, 멘토링 진행을 관리합니다. #코딩중독 #여동생사랑 #다이빙천재
  • 김지은 : 웹사이트에서 활용하고 싶은 기사를 가져와 웹크롤링을 진행, 데이터를 수집하고 데이터로 변경하는 일을 합니다. #ESFJ #똥꼬발랄하고 #활발한 #징니
  • 염유리  : 데이터 수집과 웹사이트 제작을 맡았습니다. 또한 프로젝트 확산 홍보를 맡아 언론사 제보, 유투버 협력 등을 진행합니다. #유일한지방러 #게으른완벽주의자 #고양이러버
  • 양은서 : 웹사이트 크롤링과 웹사이트 제작을 담당했으며, 카드뉴스제작과 sns관리와 같은 프로젝트를 홍보를 진행합니다. #행동대장 #에너제틱 #재기발랄 #선입견제로