본문 바로가기
Science

확통 세특 - 텍스트 마이닝과 프레이밍 이론! 통계적 프레임 분석 (feat. 아이폰14) : 확률과통계, 국어, 사문, 수학, 과학

by 공부하는 엘피 2022. 9. 15.

아이폰 14로 분석하는 프레이밍 이론 텍스트 마이닝
아이폰 14로 분석하는 프레이밍 이론 텍스트 마이닝

 

안녕하세요! 오늘 공부하고 정리해볼 내용은 텍스트 마이닝과 프레이밍 이론, 그리고 두 개념을 이용한 통계적 프레임 분석을 주제로 정리해보겠습니다. 접근의 포인트는 설문조사만이 통계적 기법이 아니란 것입니다. 텍스트 데이터를 수집하고 데이터의 모집단에서 표본을 추출하여 특정 키워드를 마이닝하는 데이터 마이닝 기법 중 텍스트 마이닝을 이용하겠습니다. 이를 활용하여 미디어에서 만드는 프레임을 분석해보겠습니다.

 

엘피의 전자책이 출시했습니다!!

 

성공적인 입시를 위한 세특 주제탐구 비밀노트 | 35000원부터 시작 가능한 총 평점 0점의 전자책,

0개 총 작업 개수 완료한 총 평점 0점인 엘피의세상의 전자책, 교육 전자책 서비스를 0개의 리뷰와 함께 확인해 보세요. 전자책, 교육 전자책 제공 등 35000원부터 시작 가능한 서비스

kmong.com

 

텍스트 마이닝이란?

1만 개 이상의 많은 양의 데이터를 빅 데이터라 합니다.
1만 개 이상의 많은 양의 데이터를 빅 데이터라 합니다.

 

대량의 비정형(unstructured) 텍스트 데이터에서 군집화, 분류, 요약 등을 적용하여 새로운 정보를 도출해내는 데이터 분석법입니다. 비정형 데이터란 구조화되지 않은 데이터로 대부분의 텍스트 데이터를 의미합니다. 텍스트 안에는 단어와 숫자, 기호들이 예측할 수 없는 방식으로 배열되어 있기 때문에 이런 데이터를 비정형이라 합니다. 여기서 데이터를 도출하는 방법을 데이터 마이닝(data mining)이라 하는데 통계학에서 패턴인식에 이르는 분야까지 다양한 기법을 사용합니다. 데이터 마이닝은 통계적 발전 기술을 기반으로 하며 다양한 산업 분야에서 사용되고 있습니다. 이때 데이터가 많을수록 더 의미 있는 데이터를 도출할 수 있는데 빅데이터를 분석하여 정보를 추출합니다.

 

프레이밍(틀 짓기) 이론이란?

고프만(E. Goffman)에 의해 개발된 프레이밍 이론은 사물에 대한 관찰과 이해 과정으로 경험의 조직화 과정으로 정의되었습니다. 맥락이 우리의 행동과 이해를 특징짓는다는 것입니다. 그렇기 때문에 커뮤니케이션에서 메시지, 수용자, 메신저, 매체, 이미지, 맥락, 개념적 틀, 도덕적 틀, 언어의 선택 등 다양한 프레임이 있습니다. 미디어에서 프레임은 뉴스의 프레임을 생각할 수 있습니다. 뉴스는 사회 현안을 다루며 특정 시각을 중심으로 구성된 프레임을 포함하고 뉴스 소재의 선택부터 특정 시각의 강조, 축소, 배제 등의 뉴스 구성 방식에 이르기까지 다양한 과정을 통해 형성됩니다. 언론의 프레이밍 효과는 뉴스 프레임이 구성되는 방식에 따라 뉴스에 대한 개인의 해석과 의견이 달라지는 효과를 의미합니다. 뉴스 프레임은 수용자들이 정보를 분류, 해석, 평가하는데 영향을 줍니다. 뉴스 프레임의 주 결정 요인은 언론인 개인적 요인과 미디어 조직의 요인, 사회적인 압력 등 다양하게 존재할 수 있습니다.

 

통계적 프레임 분석이란?

통계적 조사를 할 때 대부분 설문조사를 먼저 떠올립니다. 설문은 설문조사에 의도를 담을 수 있고 개인이 만든 설문은 더욱더 의도를 갖게 된다. 그렇기에 설문은 신뢰도를 계산할 수 있는데 대부분 통계적 분석에서 이를 놓친다. 하지만 통계적 프레임은 기존의 언론에서 만들고 있는 프레임을 분석하는 방법이기 때문에 개인의 의도가 아니다. 언론에서 만든 프레임을 파악하는 기법이다. 뉴스 미디어에서 특정 키워드에 대하여 어떤 프레임을 만드는지 조사하고 분석하는 방법이다.

예를 들어 아이폰 14가 언론에서 어떤 프레임을 구성하는지 조사해보겠다.

 

1. 네이버 뉴스 검색을 이용한다. 

네이버 뉴스 검색 아이폰 14

 

네이버 뉴스 검색에 아이폰 14를 검색하고 관련도순 정렬, 1개월 기간 설정으로 검색하였고 헤드라인의 텍스트만 메모장에 모았다. 그렇게 메모장에 약 2800개의 텍스트를 정리하였다. 더 자세한 조사를 원한다면 약 1만 개 정도의 텍스트 데이터를 수집하면 된다.

 

2. 텍스트 마이닝을 만들어주는 웹사이트 활용

아이폰 14 워드 클라우드로 프레임 텍스트 마이닝
아이폰 14 워드 클라우드로 프레임 텍스트 마이닝

 

 

아이폰 14를 뉴스 검색을 통해 헤드라인을 모으고 직접 텍스트 마이닝하였다. 눈에 띄는 키워드는 '가격', '인상', '출시', '베일', '250만원', '노치', '탑재' 등이 있는데 한국 언론에서 아이폰 14에 대하여 어떻게 보여주는지 의미하는 키워드이다. 애플이 만드는 베일에 쌓여있는 이미지를 잘 표현하기도 하며 프리미엄 폰 '프로'와 기능과 관련된 '탑재'에 대한 키워드, 그리고 가격에 대한 키워드들이 눈에 띈다. 이런 텍스트 클라우드는 어떻게 만드는가? 과거에는 파이썬과 R을 이용하여 직접 텍스트 마이닝 클라우드를 코딩하였지만 지금은 데이터만 있으면 무료로 분석해주는 사이트가 많다. 대표적인 사이트는 다음과 같고 꼭 직접 만들어보길..!

 

  • 워드클라우드 생성기
  • 워드잇아웃(WordItOut)
  • ABCya! (abcya.com)
  • WordArt (wordart.com)
  • Tagxedo

 

프레이밍 이론과 통계적 분석을 활용한 확통 세특 심화 탐구 주제

이 기법이 좋은 이유는 어떤 특정한 과를 지원하려고 주제를 정할 때 확통에서 가장 쉽게 진로랑 연결하여 가져 갈 수 있다는 점입니다.

  1. 관심 있는 분야의 뉴스 프레임을 조사하여 보고서 작성하기
    경영학이라면 기업 경영과 관련된 뉴스를 정리하고, 간호학이라면 간호사와 관련된 뉴스 키워드, 수학과라면 수학과 관련된 뉴스 키워드를 통하여 최신 트렌드와 프레임을 정리하는 주제 보고서를 작성할 수 있습니다.

  2. 영어뉴스 이용하여 영어과목과 융합하여 보고서 작성하기
    뉴스 검색은 외국 뉴스 검색을 같은 방법으로 조사하여 영어과목과 확률과 통계 과목을 융합하여 보고서를 작성할 수 있습니다.

  3. 교과서 텍스트를 이용하여 단원별 핵심 키워드를 정리하기 
    진로와 관련 있는 과목의 교과서를 타이핑하여 교과서의 단원별 특징 키워드를 정리함으로서 공부법과 연결하는 보고서를 작성할 수 있습니다.

 

데이터 마이닝은 경영, 산업경영, 수학, 통계, 컴퓨터공학, 데이터학과 등 다양한 분야에서 활용됩니다. 자신의 진로에 맞게 주제를 정하고 의미 있는 보고서를 만든다면 강력한 세특을 구성할 수 있습니다.

 

수학과 확통, 정보, 물리 등 다양한 과목에서 사용할 수 있는 주제 중 추천 알고리즘과 관련된 주제도 있습니다. 관심 있는 분은 아래 추천 알고리즘과 MBTI에 대한 글을 읽어주세요!

 

 

추천 알고리즘과 MBTI, 집합과 통계를 이용한 세특! 공학과 사회 과학의 연결 심화 주제 탐구- 수

엘피엘피입니다! 추천 알고리즘의 원리를 파악하고 사회과학적 접근인 MBTI와의 연결고리를 정리한 후 오늘의 세특 주제를 정리해 보겠습니다. 수학에서 집합과 확률과 통계, 수학 2, 미적분, 물

epepstudy.tistory.com

댓글