본문 바로가기
Science

통계의 역사 이야기 확률과 통계 주제탐구 세특 정리

by 공부하는 엘피 2022. 11. 17.

통계의 역사 세특 주제 탐구
통계의 역사 세특 주제 탐구

수학 교육학자 프로이덴탈은 그 어떤 분야보다 판단을 적게 하면서 응용에 주목하는 수학의 분야로 통계를 들었습니다.

통계는 그만큼 배운 후 응용할 수 있는 분야가 많습니다.

통계의 응용이 어떻게 되는지 파악하기 위해 통계의 역사를 주제로 정리해 보았습니다.

 

1. 통계의 역사

응용학문의 발전은 실생활의 필요에 의하여 발전합니다.

전쟁이나 학문적 논의를 통해 수학과 과학이 크게 발전하곤 했습니다. 

통계의 시작은 17세기 사회, 경제 현상을 관찰하려 수량화하려는 시도부터 시작되었습니다.

인구수와 군사력, 토지, 세금, 재산 등을 표와 그림으로 나타내거나, 수집된 자료를 해석하여 그 의미를 공표하는 등 초보적인 통계적 접근이 이 시기에 이뤄졌습니다.

영국과 독일에서는 대량의 자료를 수집하고 정리하여 기술하는 것에 관심을 두었습니다.

 

18세기에는 천문학과 측지학에서 관측지를 어떻게 결합하여 분석하는가라는 문제가 관심을 끌었습니다. 18세기 과학계에서 중점으로 다룬 3가지 문제는 달의 운동에 관한 수학적 기술 문제, 목성과 토성의 운동에 있어서 비주기적 기복 현상에 관한 설명의 문제, 지구 형태를 결정하는 문제였다. 

 

천문학적 관측과 만유인력의 이론과 관련된 문제들은 수리 과학자들의 관심을 끌었고 오차를 어떻게 최소화할 것인지에 대한 문제를 통계적 접근으로 시작되었다. 이 시기에 대표적인 학자 오일러나 마이어, 라플라스, 르장드르, 가우스 등이 여기에 참여하였다.

 

엘피의 전자책이 출시했습니다!!

 

성공적인 입시를 위한 세특 주제탐구 비밀노트 | 35000원부터 시작 가능한 총 평점 0점의 전자책,

0개 총 작업 개수 완료한 총 평점 0점인 엘피의세상의 전자책, 교육 전자책 서비스를 0개의 리뷰와 함께 확인해 보세요. 전자책, 교육 전자책 제공 등 35000원부터 시작 가능한 서비스

kmong.com

 

달의 운동에 특히 관심을 갖고 있던 마이어는 최종적으로 얻은 식의 미지수 세 개를 알아내기 위하여 27번의 관측을 하였고 이들 값을 기준에 따라 유사한 자료를 묶어 3개의 그룹으로 나누고 추정 값으로 표현하였다. 통계적 접근으로 연구를 설계한 것이다!

 

오일러는 토성과 목성의 운동에 관한 연구에서 마이어와 유사하게 관측 데이터를 어떻게 적용할지에 대한 문제에 직면했다. 오일러는 마이어와 달리 필요한 만큼의 관찰 값을 대입하여 미지수를 추정한 후 다른 관찰 값을 대입함으로써 자신의 결론을 검증하고자 했다. 마이어와 달리 오일러는 자신의 결론을 검증하는데 실패했다.

 

이후 확률론에 뛰어났던 라플라스가 이 논쟁에 합류했고 마이어의 관점을 받아들였다. 라플라스는 통계학의 역사에서 획기적인 사건으로 간주되는 최소제곱법에 가까운 아이디어를 제시했고 메어와 보스코비치가 1755년 지구의 형태에 관한 연구 과정에서 로마 근교를 지나는 자오선의 측정 결과를 다루는 방법이 발표되자 통계화의 출발점으로 간주되는 최소제곱법에 관한 이론적 방향이 확고해졌다. 이때 오차의 제곱합을 최소로 해야 한다는 관찰 값의 판단 기준이 시작되었다.

 

 

2. 최소제곱법과 정규 분포, 상관, 회귀의 시작

 1805년 프랑스의 수학자 르장드르는 18세기에 이루어진 마이어와 오일러, 라플라스, 메어와 보스코비치 등의 연구에서 드러나기 시작한 오차를 최소화하기 위한 노력의 결실을 발표하였다. 통계학의 역사에서 최소제곱법은 수학에서 미적분학이 차지하는 거만큼이나 큰 비중이다. 최소제곱법은 19세기 동안 많은 분야에서 급속하게 적용된다.

 

 19세기는 확률론이 이론적으로 활발하게 연구되었고 그 결과 정규 분포에 대한 관심이 고조되던 시기이다. 라플라스와 가우스가 주고받듯이 번갈아 발전시킨 정규 분포에 관한 연구는 천문학에서 오차를 이해하고 설명하기 위하여 주로 이루어졌으나 다양한 분야로 놀랄 만큼 빠르게 확산되었다. 이미 인구조사나 수명 조사, 보험, 국가의 경제 상태 등 많은 분야에서 자료를 정리하고 분석하는 오랫동안의 경험적 지식이 축적되어 있었기 때문이다.

 

 케틀레는 이 시기에 통계의 적용에 있어 누구보다 의욕적인 사람이었다. 그는 복합적인 요인으로 인하여 다루기 어려운 사회과학적 자료 분석에 관심을 가졌다. 그는 이미 오래전부터 출생과 사망에 관한 정부의 통계가 불합리한 방법에 의존하고 있음을 주목했다. 그는 평균과 정규 분포의 적합도 판정에 몰두했다. 그러나 사회과학적 자료에는 고려할 요인이 많이 포함되어 있어 적은 자료의 양으로 문제를 완전히 해결할 수 없었다. 

 

 19세기 중반 갈톤, 에지워스, 피어슨 등은 케틀레가 남긴 문제를 해결하기 위하여 고심했다. 다양한 분야에서 필요로 하는 실험 통계의 방법을 연구하기 시작했다. 오늘날에 널리 쓰이는 상관과 회귀 이론은 이들의 이론에서 시작했다. 특히 갈톤은 재능이 가문 내에 유전되는가에 관심을 가졌다. 그는 당시 유명 인사와 그 친척들로부터 자료를 수집하고 분석하는 통계적 방법을 고안했다. 특히 기발한 아이디어로 유명한 그는 퀸컨크라는 실험 장치를 만들어 이항분포와 정규 분포간의 관계를 간단한 실험으로 직접 확인할 수 있도록 하였다. 그는 변수와 변수 간의 관계에 주목했다. 아버지와 아들의 키를 분석하는 과정에서 상관관계에 관한 그의 아이디어가 이론화되었다. 수학과 과학 성적, 키와 몸무게, 지능지수와 성적 등 요즘 실시하는 상관관계에 관한 연구는 그의 아이디어에서 시작되었다. 갈톤 이후 피어슨이 상관 분석을 보다 정교하게 이론화했다.

두 변수 간에 관계가 있는지 없는지 추측하기 위한 방법이 상관 분석이라면, 한 변수의 값으로부터 다른 변수의 값에 대한 예측을 필요로 하는 경우에 사용하는 통계적 방법은 회귀분석이다.

 

 상관과 회귀 개념이 갈톤에 의해서 도입된 이후 중심적인 이론적 발전이 이루어진 것은 피어슨에 이르러서였다. 피어슨은 비정규 분포에 관한 연구에 몰두하였고 비대칭 도수 곡선을 두 개의 정규 곡선의 합으로 나누는 최초의 수리적 방법은 그의 업적 중에서도 가장 중요한 것이다.

 

 이후 율은 피어슨의 연구가 사회적 자료에 관한 평가나 결과의 원인 분석에 적용하는 데 있어서는 문제가 있음을 발견하였고 이를 해결하기 위해 노력한 결과 사회과학 특히 경제학에서 주로 적용할 수 있는 상관, 회귀 분석법을 제시하였다.

 

 

3. 통계학의 이론적 확립

19세기 후반부터 20세기에 이르러 고셋, 피셔, 네이만, 왈드 등으로 이어지는 통계학자들의 연구 업적은 통계를 독자적인 이론의 위치로 확립시켰다. 아일랜드의 양조 회사에서 일하던 고셋은 소표본으로 모집단에 대한 통계적 추론을 하는 방법에 관하여 연구했다. 그는 1907년 t-분포에 관한 연구를 발표하였다. 

 

 영국의 통계학자인 피셔는 피어슨의 고민거리였던 상관 계수의 정확한 분포 문제를 쉽게 해결하였고, 멘델의 이론에 근거하여 유전에 있어서의 상관 계수에 대한 분석도 성공하였다. 일치성, 효율성, 충분성 등에 대한 명확한 정의, 최우추정법을 통하여 효율적인 통계량을 구하는 과정, 분산 분석 등의 업적을 남겼다.

 

 왈드는 통계적 가설검정에서 틀린 가설을 채택하거나 옳은 가설을 기각하는 위험을 인식하고 통계적으로 이론화하였다. 일반적으로 왈드의 이론을 통계적 결정 이론이라 한다. 이 이론은 네이만이 발전시킨 게임 이론과 관련이 있다. 점추정, 구간 추정, 가설검정의 문제를 주로 다룬다. 네이만은 피어슨과 더불어 가설검정 이론을 발전시켰다. 가설의 검정은 그 가설을 기각할 것인지 채택할 것인지를 결정하기 위한 과정으로 대립 가설과 영가설 간의 관계를 밝힘으로써 기각 여부를 결정하게 된다. 네이만은 당시에 대표적인 표본추출 방법인 유의추출법과 랜덤추출법을 사용하지 않고 신뢰 구간을 이용하여 더욱 정확한 추출 방법을 개발하였다. 

 

통계는 비교적 역사가 짧지만 현대에서 가장 중요하게 사용되는 수학이기도 하다. 통계와 관련된 세특 주제는 아래 포스팅을 확인하길 바란다.

 

추천 알고리즘과 MBTI, 집합과 통계를 이용한 세특! 공학과 사회 과학의 연결 심화 주제 탐구- 수

엘피엘피입니다! 추천 알고리즘의 원리를 파악하고 사회과학적 접근인 MBTI와의 연결고리를 정리한 후 오늘의 세특 주제를 정리해 보겠습니다. 수학에서 집합과 확률과 통계, 수학 2, 미적분, 물

ep-world.com

 

 

확통 세특 - 텍스트 마이닝과 프레이밍 이론! 통계적 프레임 분석 (feat. 아이폰14) : 확률과통계,

안녕하세요! 오늘 공부하고 정리해볼 내용은 텍스트 마이닝과 프레이밍 이론, 그리고 두 개념을 이용한 통계적 프레임 분석을 주제로 정리해보겠습니다. 접근의 포인트는 설문조사만이 통계적

ep-world.com

댓글