일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- bool
- Set
- Python
- Tuple
- 언어학 #이론언어학 #자연어처리 #개론
- 숫자형
- 문자열
- 미니프로젝트 #XYZ세대 #도서제목분석 #워드클라우드 #워드투벡 #대응분석 #word2vec
- 자연어처리 #언어학 #이론언어학 #형태론
- while
- 자연어처리 #언어학 #이론언어학 #통사론
- Anaconda
- IF
- for
- list
- jupyter notebook
- Today
- Total
미나랑 해보자
대학원 진학이유, 데이터사이언스 대학원을 선택한 이유, 본인의 강점 본문
앞으로의 미래를 어떻게 설계해 나갈것인가는 매우 중요한 물음이라고 생각한다.
4년 동안 학과 내 학회생활을 하면서 대학원이든, 취준을 하는 선배들을 보았고, 지금은 대학원을 진학하기로 마음을 굳혔다. 이 마음을 정하기 위해 나는 나를 아주 여러가지 방면에서 실험했다.
<스스로에게 했던 실험들>
1. 학회 참여
말 그대로 나는 1학년 때부터 학회에 자주 참여했다. 선배의 추천으로 처음 참여했던 곳은
세미오시스 학회(http://semiosis.hufs.ac.kr/wp/?PHPSESSID=6c81ff97b2b8908114b2f7f3181b3dd5)에서 추최하는 세미오시스 캠프였고, 마침 기호학에 대해 수업을 듣고 있어서 발표논문집에 열심히 필기도 하면서 행사에 참여했던 기억이 있다. 그 이후에도 세미오시스 캠프는 2번 더 참여했다.
2학년 여름방학때는 한국언어학회 언어학학교(https://sites.google.com/view/2019lskls/)에 준회원으로 참여했다. 마침 학회에 알게된 선배가 이런게 있다고 알려주었고, 언어학에 대해 더 알고싶다는 마음으로 참여했다. 교수님이 권하신 것도 아니고, 누가 돈을 준 것도 아닌데 지금 생각해보면 공부에 참 열정이 많았다 싶다.
언어학학교에서 좋았던건 학교에 없던 EEG를 심리언어학 시간에 시연하는걸 볼 수 있었다는 점, 언어데이터를 이용한 통계를 처음 접했다는 것(그 당시에는 R에 너무 미숙했고, 반만 알아들으면 성공이다라는 마음으로 수업에 임했다)이다. 또한, 음성학 시간에 자세히 다루지않는 prosody에 대한 심도있는 강의와 또한 접하기 어려운 수화언어강의까지 들을 수 있어 보람된 방학이었던 기억이 있다.
3학년 가을에는 음성에 대해 계속 공부할 수 있을까라는 고민에 대한 답을 찾기 위해 한국 음성학회 가을학술대회(https://www.speechsciences.or.kr/)에 참여했다. 음성학을 하는 교수님 중에 나와 동명이인인 교수님이 계셔서 혹시나 만나뵐 수 있을까하는 기대를 가지고 참여했지만 아쉽게도 온라인으로 진행되어 그럴 기회는 없었다. 이때도 학교에 발표로 참여하는 연구실이 있었지만 나와는 전혀 관련이 없어 다 내 사비로 참여했다..ㅋㅋㅋ 교수님들과는 아무런 연관이 없다. 그래도 참여해서 교수님을 뵈면 자주 인사드리곤 했다.
일개 학부생 나부랭이인 내가 학회행사에 혈혈단신으로 참여한건 정말 용감한 시도였다고 생각한다.
아마도 더 배우고 싶다는 간절함으로 가득했던 것 같기도 하고...
2. 다른 전공에서 학점 받아보기
대학은 다른 교육기관보다 자율성이 보장되는 곳이다. 자신의 전공 뿐만 아니라 다양한 곳의 수업을 수강할 수 있고 우리 학교의 경우 타전공 강의를 수강했다면 <자선>과목으로 인정된다. 캠퍼스간 문제가 있어 수강이 불가하다면 교수님의 허락만 있다면 학점을 받지않고 '청강'형태로도 수업을 수강할 수 있다.
나의 경우, 듣고 싶은 수업은 다 들었던 것 같다. 고등학교 때 윤리와 사상을 배웠던 걸 살려서 윤리학 수업을 수강했었다. 언어와 공학 전공 교수님의 추천으로 통계학과에서 기계학습 수업도 용감하게 수강했고, 다행히 결과도 나쁘지는 않았다. 요즘은 융소에서 빅데이터 수업을 듣는데 백엔드 분야를 많이 배울 수 있을 것 같아서 기대가 된다.
<대학원 진학이유>
그래서 결론은!
내가 나에게 했던 실험들을 통해 대학원을 진학하겠다는 목표를 굳힐 수 있었다는 것이다.
학회에 참여하는 내 모습을 보니 나 스스로 공부를 하고 싶다는 열의가 크고,
배우고 싶고, 연구하고 싶은 분야가 있다면 타 전공이라도 찾아가서 배우고 결과를 얻어오는 나를 대학교 4년 내내 발견할 수 있었다.
그리고 확실히 데이터 사이언스와 자연어처리분야에는 내가 하고 싶은 일들이 있다.
부족한 언어데이터 구축하는 사업에도 참여하고 싶고, 언어전처리 과정에도 참여하고 싶다.
특히, 이루다처럼 편향된 데이터가 활용되지 않도록 데이터를 잘 정제할 수 있는 방법을 찾아내고 싶다.
마지막으로 누군가에게는 특권처럼 여겨졌던 언어데이터(판결문이나 약관, 어려운 전공서적 등등)를 해석, 요약할 수 있는 서비스를 만들어서 많은 사람들에게 장벽을 낮춰주고싶다는 생각이 있다.
인공지능의 의의는 특권층이 아닌 사람들이 특권층이 누리던 지식을 공유하고, 같은 서비스를 누릴 수 있다는 것에 있다고 생각한다.
꼭 언어데이터 뿐만 아니라 광고, 음악, 미술 등의 예술분야, 그리고 특권층의 소유물이라고 여겼던 의료나 금융분야에서도 그 모든 것이 데이터가 되기 때문에 이것을 더 많은 사람들이 해석하고 누릴 수 있도록 할 수 있다. 많은 사람들의 전반적인 문화수준과 지식수준을 향상시켜줄 수 있다고 믿는다.
데이터를 다루고 해석하고 처리하면서 나의 다양한 호기심도 채우고, 공부를 통해 사람들에게 더 풍요롭고 편리한 삶을 제공할 수 있다면 행복하게 살 것 같다.
이런 목표와 태도를 가진 나는 대학원에 진학해서도 지치지 않고 계속해서 나아갈 수 있지 않을까
<데이터사이언스 대학원을 선택한 이유>
그리고 나는 데이터사이언스대학원을 준비하기로 마음먹었다. 이 결정엔 여러가지 이유가 있다.
먼저, 데이터산업은 확실한 미래의 먹거리이다.
이 세상의 모든 것은 데이터로 남는다.
개인의 심박수, 수면 시간 등의 건강정보부터
기업, 심지어 국가의 모든 정보는 이제 데이터로 기록되는 시대가 되었다.
이 많은 데이터를 누가, 어떻게 활용하느냐가 중요한데, 아직 데이터를 잘 다룰 수 있는 인재가 부족하다!!
두번째로, 나의 성향과 잘 맞는다.
통계학과에서 수강한 기계학습 과목에서 교수님은 데이터 분석을 통해 이야기를 만들어내는 것이 중요하다는 말씀을 해주셨다. 데이터를 정제하고, 모델을 돌려서 정확한 결과를 얻는 과정도 물론 중요하지만 데이터 분석을 더 특별하게 만들어주는 것은 결국 분석을 통해 전체 틀을 짜고 이야기를 만드는 능력이라고 설명해주셨다. 주어진 결과를 가지고 실제 전문가나 데이터를 제공한 사람들에게 어떻게 설명하고 이야기를 만들어 제안하냐가 데이터분석에서 나의 특별함을 만들어 준다는 뜻이었다.
수업을 들으면서 딱 나잖아? 하는 생각을 했다.
이전부터 나는 이것과 저것을 연결하는 것을 좋아했다. 드라마도 1회에서 나왔던 복선이 12회에 풀리면 다 기억해뒀다가 이건 이렇게 해석할 수 있어! 풀이하기를 좋아했다.
실제로 드라마 작법을 배운 적도 있고, 그렇기 때문에 소재가 주어지면 하나의 이야기를 만들어 내는 것은 자신있다.
물론 드라마와 데이터분석이 같지는 않다. 과정도 방법도 많이 다르다.
하지만, 좀 크게 본다면 각자의 틀이 존재하고, 각 소재에 맞는 방법으로 하나의 구성을 만들고, 이야기를 만들어내는 것은 유사하다고 생각한다. 그리고 이걸 좋아하는 나라면 데이터분석을 즐겁게 할 것이라고 믿는다.
세번째로, 나의 전공이 쓰임새가 있다.
모든 인문계 전공이 그럴 것이라고 생각한다. 특히나 자연어처리분야에는 이론언어학적 지식이 쓰임새가 있었다.
데이터 청년 캠퍼스 자연어처리시간에 Sequence to Sequence Learning with Neural Networks 논문(원 논문링크)에 대해 공부하고 발표하는 시간을 가졌다. 조별로 하는 것이었고 우리 조는 각자 논문개요, 모델, 실험과 그 결과에 대해 정리했는데 마지막으로 논문 비평시간이 있었다. 위 논문의 주장 중에서는 문장의 어순을 뒤집어서 인코더에 넣으면 디코더에서 해석을 해서 출력할 때 더 높은 정확도가 나온다는 것이 있었다. 통상적으로, 그리고 실험의 대상이었던 영-프 문장은 모두 주어가 문두이기 때문에 어순을 뒤집었을 때 출력문의 주어와 입력문의 주어의 거리가 가깝기 때문에 번역하기 용이하여 정확도가 높아진다는 설명이었다.
하지만 난 의심이 되었다. 분명히 유형론 시간에 어순이 S로 시작하지 않는 언어를 많이 보았던 까닭이었다.
그 날 저녁 유형론시간에 정리해두었던 노트를 뒤져서 동사-목적어-주어 어순(VOS형)을 가진 피지어, 말라가시아어 등이 있다는 것을 발견했고 만약 피지어를 영어로 번역하는 상황이 주어진다면 어순을 뒤집어서 인코더에 넣는 것은 대상어와 목표어의 거리가 오히려 멀어지는 결과를 낳기 때문에 각 언어마다 그 어순을 고려하여 인코더-디코더에 넣어야한다고 비평했다.
이에 대한 교수님의 피드백도 신기했다. 자신은 전산전공이라 이런 언어학적 지식이 부족한데 언어학 전공자랑 함께 하면 이런 비평 들을 수 있어서 좋다고 하시면서 격려해주셨다. 확실히 자연어처리에 언어학적 지식이 도움이 되는 부분이 있구나하고 느낄 수 있는 순간이었다.
사실 언어데이터는 종류가 다양하다. SNS데이터 뿐만 아니라 판결문도 언어데이터이고, 레시피 데이터나 차량, 항공기를 음성으로 조작할 때도 언어가 필요하다. 그만큼 다양한 분야에서 언어처리가 필요하기 때문에 내가 가진 언어학적 지식도 다방면으로 활용해볼 수 있지 않을까 기대해본다.
이런 여러가지 이유에도, 이 분야에 내가 가진 장점이 없다면 도전을 이어가기 힘들다고 생각한다. 인문학도에, 컴공에,통계학과에 수많은 재능있는 사람들이 몰릴텐데 스스로 장점이라고 가지는 무언가가 있어야한다고 판단했다.
<나라는 사람이 가지는 장점>
첫번째로 학문에 대한 나의 태도이다.
찐문과인 나는 처음 언어와 공학을 이중전공으로 했을 때 걱정이 아주 많았다. 수학과 공학은 내 인생에서 다시는 없을 과목일 줄 알았다.
그런데 막상 공부를 하니까 처음에는 무섭다가도 또 하니까 할 수 있게 되었다.
그 배경에는 이런 생각들이 있었다.
오늘은 여기까지만 알자!
모르는건 또 공부하면 된다!
어차피 계속 배워나갈 것이다!
하는 긍정적인 태도가 있으니까 계속 공부해나가고 내가 가진 지식을 확장해볼 수 있지 않을까 싶다.
그리고, 스터디를 해주셨던 교수님이 공학 분야는 회독을 늘려나가면서 지식을 넓히는게 더 중요하다고.
같은 내용 여러번 보면 다음에 다다음에 볼 땐 이해할 수 있을거라고 응원해주셨다.
두번째로 같이 공부하고 싶은 사람
연구와 개발은 절대 혼자할 수 없는 영역이다. 늘 협업하고 팀활동을 해야한다.
정말 이상하게도 대학 내내 나는 누군가와 함께 공부해왔다. 혼자 공부하는 것을 선호했는데 누가 자꾸 같이 공부하자고 불러냈다.
1학년 때는 KFL(외국인을 위한 한국어)에서 전혀 모르는 사람들과 갈등없이 조별로 팀플활동을 했다. 3학년 수업이라 다 선배들이셨고.. 교수님도 중간 고사 확인하러 연구실에 갔더니 네가 1학년이라고? 올해 입학하진 않았을 거 아니야? 이러셔서 올해 입학했습니다! 하고 당당하게 답했더니 당황하셨던 기억이있닼ㅋㅋㅋ
2학년 말에는 윤리학 수업에 갔더니 대학원 진학 예정하시는 분(철학과 4학년이셨음)이 같이 스터디하자고 하셔서 시험 정보 공유했다.
3학년때는 함께 3연강 같이 듣는 4학년 분(프랑스어 전공이셨음)이랑 같이 머신러닝수업, 인지과학수업, 실용음성처리부분 서로 모르는거 공유해가면서 공부를 했다. 실제로 데이터나 코드적으로 도움을 많이 주고받았다.
4학년 때는 과 친구들과 함께 코딩테스트 스터디를 함께 했다.
어쩌면 내 대학생활은 누군가과 함께 공부하기 위한 것일지도 모르겠다는 생각이 들 정도로 함께 공부하는 것과 협업문화에 익숙해졌다.
스터디 뿐만 아니라 동아리나 대외활동에서도 늘 누군가와 함께였다.
3-4학년 동안 몸담았던 DSC는 대부분 컴전 사람들로 구성되어있었다. 다들 나에게 컴퓨터 잘 맞는거 같아? 물어보고ㅋㅋ 프로젝트하면서도, 방학 때 이러저러한 행사(모여서 각자 코딩, 모여서 각자 쓰기 등)를 통해서 개발자들의 문화를 많이 배울 수 있었다.
그리고 Synapse는 정말 다양한 사람들의 집합체였다. 생명공학, 심리학, 교육학, 뇌과학, 공학 등등 정말 다양한 전공의 사람들이 함께 모여서 서로의 지식을 나누는 장이었다. 각 분야의 너드들을 만나 각자가 공부하는 분야를 나누고 뒤풀이에서 더 얘기하고 하는 시간들이 재미있었고 계속하고 싶다고 생각했다.
앞으로도, 대학원에서도, 직업을 가지고나서도 연습을 해봤으니까...! 잘 해낼 수 있을 것이라고 생각한다.