미나랑의 고군분투 공부일지/기초 python 연습

220110 python 첫 수업: 설치 및 자료형1(숫자형, 문자열)

미나랑 2022. 1. 11. 20:09

새로운 곳으로 학교를 옮기게 되었다.

과정은 상단 카테고리에 정리해서 올릴 것 같지만 암튼 대학원을 다른 학교로 옮기게 되었고, 사전교육을 받게되었다. Python시험 점수 보고 충격.. 이렇게 python기초문법을 몰랐던가.. 그동안 수업들은건 뭐고, 졸시 통과한건 뭐고.. DB나 선형대수는 진짜 잘 모르니까 각오하고 있었는데 파이썬 점수가 너무 처참했다... 뭘 틀렸는지 알려줘ㅠㅠㅠㅠ!!! 그동안 구글링에 너무 의존했나 싶고.. 현타가 세게와서 결심했다.

 

이번 기회에 기초를 탄탄히 다져놓으리라..!

그래서 이 시리즈(220110~220123)는 DA에서 제공해주는 파이썬 사전교육+그동안 배웠던 자료들을 총정리하여 포스팅할 예정이다. 총 8번 수업이니까 차근차근 해나가면 되리라 생각한다.

 

이 글의 가장 큰 독자는 다시 파이썬을 까먹을 미래의 나, 그리고 python.. 필요하다는데 한 번 해볼까? 하는 모두이다. 장황한 이론보다는 필요한 내용을 간결하게 정리하는걸 지향한다. 

나의 경우, 코딩을 어느정도 배우고 난 다음부터는 직접 타이핑하기보다는 구글링을 통해 필요한 코드를 얻어와서 적용시키는 경우가 대부분이었다. 하지만 너무 구글링에 의존하면 이렇게 기초를 까먹고 기초부터 다시 배워야하는 상황이...ㅠㅠㅠ 이번 기회로 다같이 처음부터 해나가보는걸로..!

 

1. 아나콘다 설치

사실 python만 사용하고 싶은거라면 python만 설치해도 된다. 하지만 다양한 파이썬 라이브러리와 툴을 종합적으로 편하게 사용하고 싶다면 아나콘다를 설치하는 것이 유리하다. 좀 무겁긴 하지만 용량만 된다면 훨씬 편하게 사용할 수 있다고 생각한다. 사실 정말 무거워서 걱정되면 코랩으로 가는게..

아래의 링크에서 anaconda를 설치할 수 있다.

https://www.anaconda.com/products/individual

 

Anaconda | Individual Edition

Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine.

www.anaconda.com

윈도우 환경을 사용하고 있다면 초록색 버튼download를 눌러주면 되고, 그 외의 환경이라면 'Get additional Installers'를 선택해 자신에게 맞는 환경의 아나콘다를 설치하면 된다. 

 

나의 경우, 이미 anaconda가 설치되어있었지만 수업을 진행하시는 교수님께서 윈도우 사용자계정이 영문명으로 되어있지 않은 경우 새 계정을 생성해 콘다를 설치하라고 권장하셔서 수업 끝나고 새로이 계정을 만들었다. 사실 가볍게 공부만 해볼거라면 필수라고 생각되진 않는다. 라이브러리 활용하다가 문제생길까봐 그런거라..

계정은

1) [Windows 설정]->[계정]->[가족 및 다른 사용자]->[이 PC에 다른 사용자 추가]

2) '이 사람의 로그인 정보를 가지고 있지 않습니다'클릭 후 'Microsoft 계정 없이 사용자 추가' 클릭

3) '사용자 이름'에 영문자 이름을 입력한 후 [다음] 클릭

4) 윈도우 버튼에서 새로운 계정으로 로그인 가능

 

위의 절차를 따르면 새로운 계정을 만들고 접속도 가능하다. 기존의 환경에서 아예 새로운 환경을 하나 더 갖게 되는거라 다른 사람들 보면 목적을 분리하여 컴퓨터를 사용할 때 이런 기능을 이용하는 것 같았다. 나의 경우 코딩과 블로그 포스팅만 하려고 필요한 환경을 세팅해서 적응에 오랜 시간이 걸리지는 않았다.

 

2. Jupyter notebook 단축키

파이썬 등 여러 프로그래밍 언어의 코드를 작성하고 실행해볼 수 있는 툴로 대표적인게 jupyter notebook이다. 요즘은 jupyter notebook의 기능을 확장한 jupyter lab도 많이 활용된다. 개인적으로 jupyter notebook이 좋은건 코드블럭을 활용해 부분실행이 가능하다는 점, 그리고 html을 공부하고 나니 마크다운을 활용하기 너무 편해서 계속 사용하고 있다.

 

그리고 이번 수업을 통해 jupyter notebook의 여러 단축키를 배우게 되어 더 편하게 활용할 수 있을 것 같다. 아래의 사진과 같이 코드를 입력할 때는 초록색 입력모드, 여기서 칸 왼쪽 빈공간을 마우스로 누르거나, Esc를 누르면 하늘색으로 바뀌는데 이걸 커맨드(Command)모드라고 한다. 여기서 h를 누르면 여러 단축키를 확인할 수 있다. 내가 자주 사용하기로 한 단축키는 아래와 같다.

단축키 기능
Shift+Enter 현재 셀 실행
Alt+Enter 현재 셀 실행 후 다음 셀 만들기
b 현재의 셀 밑에 새로운 셀 만들기
a 현재의 셀 위에 새로운 셀 만들기
dd 현재 셀 지우기
m 현재 셀 markdown으로 변경하기
y 현재 셀 code mode로 변경하기
shift+tab edit mode일 때(초록색) 함수에 대한 설명제공

이외에도 다양한 단축키가 있으니 궁금하신 분들은 command mode에서 h를 눌러 확인해보면 된다.

 

3. 자료형

자료형은 python의 기본이다. 나의 경우 외부 csv파일을 불러와서 시각화를 하거나 연산을 할 때 자료형이 맞지 않아 에러가 난 적이 많았다. 특히 표 안에 분명 숫자인데 문자열로 인식한다던가.. 이런 경우에는 해당 열의 데이터타입을 꼭 바꿔주어야 필요한 연산을 하거나 시각화를 할 수 있다. 

그리고, 자료형에 대한 지식은 내가 실제로 보았던 한 대학원 면접문제이기도 하였다. 나의 경우 1전공이 인문이었기 때문에 대학원 입장에서 내가 코딩을 할 수 있는지, 데이터 사이언스와 관련된 지식을 잘 습득했고 활용했는지를 알아보기 위해 어떤 자료형에 대해 물어봤고, 그거랑 어떤 다른 자료형이랑 비교해서 설명해보라고 하셨다. 그러니까 중요하다구!

여기서부터는 배웠던 내용에 주석을 일부 추가했다.