ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 서울시 공공데이터를 활용한 데이터 분석 (1. 파이썬 - 데이터분석을 위한 실습환경 준비하기)
    혼공 - 파이썬 2024. 12. 16. 17:10

    혼공은 아니고, 서울시에서 운영하는 새싹(SeSAC: Seoul Software ACademy) 아카데미에서 온라인 수강 신청

     

    청년취업사관학교

    서울시 공공데이터를 활용한 데이터 분석

    sesac.seoul.kr

    데이터 분석을 위한 파이썬 & 데이터 관리를 위한 SQL

    강의 자료 및 데이터 : http://naver.me/5Fm9xoVg

    강의 목차

    1. 강의소개  총 19시간7분 
    1. 강의소개 3분 0초
    2. 파이썬 - 데이터분석을 위한 실습환경 준비하기  
    12/16 2. 데이터분석 소개 13분 0초
    12/16 3. 아나콘다 설치(Windows10) 12분 0초
    12/16 4. 주피터노트북 사용법 12분 0초
    3. 파이썬 - 기본자료형 다루기  
    12/16 5. 파이썬 시작하기 10분 0초
      6. 기본자료형과 변수 10분 0초
      7. 산술연산, 문자열연산 13분 0초
      8. 문자열 다루기 17분 0초

     

    Pre-A그룹

    • SW개발 분야에 관심과 학습 의지가 있는그룹 입문과정 - Start-Level Developer
    • 학습기간 : 1주 ∼ 2개월 내외

    주피터 노트북 또는 랩이 아닌, 판다스를 설치하는 이유

    주피터노트북 데이터분석, 시각화, 머신러닝 등의 파이썬 프로그램을 개발할 때에 적합한 툴
      다른 IDE와 비교하여 가벼움
      필요한 라이브러리를 별도로 설치해야 함 (사용자 환경에 따라 라이브러리 설치 시 오류 발생 가능성 有)
    아나콘다 주피터노트북이 내장되어 있음 (무거움)
      기본적인 데이터분석 및 시각화 라이브러리들이 포함되어 있음
      가상환경을 설정하여 버전이 다른 버전이 다른 다수의 프로젝트를 관리할 수 있음
    코랩 소스관리 불편, 파일 바운딩 불편, 그래프 한글처리 불편 (*환경에 대한 스트레스 zero)
      클라우드 기반의 주피터노트북 환경(RAM, 디스크, GPU, TPU 제공)
      컴퓨터 사양 관계없이 크롬 브라우저만으로 작업할 수 있음
      기본적인 데이터분석 및 시각화 라이브러리들이 포함되어 있음

    설치 전 확인 작업

    환경설정

    Window + R → cmd

    whoami → "eybai"인데, 한글 또는 공백이 있으면 설치가 안된다고 함

    "윈도우 시작 버튼 → 설정 → 시스템 → 정보" 메뉴 접속 → "설치된 RAM, 시스템 종류" 확인

    설치

    https://www.anaconda.com/download

    Press Skip Button

    https://www.anaconda.com/download/success

    모든 계정에서 다 사용할 수 있게 하려면 All Users를 선택하면 되고, 나만 접속하는 컴퓨터라면 Just Me를 선택!

    그리고 파이참은 설치할 필요없으니 그냥 다음으로 넘어가서 설치를 완료하면 됨

    ※ 삭제 후 재설치하기 위해서는 제어판에서 삭제하는 것이 아니라, 설치한 폴더에 들어와서 Uninstall-Anaconda3로 삭제 후 컴퓨터 재부팅 후 재설치해야 함


    접속 및 실행 → Anaconda Prompt

    • (base) C:\Users\Administrator>cd c:\pythondata
    • (base) c:\pythondata>jupyter notebook

    확장자명 = .ipynb

    단축키

    • 코드 셀 위에 셀 추가 = a
    • 코드 셀 아래 셀 추가 = b
    • 셀 삭제 = dd
    • 실행 = Ctrl + Enter
    • markdown → 줄바꿈, 엔터키 두번 클릭 또는 문장 끝에 "<br>" 넣기
    • 주석 처리 = # 기호
    • 도트모양 기호 → * 넣고 한칸 띄어쓰기

    Kernel 메뉴 → restart kernel

    좌측 목차 형식 보기  → nbextensions ( 별도 설치 필요, anaconda prompt에 새로 접속 ) 기능 설치

    • (base) C:\Users\Administrator>pip install jupyter_contrib_nbextensions && jupyter contrib nbextensions

    아래 명령어 두 개는 주피터 노트북과 연결하기 위한 명령어임

    • (base) C:\Users\Administrator>jupyter contrib nbextensions install --user
    • (선택사항) pip install jupyter_nbextensions_configurator
    • (base) C:\Users\Administrator>jupyter nbextensions_configurator enable --user

    jupyter notebook 접속

    • (base) C:\Users\Administrator>cd c:\pythondata
    • (base) c:\pythondata>jupyter notebook

    주피터 노트북 실행 크롬 화면 메뉴에 생성됨 → Files / Running / Clusters / Nbextensions

    • disable configuration for nbextensions without explicit compatibility (they may break your notebook environment, but can be useful to show for nbextension development) 의 체크박스 체크 해제
    • 체크박스에 체크할 부분 = Table of Contents (jupyter-js-widgets/extension, Nbextensions dashboard tab, contrib_nbextensions_help_item, Nbextensions edit menu item)

     

    주피터 노트북 열고, 메뉴바 아래 마크다운이랑 키보드 모양 옆에 목차 모양( Table of Contents ) 생성되었는지 확인!

    설치는 됐는데, 모양이 안나옴...

    https://gmnam.tistory.com/246

    Table of Contents (2) 체크!!

    이제는 옆에 목차만 출력되면 되는데...내용이 없어서 안나오는건가;;


    nbextensions 설치 실패해서 최신 버전이랑 호환이 잘 안된다는 구글링 결과를 얻고,
    "관리자 권한으로 실행"하니까 x86이 뙇! 하고 뜨길래, "아나콘다 32비트 버전"으로 검색!
    (거의 소가 뒷걸음질 치다가 쥐를 잡게 된거와 마찬가지임. 검색운이 좋았음 ㅋㅋ)
    https://pinggoopark.tistory.com/754
    ←여기서 제공해준 URL로 접속( https://repo.anaconda.com/archive/ )
    Anaconda3-2022.05-Windows-x86_64 검색 후 설치하니까 해결 됨. 꺄울~


    1. 출력 방법
        - 기본 문법: print(value1, valu2, ..., valueN)

    1. 출력이 끝나면 줄바꿈이 된다 ex) print('hello') → "hello "
    2. 콤마(,)로 구분하여 여러 개의 값을 한번에 출력할 수 있다
      콤마(,)로 구분된 여러 값 사이에는 공백(' ')이 추가된다
      ex) print('python','java', 'c++') → "python java c++"
    3. 콤마 (,)로 구분된 여러 값 사이에 공백 대신 사용할 구분기호를 정한다
      문법: print(value1, valu2, ..., valueN, sep='구분기호')
      ex) print( 'python','java', 'c++' ,sep=',') → "python, java, c++"
            공백없이 붙여서 출력(1+1=2)
    4. 출력이 끝나면 줄바꿈 대신 출력할 끝문자를 정한다 → 줄바꿈이 되지 않고, 1줄에 붙여서 출력해주는 기능
      문법: print(value1, valu2, ..., valueN, end=' ')
      공백이 아니라 느낌표로 1줄에 넣을 수도 있음
    5. 여러 줄 한번에 출력하기  → 홑따옴표 세개('''1''') 혹은 쌍따옴표 세개("""1""")로 묶는다

     

    2. 주석을 다는 방법

    • 주석은 사람을 위해 쓰여진 것으로, 프로그램 실행 결과에 영향을 끼치지 않는다
    • 파이썬 해시문자(#)를 사용하여 주석을 추가한다
    • 코드를 설명하기 위해 사용한다
    • 코드의 특정 부분을 잠시 사용하지 않을 때에도 사용한다

     

    3. 들여쓰기 방법

    • 파이썬에서는 들여쓰기 자체가 문법이다
    • 파이썬 들여쓰기 방법은 공백2칸, 공백4칸, 탭 등 여러가지 방법이 있지만 보통 공백4칸을 사용한다

     

    4. 오류메시지 읽는 방법

    • 마지막 문장을 통해 오류 원인 파악 가능
      IndentationError: unexpected indent 들여쓰기 오류: 예기치 않은 들여쓰기
      꺾쇠(^)를 이용해 print('오류 확인')에서 들여쓰기 오류가 났다고 알려줌
      또 35번째 실행문, 3번째 줄이라고 가장 윗줄에 쓰여있음
    • 자주 발생하는 오류 구문
      - 대소문자 구분 ex) Print('hello') → NameError: name 'Print' is not defined
      - 따옴표 짝이 맞아야 함 ex) print('hello") / print('hello' ') SyntaxError: EOL while scanning string literal
      - 괄호의 짝이 맞아야 함  ex) print('hello')) / print('hello'}  SyntaxError: closing parenthesis '}' does not match opening parenthesis '('
Designed by Tistory.