3주차 수업내용 정리

파이썬

: 기본연산 // 자료형 // 함수 // 조건문 // 반복문

자료형 : 숫자, 문자형 / 리스트형 / Dictionary형 / Dictionary + List 조합형

▶ 숫자 / 문자형

name = 'bob'

num = 12

is_number = True

위와 같이 숫자, 문자열, Boolean형 등 들어갈 수 있음

** List, Dictionary도 들어갈 수 있음.



▶ 리스트형

a_list = [] # 빈 리스트 생성

a_list.append(1) # 리스트에 값을 넣는다

a_list.append([2,3]) # 리스트에 [2,3]이라는 리스트를 다시 넣는다



# a_list의 값은? [1,[2,3]]

# a_list[0]의 값은? 1

# a_list[1]의 값은? [2,3]

# a_list[1][0]의 값은? 2



▶ Dictionary형

a_dict = {}

a_dict = {'name':'bob','age':21}

a_dict['height'] = 178



# a_dict의 값은? {'name':'bob','age':21, 'height':178}

# a_dict['name']의 값은? 'bob'

# a_dict['age']의 값은? 21

# a_dict['height']의 값은? 178



▶ 리스트 + Dictionary 형

people = [{'name':'bob','age':20},{'name':'carry','age':38}]



# people[0]['name']의 값은? 'bob'

# people[1]['name']의 값은? 'carry'



person = {'name':'john','age':7}

people.append(person)



# people의 값은? [{'name':'bob','age':20},{'name':'carry','age':38},{'name':'john','age':7}]

# people[2]['name']의 값은? 'john'

함수형

함수 - 이름은 마음대로 정할 수 있음



# 수학문제에서

f(x) = 2*x+3

y = f(2)

y의 값은? 7

# 참고:

자바스크립트에서는

function f(x) {

   return 2*x+3

 }



# 파이썬에서

def f(x):

    return 2*x+3



y = f(2)

y의 값은? 7



▶ 함수의 응용



def sum_all(a,b,c):

      return a+b+c



def mul(a,b):

      return a*b



result = sum_all(1,2,3) + mul(10,10)



# result라는 변수의 값은?  106

조건문

조건문은 if/ else로 구성

조건문은 if/ else로 구성



def oddeven(num): # oddeven이라는 이름의 함수를 정의한다. num을 변수로 받는다.

     if num % 2 == 0: # num을 2로 나눈 나머지가 0이면

        return True      # True (참)을 반환한다.

     else:                 # 아니면,

        return False     # False (거짓)을 반환하다.



result = oddeven(20)

# result의 값은 무엇일까? True



 ▼응용



def is_adult(age):

      if age > 20:

        print('성인입니다')     # 조건이 참이면 성인입니다를 출력

      else:

        print('청소년입니다')     # 조건이 거짓이면 청소년입니다를 출력

is_adult(30)

# 성인입니다 출력됨

반복문

반복문은 리스트의 요소들을 하나씩 꺼내 쓰는 형태

** 무조건 리스트와 함께 쓰임



fruits = ['사과', '배', '감', '귤']



for fruit in fruits : 

     print(fruit)



# 사과, 배, 감, 귤 하나씩 꺼내어 찍힘.



 ▼응용

people = [{'name': 'bob', 'age': 20},

             {'name': 'carry', 'age': 38},

             {'name': 'john', 'age': 7},

             {'name': 'smith', 'age': 17},

             {'name': 'ben', 'age': 27}]



# 모든 사람의 이름과 나이를 출력



for person in peoples:

          print(person['name'], person['age'])



# 반복문 + 조건문 응ㅇㅇ

# 이름을 받으면 age를 리턴해주는 함수



def get_age(myname):

     for person in people:

          if person['name'] == myname:

              return person['age]

     return '해당하는 이름이 없습니다'



print(get_age('bob')) # 20

print(get_age('kay')) # '해당하는 이름이 없습니다'

웹스크래핑(크롤링) 기초

bs4(Beautiful soup4) 설치 필요

# 크롤링 기본 세팅

import requests
from bs4 import BeautifulSoup

# 타겟 URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers)

# HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
# soup이라는 변수에 "파싱 용이해진 html"이 담긴 상태가 됨
# 이제 코딩을 통해 필요한 부분을 추출하면 된다.
soup = BeautifulSoup(data.text, 'html.parser')

#############################
# (입맛에 맞게 코딩)
#############################

태그 안의 텍스트를 찍고 싶을 땐 → 태그.text

태그 안의 속성을 찍고 싶을 땐 → 태그['속성']

import requests
from bs4 import BeautifulSoup

# URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers)

# HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
soup = BeautifulSoup(data.text, 'html.parser')

# select를 이용해서, tr들을 불러오기
movies = soup.select('#old_content > table > tbody > tr')

# movies (tr들) 의 반복문을 돌리기
for movie in movies:
    # movie 안에 a 가 있으면,
    a_tag = movie.select_one('td.title > div > a')
    if a_tag is not None:
        # a의 text를 찍어본다.
        print (a_tag.text)

beautifulsoup 내 select에 미리 정의된 다른 방법을 알아봅니다

# 선택자를 사용하는 방법 (copy selector)
soup.select('태그명')
soup.select('.클래스명')
soup.select('#아이디명')

soup.select('상위태그명 > 하위태그명 > 하위태그명')
soup.select('상위태그명.클래스명 > 하위태그명.클래스명')

# 태그와 속성값으로 찾는 방법
soup.select('태그명[속성="값"]')

# 한 개만 가져오고 싶은 경우
soup.select_one('위와 동일')

Database 종류

SQL : 엑셀에 가깝다고 보면 됨. (행 / 열)

정형화되어 있는 만큼, 데이터의 일관성이나 / 분석에 용이할 수 있습니다.

- MS-SQL, My-SQL 등

No-SQL :

한 줄 한 줄이 딕셔너리 형태로 이루어졌다고 생각하면 됨.

자유로운 형태의 데이터 적재에 유리한 대신, 일관성이 부족할 수 있습니다.

- MongoDB

패키지 : pymongo 설치 필요

from pymongo import MongoClient           # pymongo를 임포트 하기(패키지 인스톨 먼저 해야겠죠?)
client = MongoClient('localhost', 27017)  # mongoDB는 27017 포트로 돌아갑니다.
db = client.dbsparta                      # 'dbsparta'라는 이름의 db를 만듭니다.

# MongoDB에 insert 하기

# 'users'라는 collection에 {'name':'bobby','age':21}를 넣습니다.
db.users.insert_one({'name':'bobby','age':21})
db.users.insert_one({'name':'kay','age':27})
db.users.insert_one({'name':'john','age':30})

# 저장 - 예시
doc = {'name':'bobby','age':21}
db.users.insert_one(doc)

# 한 개 찾기 - 예시
user = db.users.find_one({'name':'bobby'})

# 여러개 찾기 - 예시 ( _id 값은 제외하고 출력)
same_ages = list(db.users.find({'age':21},{'_id':False}))

# 바꾸기 - 예시
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})

# 지우기 - 예시
db.users.delete_one({'name':'bobby'})

3주차 느낀점

: 랭크 숫자 가져오면 하위 자식태그까지 넘어와서 잘라내는 부분을 배운것 들 중에서 응용할 수 있을 것 같은데 바로 바로 생각이 안나서 아쉬웠다. 그동안 수업 진도를 빨리 나가고 싶다는 마음에 너무 복습없이 나가기만 했던 것 같다.

당분간은 복습 하면서 다른 것들 응용도 해봐야 겠다.

'공부 > sparta' 카테고리의 다른 글

프로젝트 진행 1주차 (0)	2021.10.21
프로젝트 기획안 (0)	2021.10.14
4주차 정리 (0)	2021.10.12
2주차 수업내용 정리 (0)	2021.09.22
1주차 수업내용 정리 (0)	2021.09.21

Let's think easy, enjoy life.

3주차 수업내용 정리

'공부 > sparta' 카테고리의 다른 글

댓글

티스토리툴바

3주차 수업내용 정리

'공부 > sparta' 카테고리의 다른 글

관련글

댓글

티스토리툴바