기초/Python에 해당하는 글 12

  1. 크롤링 기초 (2) : 기본 용법 / select 2022.01.11

    태그명과 클래스명 등으로 필요한 부분을 지정하고 데이터를 추출하는 방법 이외에, select() 라는 함수를 이용하는 방법도 있다. *서로 호환되며 교차 사용이 가능함 *find()와 마찬가지로 결과값은 리스트 형태로 반환된다. 맨 처음 찾은 값만 가져오고 싶을 때는 select_one() 을 써주면 해당 객체만 추출된다. import requests as req from bs4 import BeautifulSoup as b res = req.get('https://www.naver.com/') soup = b(res.content,'html.parser') # 태그명은 그냥 따옴표 안에 적어 준다. somedata = soup.select_one('div') # 클래스명을 써줄 때는 . 뒤에 적어 준다..


  2. 크롤링 기초 (1) : 기본 용법 / find, find_all, get_text, string 2022.01.10

    import requests # request를 하면 해당 웹사이트 서버에서 respond해주는 정보(HTML)을 해석해서 보여 주는 것 from bs4 import BeautifulSoup as b res = requests.get('url') soup = b(res.content,'html.parser') print(soup) > 파싱(parsing, parse) = 문자열을 쪼개서 의미를 분석하는 것 > 해당 파싱을 해 주는 클래스가 BeautifulSoup > 파싱하는 방법도 다양한데, 그 중 가장 보편적으로 사용되는 것이 html.parser이다. myp = soup.find('p') # 태그 이름이 p인 곳 중 맨 처음 찾는 것을 myp에 넣어 준다. myp.get_text() # 그 곳의 텍..


  3. 파이썬 기초(9) : 라이브러리 2022.01.04

    라이브러리는 미리 만들어 놓은 클래스, 함수의 집합으로 편리한 기능들을 간단하게 사용할 수 있게 도와 준다. 단, 라이브러리를 사용하고 싶으면 설치가 꼭 필요하다! 기본적인 라이브러리는 아나콘다에서 미리 설치가 되어 있지만 라이브러리는 매우 다양하므로.. 미리 설치하자. # 터미널 또는 cmd로 설치해도 되지만, jupyter notebook에서도 설치할 수 있다. # ! = 터미널에서 처리하는거랑 똑같이 해 달라는 뜻 !pip intall library_name import library_name # 해당 라이브러리를 사용하겠다! 고 알려준다. library_name.function_name(x) # 이런 형식으로 함수를 사용해 준다. # 라이브러리에서 필요한 함수만 불러오고 싶으면? from libr..


  4. 파이썬 기초(8) : 객체와 클래스 2022.01.03

    객체 지향 프로그래밍이란? = 객체(object) 단위로 데이터와 기능(함수)를 하나로 묶어서 다루는 언어 ! 컴퓨터에게 일을 시키기 위해서는 "무엇"으로 "무슨 일"을 할 지 알려 줘야 한다. 그러기 위해서는 "무엇"의 기능과 특성, "무슨 일"의 기능은 어떤 것인지를 정의해 주어야 한다. 즉, ①"무엇"의 기능과 특성을 나타내는 클래스(class)를 지정하고 ②그 class를 기반으로 해당하는 객체(object)를 만든 다음 ③호출하여 기능(attribute, method)을 사용해 준다. 여기서 attribute는 해당 객체의 변수이고, method는 해당 객체의 함수를 나타낸다. 파이썬에서는 객체명.method이름(인자) 와 같은 형태로 컴퓨터에게 일을 시킨다. 또한 파이썬에서는 모든 변수는 객체..


  5. 파이썬 기초(7) : 데이터 구조2 / 집합, 튜플, 딕셔너리 2021.12.30

    데이터 구조에 따라 선언/읽기/추가/삭제/수정 방식이 다 다르다. 집합(Set) : set() 반복문에서 각각의 데이터 사용 가능 고등학교 수학시간에 배운 집합과 같은 연산을 편리하게 하기 위한 자료형이다. 집합처럼 구성요소간 정해진 순서가 없고, 중복값 또한 없다. # 선언은 중괄호{}를 이용해서 할 수 있지만 보통 set()로 선언한다. set_example = set() set_example.add('값') # 값 추가 set_example.remove('값') # 값 제거 set_example.update(['값1', '값2',..]) # 여러 개의 값 추가 데이터 요소가 딱! 하나일 경우에는 a = set('data') 와 같이 선언할 수도 있다. 여러 개일 경우에는... b = set( {'d..


  6. 파이썬 기초(6) : 함수 2021.12.30

    함수? 함수는 간단하게 표현하면 y = f(x)의 형태로 이루어져 있다. 이 때 y는 결과값, x는 그 결과에 영향을 미치는 변수(=인자, 입력값, argument, input)이다. 프로그래밍에서 함수는 입력값 x에 어떤 처리를 거치고 결과값 y를 출력하는 것을 의미한다. 파이썬에서 주어진 명령어(print 등) 외에 직접 함수를 만들 수 있는데, 아래와 같은 방식으로 구현할 수 있다. 복잡한 코드를 매번 작성할 필요 없이 편하게 해당 함수를 호출하면 그 기능을 사용할 수 있다. def function(input): 실행문1 실행문2 ... return output function에는 함수명을 지정하여 넣어준다! return은 꼭 들어갈 필요는 없다. 꼭 input(인자)가 필요하지 않을 때는 지정하지..


  7. 파이썬 기초(5) : 반복문 2021.12.24

    반복문은 말 그대로, 특정 실행 코드를 일정 조건 내에서 반복적으로 실행하고 싶을 때 사용한다. for문 특정 범위를 지정해 주고, 그 범위 내에서 정해진 횟수만큼 반복 실행된다. for i in 리스트: 실행문1 # 또는 for j in range(반복횟수): 실행문2 실행예시 for i in ["effy", "rouie", "doodoo"]: #리스트를 통째로 넣어도 되고, 변수로 지정해서 넣어도 된다. print(i) # 실행하면 effy, rouie, doodoo를 차례대로 출력한다. # 차례대로 i = effy 선언 후 i 출력, i = rouie 선언 후 i 출력.. 을 반복한다. *반드시 실행 조건 변수를 실행문에 포함시킬 필요는 없다. lis = ["a", "b", "c", "d"] pri..


  8. 파이썬 기초(4) : 조건문 2021.12.20

    조건문 주어진 변수에 조건을 걸고, 해당 조건을 만족할 때 특정 코드를 실행하도록 할 수 있다. 조건문은 아래 형식으로 이루어진다. if 조건1: # 콜론을 꼭 써 준다. 실행문1 # 탭을 한 칸 띄워줘야 한다. 실행문2 if 조건1 and 조건2: # 여러 개의 조건은 and와 or로 묶어 준다. 실행문 # if 조건문과 콜론(:) 뒤에 탭으로 들여쓰기 된 부분은 해당 조건이 맞으면 다 실행된다. if 조건1 or 조건2: 실행문1 실행문2 실행문3 # 조건1 또는 조건2가 맞는 경우 실행문 1, 2, 3이 모두 실행된다. if not 조건1: #해당 조건을 만족하지 않음을 나타낼 때는 not을 붙여 준다. 실행문 나이를 입력받아 체크하고, "19세를 초과하면 / 나이와 함께 / 성인이라고 출력"해 주..


  9. 파이썬 기초(3) : 데이터 구조 / 리스트 2021.12.19

    리스트(list) 서로 관계가 있는 데이터를 효율적으로 다룰 수 있다. 대괄호([ ]) 안에 콤마(,)로 구분된 데이터를 써 넣어서 만들 수 있고, 인덱스로 다룬다. 리스트는 파이썬에서 가장 많이 쓰이는 데이터 구조 타입이다. 배열이랑 비슷함! 우측의 티스토리 폰트 선택 창처럼 데이터를 관리한다고 보면 된다. 꼭 한 가지의 데이터타입만 들어갈 필요는 없다. 인덱스처럼 슬라이싱도 가능하다. 단, 문자열을 슬라이싱하는것과는 다르게 list[n:m]일 경우 n, n+1, n+2,... m까지 m-n+1개의 값을 출력하는 점이 다르다. 유의! font = ['기본서체','본고딕R','본고딕L','나눔고딕','본명조','궁서'] print(font) # ['기본서체', '본고딕R', '본고딕L', '나눔고딕', ..


  10. 파이썬 기초(2) : 문자열 다루기, 출력 포맷 2021.12.19

    파이썬에서는 변수를 선언할 때, 여러 줄의 문자열을 따옴표("")로 감싸 값으로 넣어 주려고 하면 한 줄만 인식한다. 이럴 때, 따옴표를 3개씩 문자열의 앞 뒤에 적어 주면 제대로 인식한다. sentence = "이렇게 감싸면 여러 줄은 인식하지 못하고" sentence2 = """이렇게 감싸면 여러 줄도 같이 인식한다.""" 문자열(string)을 다루는 여러 함수 len(${변수명}) : 문자열의 글자 수를 세어 준다. 스페이스바( )와 줄바꿈도 센다. ${변수명}.count("문구") : 해당 문구가 변수 안에 몇번이나 들어 있는지 세어 준다. ${변수명}.find("문구") : 해당 문구가 몇 번째 위치에서 처음으로 나오는 지 찾아 준다. 맨 첫번째 위치는 0이다. ${변수명}.find("문구")..