2020-05-27python / tuple unpackinga few seconds read (About 111 words)

python tuple unpacking

튜플 언패킹

파이썬에서 iterable한 객체는 sequence unpacking operator *를 사용하여 언패킹 할 수 있습니다.
변수를 할당하는 문장에서 왼쪽에 두 개 이상의 변수를 사용하고 한 변수 앞에 * 연산자가 붙으면, 오른쪽 값들 중 할당되고 남은 값들이 * 연산자가 붙은 변수에 할당됩니다.

1 2	x, *y = (1, 2, 3, 4) x

1

[2, 3, 4]

1 2	*x, y = (1, 2, 3, 4) x

[1, 2, 3]

4

2020-05-25python / GCDa few seconds read (About 49 words)

python 최대공약수(GCD)

최대공약수 greatest common divisor(GCD)

def finding_gcd(a, b):
    while(b != 0):
        result = b
        a, b = b, a % b
    return result

def test_finding_gcd():
    number1 = 21
    number2 = 12
    assert(finding_gcd(number1, number2) == 3)
    print("테스트 통과!")

if __name__ == "__main__":
    test_finding_gcd()

2020-05-22python / os2 minutes read (About 337 words)

os와 shutil을 이용한 file_copy

os와 shutil(쉘 유틸리티) 모듈을 이용하여 파일 옮기기

진행하려는 내용
naver_12와 naver_22의 내부에 있는 모든 파일을 naver_34폴더로 옮기려 합니다.

1
2
3

# 모듈 불러오기
import os
import shutil # 쉘 유틸리티

1 2	# 현재 작업경로 확인 os.getcwd()

1 2	# 작업경로 내부 파일 리스트 os.listdir(os.getcwd())

# 파일을 복사해올 소스 경로
base_dir = '/Users/daesuncho/Documents/Machine_Learning/project'
# 소스경로
src_dir = os.path.join(base_dir, 'naver_12')
src_dir1 = os.path.join(base_dir, 'naver_22')
# 도착경로
dst_dir = os.path.join(base_dir, 'naver_34')

# 내부 파일 숫자 확인
naver_12 = os.listdir(src_dir)
naver_22 = os.listdir(src_dir1)
len(naver_12), len(naver_22), print(len(naver_12)+len(naver_22))

# src_dir에 있는 모든 파일을 dst_dir폴더로 옮기기
for fname in naver_12:
    src = os.path.join(src_dir, fname)
    dst = os.path.join(dst_dir, fname)
    shutil.copyfile(src, dst)
# src_dir에 있는 모든 파일을 dst_dir폴더로 옮기기
for fname in naver_22:
    src1 = os.path.join(src_dir1, fname)
    dst = os.path.join(dst_dir, fname)
    shutil.copyfile(src1, dst)

1
2
3

# dst_dir 폴더 내부의 수량 확인하기
dstfolder = os.listdir(dst_dir)
len(dstfolder)

# 숫자가 1개 모자라는 이유 파악하기
# 특정이름의 파일 가져오기
path_dir = './naver_34/' # file path
file_list = os.listdir(path_dir) # 파일이름을 변수에 담고

1
2
3

for item in file_list:
    if item.find('DS') is not -1:
        print(item)

2020-05-21python / numpy3 minutes read (About 435 words)

numpy_indexing & slicing

numpy indexing & slicing

인덱싱
- 파이썬 리스트와 동일한 개념으로 사용
- , 를 사용하여 각 차원의 인덱스에 접근 가능

1차원 벡터 인덱싱

1	import numpy as np

1
2
3

# 1차원 벡터 인덱싱
x = np.arange(10)
print(x)

1 2	# 첫번째, 마지막, 4번째 x[0], x[-1], x[3]

1
2
3

# 4번째 값을 100으로 변경
x[3] = 100
print(x)

2차원 행렬 인덱싱

1 2	x = np.arange(10).reshape(2, 5) print(x)

1 2	# 0번째 행의 2번째 열의 값 가져오기 x[0, 2]

3차원 행렬 인덱싱

1
2
3

# 4행 3열의 행렬이 3개를 만듬
x = np.arange(36).reshape(3, 4, 3)
print(x)

1 2	# 0번째 행렬을 가져옴 x[0]

x[1, 2]

1 2	# 인덱스를 하나 명시할 때마다 차원이 하나씩 줄어듬 x[1, 2, 1]

슬라이싱

리스트, 문자열 slicing과 동일한 개념으로 사용
, 를 사용하여 각 차원 별로 슬라이싱 가능
슬라이싱으로 해도 차원이 바뀌지 않음

1 2	x = np.arange(10) print(x)

x[1:7]

1 2	# 슬라이싱을 해도 차원이 바뀌지는 않음 x[:]

2차원 행렬 슬라이싱

1 2	x = np.arange(10).reshape(2, 5) print(x)

# 6, 7, 8 가져오기
# 모든 행 가져오기 x[:]
# 컬럼부분 가져오기 x[:, 1:4]
x[:, 1:4]

1 2	# 모든 행의 앞의 2번째만 가져오기 x[:, :2]

# 인덱싱과 슬라이싱 혼합
# 0번째를 가져오고 2번째에서 자름
# 앞에 0을 사용하여 인덱스를 사용하여 차원이 하나 줄음
# 크기가 2인 벡터
x[0, :2]

1 2	# 자원을 유지하면서 위와 동일한 값 가져오기 x[:1, :2]

3차원 텐서 슬라이싱

1
2
3

# 차원을 유지하면서 0, 1, 2, 3, 4, 5가져오기
# x[:1]첫번째 행렬 가져오기
x[:1, :2, :]

1
2
3

# 2차원 행렬에서 0, 1, 2, 3, 4, 5가져오기
# x[:1]첫번째 행렬 가져오기
x[0, :2, :]

2020-05-21python / numpy6 minutes read (About 964 words)

numpy 모듈을 사용하여 ndarray 데이터 생성하기

numpy 모듈을 사용하여 ndarray 데이터 생성하기

numpy
- 넘파이
- 수치해석용 Python 라이브러리
- CPython에서만 사용 가능
- BLAS/LAPACK 기반
- ndarray 다차원 행렬 자료 구조 제공
- 내부 반복문 사용으로 빠른 행렬 연산 가능
- 행렬 인덱싱(array indexing) 기능
  
  데이터 사이언스 스쿨
ndarray 클래스
- 다차원 행렬 자료 구조를 지원
- 벡터화 연산(vectorized operation) 지원
Python 리스트
- 여러가지 타입의 원소
- linked List 구현
- 메모리 용량이 크고 속도가 느림
- 벡터화 연산 불가
NumPy ndarray
- 동일 타입의 원소
- contiguous memory layout
- 메모리 최적화, 계산 속도 향상
- 벡터화 연산 가능
행렬의 차원 및 크기는 ndim 속성과 shape 속성으로 알 수 있다.

1 2	# 필요 모듈 호출 import numpy as np

# 1차원 벡터
x = np.array([1, 2, 3, 4])
print(x)
# 2차원 행렬(2행 3열), 리스트안에 리스트로 만듬
y = np.array([[2, 3, 4], [1, 2, 5]])
print(y)
# 타입 확인
print(type(y))
# 차원 확인
print(x.ndim, y.ndim)

np.arange 함수로 생성하기

1 2	# 0 ~ 9까지 ndarray 생성 np.arange(10)

1 2	# 1 ~ 9까지 ndarray 생성 np.arange(1, 10)

1 2	# 1 ~ 9까지 2칸씩 띄어서 생성 np.arange(1, 10, 2)

1 2	# 5 ~ 100까지 5의 배수 생성 np.arange(5, 101, 5)

zeros, ones

1 2	# 4행 5열의 모든 원소가 1인 ndarray 생성, 튜플을 이용하여 생성 np.ones((4, 5))

1
2
3

# 3차원 tensor 생성
# 3행 4열의 행렬 2개, 대괄호가 3개 생김
np.ones((2, 3, 4))

1
2
3

# 4차원 생성
# 대괄호가 4개 생김
np.zeros((2, 3, 8, 8))

1 2	# 초기화된 ndarray 생성 np.empty((3, 4))

1 2	# 7로만 이루어진 tensor 생성 np.full((3, 4), 7)

1
2
3

# 5행 5열의 단위 행렬 2차원
# 대각선의 모든 값이 1, 나머지 0
np.eye(5)

np.linspace

1
2
3

# 시작, 끝, 전체 수가 3개가 되도록 나눔
# 원소간의 차이가 동일하게 만듬
np.linspace(1, 10, 3)

1 2	# 숫자 사이 간격이 동일하게 np.linspace(1, 10, 4)

1
2
3

# 4등분, 전체 갯수 5
# 그래프에서 x축에 균등하게 값을 줄 때 사용
np.linspace(1, 10, 5)

reshape

# 1 ~ 15까지 벡터 생성
x = np.arange(1, 16)
print(x)

# 1차원의 shape
x.shape

1 2	# 2차원의 행렬로 형태를 바꿈, 3행 5열로 변경 x.reshape(3, 5)

1	x. reshape(5, 3)

1 2	# 3차원으로 바꿈, 3행 1열이 5개 x.reshape(5, 3, 1)

1
2
3

# 숫자 20개 필요하나 x안에는 15개만 있으므로 대응이 불가능하여 오류 발생
# reshape 하려는 숫자가 원래 존재하는 숫자와 동일한지 확인 필요
x.reshape(5, 4)

random 서브 모듈 이용하여 ndarray 생성히기

랜덤한 값을 생성
보통 train 전 초반에 무작위 값을 생성

1
2
3

# rand 함수, 2행 3열의 랜덤한 값 생성
# 0과 1 사이의 값이 생성
np.random.rand(2, 3)

1 2	# 1차원 벡터 np.random.rand(10)

1 2	# 3차원 tensor, 4행 2열 np.random.rand(3, 4, 2)

# 정규분포, n: normal distribution(정규분포)
# 정규분포로 샘플링된 랜덤 ndarrya 생성
# 정규분포이므로 음수값도 생성
np.random.randn(3, 4)

randint 함수

정수에서 샘플링할 때 사용

1
2
3

# 정수에서 샘플링할 때 사용
# 1 ~ 99, 3행 5열 2차원 행렬
np.random.randint(1, 100, size=(3, 5, 2))

seed 함수

랜덤한 값을 동일하게 다시 생성하고자 할 때 사용
고정된 랜덤 값

1
2
3

# 항상 호출 전 동일한 값을 갖고 싶을 때 사용
np.random.seed(100)
np.random.randn(3, 4)

choice

주어진 1차원 ndarray로부터 랜덤으로 샘플링
정수가 주어진 경우, np.arange(해당숫자)로 간주

1
2
3

# 정수 : 100
# size 샘플링을 3, 4로 가져옴
np.random.choice(100, size=(3, 4))

1
2
3

# 중복 허용
x = np.array([1, 2, 3, 1.5, 2.6, 4.9])
np.random.choice(x, size=(2, 2))

1
2
3

# 중복 x
x = np.array([1, 2, 3, 1.5, 2.6, 4.9])
np.random.choice(x, size=(2, 2), replace=False)

# 확률분포에 따른 ndarray 생성
# uniform : low에서 high 사이의 값을 가져옴
# normal 등
np.random.uniform(1.0, 3.0, size=(4, 5))

1 2	# 정규분포 np.random.normal(size=(3, 4))

# 정규분포 : 평균, 분포, 사이즈 
np.random.normal(size=(3, 4))
# 아래와 동일
np.random.randn(3, 4)

2020-05-17python / machine_learning / CNN5 minutes read (About 701 words)

machine_learning CNN

C.N.N

Convolutional Neural Network
이미지 공간의 정보를 유지한 상태로 학습이 가능한 모델

CNN의 주요 용어 정리

Convolution(합성곱)
- 원본 이미지와 필터의 곱
채널(Channel)
- 이미지 픽셀 1개 = 하나의 실수(scalar)
- 컬러사진: 3차원 * 높이 150 * 길이 250 = shape(150 * 250 * 3)
- 흑백사진: 1차원 * 높이 150 * 길이 250 = shape(150 * 250 * 1)
필터(Filter, kernel)
- 1개의 filter = 1개의 feature map
- convolution layer에 n개의 filter필터가 적용된다면 출력데이터는 n개의 채널을 갖습니다.
커널(Kernel)
스트라이드(Strid)
- 필터가 순회하는 지정된 간격
패딩(Padding)
- Padding을 통해서 Convolution 레이어의 출력 데이터의 사이즈를 조절하는 기능이 외에, 외각을 “0”값으로 둘러싸는 특징으로 부터 인공 신경망이 이미지의 외각을 인식하는 학습 효과도 있습니다.
피처 맵(Feature Map)
액티베이션 맵(Activation Map)
풀링(Pooling) 레이어
- 일반적으로 Pooing 크기와 Stride를 같은 크기로 설정하여 모든 원소가 한 번씩 처리 되도록 설정합니다.
- CNN에서는 주로 Max Pooling을 사용합니다.

2.1 Convolution 레이어 출력 데이터 크기 산정

입력 데이터 높이: H
입력 데이터 폭: W
필터 높이: FH
필터 폭: FW
Strid 크기: S
패딩 사이즈: P
\begin{align}
OutputHeight & = OH = \frac{(H + 2P - FH)}{S} + 1 \
OutputWeight & = OW = \frac{(W + 2P - FW)}{S} + 1
\end{align}
만약 Pooling 사이즈가 (3, 3)이라면 위 식의 결과는 자연수이고 3의 배수여야 합니다. 이 조건을 만족하도록 Filter의 크기, Stride의 간격, Pooling 크기 및 패딩 크기를 조절해야 합니다.

2.2 Pooling 레이어 출력 데이터 크기 산정

일반적인 Pooling 사이즈는 정사각형입니다.
Pooling 사이즈를 Stride 같은 크기로 만들어서, 모든 요소가 한번씩 Pooling되도록 만듭니다.
입력 데이터의 행 크기와 열 크기는 Pooling 사이즈의 배수(나누어 떨어지는 수)여야 합니다.
결과적으로 Pooling 레이어의 출력 데이터의 크기는 행과 열의 크기를 Pooling 사이즈로 나눈 몫입니다.
Pooling 크기가 (2, 2) 라면 출력 데이터 크기는 입력 데이터의 행과 열 크기를 2로 나눈 몫입니다. pooling 크기가 (3, 3)이라면 입력데이터의 행과 크기를 3으로 나눈 몫이 됩니다.
CNN을 구성하면서 Filter, Stride, Padding을 조절하여 특징 추출(Feature Extraction) 부분의 입력과 출력 크기를 계산하고 맞추는 작업이 중요합니다.

자료 출처

케라스 CNN model 중간 저장

자료 출처

2020-05-10python / function19 minutes read (About 2919 words)

python function

함수

반복되는 코드를 묶음으로 효율적인 코드를 작성하도록 해주는 기능
기본 함수
파라미터와 아규먼트
리턴
args, *kwargs
docstring
scope
inner function
lambda function
Map, Filter, Reduce
Decorlator

1. 기본 함수

함수의 선언과 호출

# 함수선언
def grade(point): # def : 예약어, 함수이름 : grade, 파라미터 : point
    if point >= 90:
        print("A")
    elif point >= 80:
        print("B")
    else:
        print("C")

1 2	# 함수호출 grade(88) # 함수이름(point로 넘겨줄 값을 입력)

2. 파라미터와 아규먼트

파라미터: 함수를 선언할 때 호출하는 부분에서 보내주는 데이터를 받는 변수
아규먼트: 함수를 호출할 때 함수에 보내주는 데이터

1
2
3

def plus(num1, num2): # 파라미터
    print(num1 + num2)
plus(1, 2) # 아규먼트

1
2
3

def plus(num1, num2=10): # 디폴트 파라미터
    print(num1 + num2)
plus(1, 2) # 아규먼트

1
2
3

def plus(num1, num2=10, num3=20): # 디폴트 파라미터
    print(num1 + num2 - num3)
plus(1, 2) # 아규먼트

키워드 아규먼트 : 특정 파라미터를 지정해서 넣고 싶을 때 사용
1
plus(3, num3=100) # 키워드 아규먼트

3. 리턴

함수를 실행한 결과를 저장하고 싶을 때 사용합니다.
함수에서 return 코드가 실행되면 무조건 함수가 종료됩니다.

return

def plus(num1, num2):
    print(num1 + num2)

result = plus(1, 2)
print(result)

def plus(num1, num2):
    print(num1 + num2)
    return num1 + num2

result = plus(1, 2)
print(result)

def grade(point): # def : 예약어, 함수이름 : grade, 파라미터 : point
    if point >= 90:
        return "A"
    elif point >= 80:
        return "B"
    else:
        return "C"

grade(90)

def passornot(result):
    pass_ = ""
    if result == "A" or result == "B":
        return "PASS"
    else: 
        return "FAIL"
passornot("A")

def grade(point): # def : 예약어, 함수이름 : grade, 파라미터 : point
    if point >= 90:
        return "A"
    elif point >= 80:
        return "B"
    else:
        return "C"

def passornot(result):
    pass_ = ""
    if result == "A" or result == "B":
        return "PASS"
    else: 
        return "FAIL"

1 2	# 함수 호출하기 passornot(grade(98))

# 함수에서 return 코드가 실행되면 무조건 함수가 종료됩니다. 
def echo(msg):
    if msg == 'quit':
        return
    print(msg)

4. args, *kwargs

함수를 호출할 때 아규먼트와 키워드 아규먼트의 갯수를 특정지을 수 없을 때 사용

# 갯수에 상관없이 모든 아규먼트를 더해주는  함수
def plus(*args):
    print(type(args), args)
    return sum(args)

# 함수 호출
plus(1, 2, 3, 4, 5)

# 키워드가 있는 아규먼트
def plus(*args, **kwargs):
    print(type(args), args)
    print(type(kwargs), kwargs)
    return sum(args) + sum(kwargs.values())

# 함수 실행
plus(1, 2, 3, 4, 5, num1=6, num2=7)

def func(num1, num2, num3):
    return num1 + num2 + num3

data = [1, 2, 3]
func(*data) # func(1, 2, 3)

def func(num1, num2=10, num3=20):
    return sum(num1) + num2 + num3
    
data = [1, 2, 3]
func(data) # func([1, 2, 3])

def func(num1, num2, num3):
    return num1 + num2 + num3

data = [1, 2, 3]
func(*data) # func(1, 2, 3)

def func(num1, num2, num3):
    return num1 + num2 + num3
data = {
    "num2": 100,
    "num3": 200,
}
func(1, **data) # func(1, num2=100, num3=200)

문장을 입력받아서 문법에 맞도록 결과를 출력하는 코드를 작성
마지막 문자는 . 이 있을수도 있고 없을수도 있습니다.
논리적인 문제해결 순서 -> 코드로 변경
str.upper(), str.lower(), offset index [], str.add(문자열 덧셈)
python IS the best Language
python IS the best Language.

Python is the best lagnuage.

# 1. 문자열 입력받기
sentence = input('input sentence : ')

# 2. 모두 소문자로 변경
result = sentence.lower() # lower함수는 리턴이 있는 함수이므로 result에 저장

# 3. 가장 앞글자를 대문자로 변경
result = result[0].upper() + result[1:] # 가장 앞글자 + 나머지 글자

# 4. 마지막 문자가 .인지 확인해서 .이 아니면 .을 추가
if result[-1] != ".":
    result += "."

result

# 6자리의 로또번호를 생성하는 코드를 작성하세요. 
# 6자리의 번호는 중복이 없어야 합니다. 
# 문자열, 숫자, 리스트
# while, not in, in, list.append(), break, len(), list.sort()
# 문제가 조금 복잡하면 간단한 기능부터 구현하고 업데이트를 하는 방법으로 해결
# 랜덤한 숫자 6개 출력 -> 숫자가 중복되지 않는 코드를 추가

lotto = []
# 랜덤한 숫자 6개를 while문을 사용해서 작성
while True:
    num = random.randint(1, 45)
    # 숫자를 추가할 때 lotto 리스트에 중복되는 숫자가 없으면 추가
    if num not in lotto:   
        lotto.append(num)
        if len(lotto) >= 6:
            lotto.sort() 
        
            break     
lotto

5. docstring

# 한줄로 작성
def echo(msg):
    "echo print msg"
    print(msg)

def echo(msg):
    """
    echo func return its input agument
    The operation is:
        1. print msg parameter
        2. return msg parameter
    param : mag : str
    return : str
    """
    print(msg)
    return msg

1 2	# docstring 확인 방법 echo?

echo??

1	help(echo)

1	print(echo.__doc__)

6. Scope 범위

함수 안에서 선언되는 변수와 함수 밖에서 선언되는 변수의 범위가 다릅니다.
global(전역), local(지역)
전역영역에 선언되어있으면 함수가 실행될 때 전역영역의 변수를 가져다 사용합니다.
지역영역에 선언되어있으면 함수가 실행될 때 지역영역의 변수를 가져다 사용합니다.
메모리를 덜 잡아먹기 때문에 로컬영역에서 선언할 수 있으면 로컬에서 선언하는 것이 좋습니다.

# global
gv = 10 

def echo():
    print(gv)

echo()

# local
gv = 10 

def echo():
    gv = 100
    print(gv)

echo() # 100
gv # 10

gv = 10 

def echo():
    global gv
    gv=100
    print(gv)

echo()
gv # 100

7. inner function

함수가 지역영역에 선언, 함수 안에 함수가 선언

def outer(a, b):
    
    def inner(c, d):
        return c + d
    
    return inner(a, b)

1	outer(1, 2) # 3

inner(2, 3) # 오류발생 : 전역영역에서 지역영역의 함수를 사용하려 했기 때문입니다. 지역영역에 선언된 함수이므로 지역영역에서만 사용할 수 있습니다.

inner함수 = 익명함수라고 부릅니다. 전역영역에서 가져다 사용할 수 없는 함수이기 때문입니다.

# 지역영역의 함수 사용하기
def outer(a, b):
    
    def inner(c, d):
        print(a, b)
        return c + d
    
    return inner # 리턴을 변경시켜주고

outer(1, 2)(3, 4) # inner(3, 4)

8. callback function

함수를 아규먼트, 파라미터로 설정해서 사용하는 것을 의미합니다.

def calc(func, a, b):
    # code
    a **= 2
    b **= 2
    return func(a, b)

def plus(a, b):
    return a + b

def minus(a, b):
    return a - b

1 2	# 덧셈 calc(plus, 1, 2)

1 2	# 뺄셈 calc(minus, 1, 2)

9. lambda function

파라미터를 간단한 계산으로 리턴되는 함수 : 삼항연산

def plus(a, b): # 파라미터
    return a + b # 리턴

# lambda 파라미터: 리턴
plus2 = lambda a, b: a + b

1	plus2(2, 3)

1	calc(lambda a, b: a + b, 4, 5)

10. Map, Filter, Reduce

map: 순서가 있는 데이터 집합에서 모든 값에 함수를 적용시킨 결과를 출력
아규먼트로 func(함수), *iterable을 받음
iterable 한 데이터에 함수를 각 요소마다 모두 적용시킨 결과 데이터를 만들고 싶을 때 사용합니다.
map(func, ls1, ls2) : ls(iterable한 데이터)가 여러개 올 수 있습니다.

ls = [1, 2, 3, 4]

def odd_even(num):
    return 'odd' if num % 2 else 'even'

odd_even(3), odd_even(4)

1	list(map(odd_even, ls)) # 함수, 리스트를 넣음

# input 함수로 구분자는 " "으로 여러개의 숫자를 입력 받습니다. 
# str.split(" ")리스트로 만들고
# 만들어진 리스트의 값들을 int로 형변환
datas = input("insert numbers : ") # 10 20 30 40 50 40 30 20 10
result = datas.split(" ")
result
``` 
```python
result = list(map(int, result))
result

10-2. Filter

Filter : 리스트 데이터에서 특정 조건에 맞는 value만 남기는 함수
filter(func, ls) : ls(iterable한 데이터)가 1개밖에 못옵니다.
True, False로 만듭니다.

func is True인 것만 리턴합니다.

ls = range(10)

# 홀수만 출력
list(filter(lambda data: True if data % 2 else False, ls))

10-3. Reduce

리스트 데이터를 처음부터 순서대로 특정 함수를 실행하여 결과를 누적시켜 주는 함수

from functools import reduce # import 해야 사용 가능합니다. 

ls = [3, 1, 2, 4, 5]
# ((((1+2)+3)+4)+5)
# 파라미터가 반드시 2개여야 함
reduce(lambda x, y: x + y, ls)

10. Decorlator

함수에서 코드를 바꾸지 않고 기능을 추가하거나 수정하고 싶을 때 사용하는 문법

def a():
    code_1
    code_2
    code_3

def b():
    code_1
    code_4
    code_3

데코레이터의 사용

def c(func): # 2. func으로 def a()이 들어옴 

    def wrapper(*args, **kwargs): # inner func 
        code_1 # 4. 코드가 실행됨
        result = func(*args, **kwargs) # 5. 코드가 실행됨
        code_3 # 6. 코드가 실행됨
        return result # 7. 반환함

    return wrapper # 8. 반환함

@c # 1. def c라는 함수가 실행이 됨, code_1, code_3 기능이 적용됨, code_1, 3, 2가 실행됨
def a(): # def a라는 함수가 wrapper 함수로 변경됨
    code_2 # 3. code_2 가 실행됨

@c # code_1, code_3 기능이 실행됨, 결과적으로 code_1, 3, 4가 실행됨
def b(): # b라는 함수가 wrapper 함수로 변경됨
    code_4

# a
def plus(a, b):
    print("start")                                   # code_1
    result = a + b                                  # code_2
    print("result : {}".format(result)) # code_3
    return result

# b
def minus(a, b):
    print("start")                                   # code_1
    result = a - b                                   # code_4
    print("result : {}".format(result)) # code_3
    return result

# c : code_1, cod_3을 묶어주는 데코레이션 함수
def disp(func):
    def wrapper(*args, **kwargs):
        print("start")                                   # code_1
        result = func(*args, **kwargs)   # code_2, code_4
        print("result : {}".format(result)) # code_3
        return result
    return wrapper

@disp
def plus(a, b):
    result = a + b                          # code_2
    return result
plus(1, 2)

# 함수의 실행 시간을 출력하는 데코레이터 함수를 작성하세요. 
import time


def timer(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()         # code 1
        result = func(*args, **kwargs)   # code 2, code 4
        end_time = time.time()           # code 3
        print("running time : {}".format(end_time - start_time)) # code 3
        return result
    return wrapper

@timer
def test1(num1, num2):
    data = range(num1, num2+1)
    return sum(data)

@timer
def test2(num1, num2):
    result = 0
    for num in range(num1, num2+1):
        result += num
    return result

1	test1(1, 100000)

1	test2(1, 100000)

# 패스워드를 입력받아야 함수가 실행되도록하는 데코레이터 작성
def check_password(func):
    def wrapper(*args, **kwargs):
        pw = 'dss12'
#         datas = [
#             {'id': 'test', 'pw': '1234'},
#             {'id': 'test2', 'pw': '12345'}
#         ]
        # check password
        input_pw = input('insert pw : ')
        if input_pw == pw:
            result = func(*args, **kwargs)
        else:
            result = 'not allow!'
        return result
    return wrapper

1
2
3

@check_password
def plus(a, b):
    return a + b

1	plus(1, 2)

@check_password
def lotto_func():
    lotto = []
    while True:
        number = random.randint(1, 45)
        if number not in lotto:
            lotto.append(number)
        if len(lotto) >= 6:
            lotto.sort()
            break
    return lotto

1	lotto_func()

join()

리스트로 되어있는 데이터를 특정 문자열을 구분자로 사용해서 하나의 문장으로 만들어주는 함수

1 2	ls = ['python', 'is', 'good'] " ".join(ls)

# pandas dataframe
import pandas as pd

df = pd.DataFrame([ # DataFrame : class
    {"name": "jin", "age": 20},
    {"name": "andy", "age": 21},
])
df

id, pw 카운트 함수, 1. zip함수를 이용하는 방법

ls = ['a', 'b', 'c']
print(list(range(len(ls))))
print(list(zip(range(len(ls)), ls)))
for idx, data in list(zip(range(len(ls)), ls)):
    print(idx, data)

user_datas = [
    {'user': 'test', 'pw': '1234', 'count': 0},
    {'user': 'python', 'pw': '5678', 'count': 0},
]

# user_data를 입력받아서 아이디와 패스워드를 체크하는 데코레이터 함수를 코드로 작성하세요. 
# 로그인 될 때마다 count를 1씩 증가
def need_login(func):
    def wrapper(*args, **kwargs): # inner function 만듬
        # 아아디 패스워드 입력
        user, pw = tuple(input("insert user pw : ").split(' ')) # user와 pw 나눈 후 tuple로 변환
        
        # 존재하는 아이디와 패스워드 확인
        for idx, user_data in zip(range(len(user_datas)), user_datas): # 카운트하기 위해 몇 번째 데이터인지 확인필요       
            if (user_data['user'] == user) and (user_data['pw'] == pw):
                user_datas[idx]['count'] += 1 # 유저 데이터의 인덱스에서 카운트를 1씩 증가 시킴          
                # 함수 실행
                return func(*args, **kwargs) # wrapper 함수 종료, 결과값 출력          
        return "wrong login data!"
    return wrapper

@need_login
def plus(num1, num2):
    return num1 + num2

plus(1, 2)

1	user_datas

2. enumerate함수를 이용하는 방법

1	list(enumerate(user_datas))

# user_data를 입력받아서 아이디와 패스워드를 체크하는 데코레이터 함수를 코드로 작성하세요. 
# 로그인 될 때마다 count를 1씩 증가
def need_login(func):
    def wrapper(*args, **kwargs): # inner function 만듬
        # 아아디 패스워드 입력
        user, pw = tuple(input("insert user pw : ").split(' ')) # user와 pw 나눈 후 tuple로 변환
        
        # 존재하는 아이디와 패스워드 확인
        for idx, user_data in enumerate(user_datas): # 카운트하기 위해 몇 번째 데이터인지 확인필요       
            if (user_data['user'] == user) and (user_data['pw'] == pw):
                user_datas[idx]['count'] += 1 # 유저 데이터의 인덱스에서 카운트를 1씩 증가 시킴          
                # 함수 실행
                return func(*args, **kwargs) # wrapper 함수 종료, 결과값 출력          
        return "wrong login data!"
    return wrapper

@need_login
def plus(num1, num2):
    return num1 + num2

plus(1, 2)

1	user_datas

2020-05-10python / condition / loop9 minutes read (About 1422 words)

python 조건문 (if, while, for)

조건문

특정 조건에 따라서 코드를 실행하고자 할 때 사용

if, else, elif

# if 문이 ture일 때 구문 안의 결과가 실행됨
if True: 
    print("python")

print("done")
# python done

# if 문이 false일 때 구문 이외의 결과가 실행됨
if False: 
    print("python")

print("done")
# done

# 조건부문 : bool 데이터 타입 이외의 데이터 타입이 오면 bool으로 형변환 되어 판단
# int : 0을 제외한 나머지 값은 True
num = 0
if num: 
    print("python_1")
# 출력값 없음

num = 1
if num: 
    print("python_2")

# python_2

number = 7
if number % 2:
    print('홀수')
else:
    print('짝수')

1
2
3

# float : 0.0을 제외한 나머지 실수는 True
# str : ""을 제외한 나머지 문자열은 True
# list, tuple, dict : [], (), {}를 제외한 나머지는 True

# 지갑에 돈이 10000원 이상 있으면 택시를 탑니다. 
# 2000원 이상이 있으면 버스를 탑니다. 
# 그렇지 않으면 걸어서 집에 갑니다. 
money = 5000
if money >= 10000:
    print('택시를 타고 집에 갑니다.')
elif money >= 5000:
    print('광역버스를 타고 집에 갑니다.')
elif money >= 2000:
    print('일반버스를 타고 집에 갑니다.')
else:
    print("걸어서 집에 갑니다.")

# 계좌에 10000원이 들어있습니다. 
# 인출 금액을 입력 받습니다. 
# 인출 금액이 계좌에 있는 금액보다 크면 "인출이 불가능합니다." 출력
# 인출 금액이 계좌에 있는 금액보다 작으면 "인출 되었습니다." 출력
# 마지막에 현재 계좌의 잔액을 출력
account = 10000
draw_money = int(input("인출 금액을 입력하세요. : "))
if account >= draw_money:
    account -= draw_money
    print(str(draw_money) + "원이 인출되었습니다.")
else:
    print("인출이 불가능합니다. " + str(draw_money - account) + "원의 잔액이 부족합니다.")

print("현재 잔액은 " + str(account) + "원 입니다.")

삼항연산자

간단한 if, else 구문을 한줄의 코드로 표현할 수 있는 방법

(True) if (condition) else (False)

# data 변수에 0이면 "zero"출력, 아니면 "not zero"출력
data = 0
if data:
    print("not zero")
else:
    print("zero")

1 2	data = 1 "not zero" if data else "zero"

반복문

반복되는 코드를 실행할 때 사용
while, for, break, continue

list comprehention

# while
data = 3

while data: # 조건이 False가 될 때까지 구문의 코드를 실행

    # 반복되는 코드
    print(data)
    data -= 1

# 학생이 국어: 80점, 영어: 90점, 수학: 100점 while 문을 이용해서 총점과 평균을 출력
# 학생의 점수는 list, dict 표현
# len(), dict.values(), list.pop()
# list
subject = ["korean", "english", "math"]
score = [80, 90, 100]
total, avg = 0, 0

while True:
    total = sum(score)
    avg= total / len(score)
    print('3과목 총점은 ' + str(total) + '점 입니다.' )
    print('3과목 평균 점수는 {}점 입니다. '.format(avg))
    break

points_dict = {"korean": 80, "english": 90, "math": 100}
total, avg = 0, 0

while True:
    total = sum(points_dict.values())
    avg = total / len(subject)
    
    print("3과목 총점 : ", total)
    print("3과목 평균 : ", avg)
    break

subjects_ls = ["korean", "english", "math"]
points_ls = [80, 90, 100]
points_dict = {"korean": 80, "english": 90, "math": 100}

datas = points_ls.copy() # 깊은 복사 : 원본 데이터를 보존

total, avg = 0, 0

while datas:
    total += datas.pop()
avg = total / len(points_ls)
total, avg

무한루프

result = 1
while result:
    result += 1
print(result)

break : 반복문을 중단 시킬 때 사용되는 예약어

result = 1
while result:
    
    if result >= 10:
        break

    result += 1
print(result)

for

iterable한 데이터를 하나씩 꺼내서 value에 대입시킨 후 코드를 iterable변수의 값 갯수만큼 실행

1 2	for <variable> in <iterables>: <code>

1
2
3

ls = [0, 1, 2, 3, 4]
for data in ls:
    print(data)

# continue: 조건부분으로 올라가서 콜드가 실행
ls = [0, 1, 2, 3, 4]
for data in ls:
    if data % 2: # data가 홀수가 되면 continue를 실행하여 다시 포문으로 돌아감
        continue

    # data가 짝수이면 print를 실행
    print(data, end=" ")

for를 이용해서 코드를 100번 실행

range 함수

list(range(100))
result = 0
for data in range(100):
    result += data
result

offset index 개념과 비슷하게 사용

1	list(range(5)), list(range(5, 10)), list(range(0, 10, 2))

# 0~10 까지 짝수를 더한 총합
result = 0
for number in range(0, 11, 2):
    result += number
result

1
2
3

points_dict = {"korean": 80, "english": 90, "math": 100}
for data in points_dict:
    print(data)

items 함수 사용

# dict 형태
points_dict = {"korean": 80, "english": 90, "math": 100}
for subject, point in points_dict.items():
    print(subject, point)

zip 함수 사용

# list 형태
# for 문에서 iterable 데이터가 tuple로 나오면 여러개의 변수로 받을 수 있습니다. 
subjects_ls = ["korean", "english", "math"]
points_ls = [80, 90, 100]
for subject, point in zip(subjects_ls, points_ls):
    print(subject, point)

구구단 가로 출력

21=2 31=3 … 9*1=9
…

29=18 39=27 … 9*9=81

for i in range(1, 10): # 1, 2, 3, ... 9를 만들어 줌
#     print(i)
    for j in range(2, 10): # 2단, 3단, ... 9단을 만들어줌
        print('{}*{}={}'.format(j, i, i*j), end='\t')
    print()

List Comprehention

리스트 데이터를 만들어주는 방법
for문 보다 빠르게 동작합니다.

# 각각 값에 제곱한 결과 출력
ls = [0, 1, 2, 3]
result = []

for data in ls:
    result.append(data ** 2)
result

1 2	result = [data**2 for data in ls] # [연산 for 각각의 데이터 in 데이터의 집합] result

# 리스트 컴프리헨션을 써서 홀수와 짝수를 리스트로 출력해주는 코드
# 삼항연산자 사용
ls = range(0, 11)
result = ["홀수" if data % 2 else "짝수" for data in ls]
result

리스트 컴프리헨션 조건문

0 ~ 9까지에서 홀수만 출력하기

1 2	ls = range(10) [i for i in ls if i%2]

# dir(ls)에서 "__" 없는 함수만 출력하기
ls = [1, 2, 3]
dir(ls)
[i for i in dir(ls) if i[:2] != '__'] # 앞에 2개가 __ 인 것을 제외

# 앞글자가 c인 것만 가져오기
ls = [1, 2, 3]
dir(ls)
[i for i in dir(ls) if i[:2] != '__' if i[:1] == 'c']

1
2
3

ls = [1, 2, 3]
dir(ls)
[i for i in dir(ls) if i[:2] != '__' and i[0] == 'c']

for문과 list comprehention 성능 비교

%%timeit # magic command : 셀 안에서 실행되는 시간 측정
ls = []
for num in range(1, 10001):
    ls.append(ls)
len(ls)

1
2
3

%%timeit # magic command : 셀 안에서 실행되는 시간 측정
ls = [num for num in range(1, 10001)]
len(ls)

# 3의 배수만 찾기 소요시간 비교
%%timeit # magic command : 셀 안에서 실행되는 시간 측정
ls = []
for num in range(1, 10001):
    if num % 3 == 0: 
        ls.append(num)
len(ls)

1
2
3

%%timeit # magic command : 셀 안에서 실행되는 시간 측정
ls = [num for num in range(1, 10001) if num % 3 == 0]
len(ls)

2020-05-09python / basic syntax10 minutes read (About 1560 words)

basic

파이썬 기본 문법

변수 선언, 식별자, 자료형, 형변환, 연산자

주석(comment)과 출력(print)

# 주석 : 앞에 #을 붙이면 코드로 실행이 안됩니다. 
# 코드에 대한 설명이나 코드를 실행시키고 싶지 않을 때 사용
# 단축키 : ctrl(cmd) + /
# 블럭설정 : shift + 방향키

# 출력 : print 함수
# 코드 중간에 변수에 들어있는 값을 확인하고 싶을 때 사용
# 1, 2, 3을 출력하는 코드, 아래를 실행시키면 1, 3이 출력 됩니다. 
print(1)
# print(2)
print(3)

# print 함수의 옵션
# docstring : 함수에 대한 설명 : 단축키(shift + tab)
print(1, 2, sep="-", end="\t")
print(3)
# 자동완성 : tab

변수 선언

RAM 저장공간에 값을 할당하는 행위

# 하나씩 선언
a = 1
b = 2
# 한줄로 여러개의 변수를 선언
d, e = 3, 4
# 5라는 값이 f와 g에 선언
f = g = 5

식별자

변수, 함수, 클래스, 모듈 등의 이름을 식별자라고 합니다.
식별자 규칙
- 소문자, 대문자, 숫자, 언더스코어(_)를 사용합니다.
- 가장 앞에 숫자 사용 불가
- 예약어의 사용 불가 : def, class, try, except, 등
- 컨벤션
```
- snake case : fast_campus : 변수, 함수
- camel case : FastCampus, fastCampus : 클래스
```

데이터 타입

RAM 저장공간을 효율적으로 사용하기 위해서 저장공간의 타입을 설정

동적타이핑(인터프리터 방식에서 주로 사용함)

- 변수 선언시 저장되는 값에 따라서 자동으로 데이터 타입이 설정

기본 데이터 타입 : int, float, bool, str
컬렉션 데이터 타입 : list, tuple, dict

a = 1
# int a = 1
b = "python"
# int, str
type(a), type(b)

# 기본 데이터 타입 : int, float, bool, str
a = 1
b = 1.2
c = True # False
d = "data"
type(a), type(b), type(c), type(d)

# 데이터 타입의 함수 : 문자열
d = "data"
# upper : 대문자로 변환
d.upper()

1
2
3

f = ' THAt Car '
# lower : 소문자로 변환
f.lower()

1 2	# strip : 공백 제거 f.strip()

1 2	# replace : 모든 공백제거 f.replace(" ", "")

1 2	# replace : 특정 문자열 치환 f.replace("THAt", "THIS")

1 2	# dir : 함수 확인 dir(f)

# 오프셋 인덱스 : 마스크, 마스킹 : []
# 문자열은 순서가 있는 문자들의 집합
g = "abcdefg"
g[2] # 'c'
g[-2] # 'f'
g[2:5] # 'cde' 2는 포함, 5는 미포함
g[2:] # 'cdefg' 2번째부터 끝까지
g[:3] # 'abc' 0번째부터 2번째까지 g[0:3]과 같음
g[-2:] # 'fg' -2에서 끝까지 
g[:] # 'abcdefg' 처음부터 끝까지
g[::2] # 'aceg' 2칸씩 점프하며 출력
g[::-1] # 'gfedcba' 역순으로 출력

# 97531 출력
numbers = '123456789' 
# numbers[::-2]
# result = numbers[::2]
# result[::-1]
# numbers[::2][::-1]

# 컬렉션 데이터 타입 : list, tuple, dict
# list [] : 순서가 있는 수정이 가능한 데이터 타입
# tuple () : 순서가 있는 수정이 불가능한 데이터 타입
# dict {} : 순서가 없고 키: 값으로 구성되어 있는 데이터 타입

1
2
3

# list
ls = [1, 2, 3, "four", [5, 6], True, 1.2]
type(ls), ls

1 2	# offset index 사용 가능 ls[3], ls[1:3], ls[::-1]

# list 함수
ls = [1, 5, 2, 4]
# append : 가장 뒤에 값을 추가
ls.append(3)
ls # [1, 5, 2, 4, 3]

# sort : 오름차순으로 정렬
ls.sort()
ls # [1, 2, 3, 4, 5]
# 내림차순 정렬
ls[::-1] # [5, 4, 3, 2, 1]

# pop : 가장 마지막 데이터를 출력하고 출력한 데이터를 삭제
# ctrl + enter : 현재 셀을 계속 실행
num = ls.pop()
num, ls

# 리스트의 복사
ls1 = [1, 2, 3]
ls2 = ls1
ls1, ls2 # ([1, 2, 3], [1, 2, 3])

1
2
3

# 얕은 복사 :주소값 복사
ls1[2] = 5
ls1, ls2 #([1, 2, 5], [1, 2, 5])

깊은 복사

1
2
3

# 깊은 복사
ls3 = ls1.copy()
ls1, ls3 #([1, 2, 5], [1, 2, 5])

1 2	ls1[2] = 10 ls1, ls3 # ([1, 2, 10], [1, 2, 5])

tuple ()

리스트와 같지만 수정이 불가능한 데이터 타입, 괄호 생략 가능

튜플은 리스트보다 같은 데이터를 가졌을 때 공간을 적게 사용

1
2
3

tp1 = 1, 2, 3
tp2 = (4, 5, 6)
type(tp1), type(tp2), tp1, tp2

1 2	# offset index 사용 가능 tp1[1], [tp1[::-1]]

# 리스트와 튜플의 저장공간 차이 비교
import sys

ls = [1, 2, 3]
tp = (1, 2, 3)

print(sys.getsizeof(ls), sys.getsizeof(tp))
# 96 80

**dict {}**
- 순서가 없고 {키: 값}으로 구성되어 있는 데이터 타입
```python
# 선언: 키는 정수, 문자열 데이터 타입만 사용이 가능
# 인덱스 대신 키를 사용
dict = {
    1: "one",
    "two": 2, 
    'tree': [1, 2, 3], 
}
type(dic), dic

dic[1], dic["tree"]
```python
dic["two"] = 123
dic

# 아래의 데이터를 list와 dict로 선언
# 도시 : seoul, busan, daegu
# 인구 : 9,700,000, 3,400,000, 2,400,000
# 딕셔너리 : 변수 1개 선언
data = {
    "seoul": 9700000,
    "busan": 3400000,
    "daegu": 2400000,
}
# 리스트 : 변수 2개 선언
city = [seoul, busan, daegu]
population = [9700000, 3400000, 2400000]

1	sum(population)

1	sum(data.values())

형변환

데이터 타입을 변환하는 방법

int, float, bool, str, list, tuple, dict

1
2
3

a = 1
b = "2"
a + int(b)

1	str(a) + b

1	list(data.values())

# zip : 같은 인덱스에 있는 데이터를 묶어주는 함수
# zip 함수 사용하여 list 타입으로 변환하기
list(zip(city, population))
# dict 타입으로 변환하기
dict(zip(city, population))

1 2	result = dict(list(zip(city, population))) result

data1 = list(result.keys())
data2 = list(resutl.values())
data1, data2
``` 
6. 연산자 : 멤버 >  논리 
- 산술연산자 : +, -, *, /, //(몫), %(나머지), **(제곱)
- 할당연산자 : 변수에 누적시켜서 연산 : +=, //=, **= 등
- 비교연산자 : >(크다), <(작다), ==, !=, <=(작거나 같다), >=(크거나 같다), 결과로 True, False
- 논리연산자 : True, False 를 연산 : or(T와 F연산 True가 출력), and(T와 T일 때 True), not(True를 False로 False를 True로 변경)
- 멤버연산자 : 특정 데이터가 있는지 확인 할 때 사용 : not in, in

```python
# 산술연산 : 제곱, 나눗셈, 더하기 순
1 + 4 / 2 ** 2 # 2.0

# 할당연산
a = 10
a +=10
a += 10
a # 30

1 2	# 비교연산 a < b, a == b, a != b

1
2
3

# 논리연산 : and(교집합), or(합집합), 괄호가 있는 경우에는 왼쪽이 먼저 연산됨
True and False, True or False, not True or False # (not True = False가 되어 False or Flase는 False가 됨)
# False, True, False

1
2
3

ls = ['jin', 'andy', 'john']
'andy' in ls, 'anchel' in ls, 'john' not in ls
# True, False, False

# 랜덤함수
import random

random.randint(1, 10)

1
2
3

# 입력함수
data = input('insert string : ')
data

# 해결의 책 만들기 : 질문을 하면 질문에 대한 답변을 해주는 책
# 1. solution을 리스트로 작성
# 2. 질문 입력 받음
# 3. 솔루션의 갯수에 맞게 랜덤한 index 정수 값을 생성
# 4. index 해당하는 솔루션 리스트의 데이터를 출력
solution =[
    "무엇을 하던 잘 풀릴 것이다.", 
    '생각지도 않게 좋은 일이 생길 것이다.', 
    '무엇을 상상하던 그 이상이다.',
]
input("질문을 입력하세요. : ")
idx = random.randint(0, len(solution) - 1) # 솔루션 = 총 3개: 0, 1, 2 이므로 솔루션 숫자 -1을 해야 randint(0, 2)가 됨
solution[idx]

2020-05-09python / jupyter netebook2 minutes read (About 355 words)

jupyter notebook

python

coding program
numpy, pandas, sklearn 등의 모듈을 각각 설치해야 함

anaconda

numpy, pandas, sklearn 등의 모듈이 모두 포함되어 있음
용량이 큼(약 500MB)

jupyter notebook

mode

명령모드(esc) : 셀을 수정할 때 사용, 왼쪽 바의 색깔이 파란색입니다.
편집모드(enter) : 셀안의 내용을 수정할 때 사용, 왼쪽 바의 색깔이 녹색입니다.

style

markdown(명령모드 + m) : 셀 안에 설명을 작성할 때 사용
code(명령모드 + y) : 파이썬 코드를 작성할 때 사용
라인 넘버(명령모드 + l)

단축키

셀 실행 : shift + enter, ctrl + enter
셀 삭제 : (명령모드) x
되돌리기 : (명령모드) z
셀 생성 : (명령모드) a(위에), b(아래)

매직 커맨드

셀 내부에서 특별하게 동작하는 커맨드
% : 한줄의 magic command를 동작
%% : 셀 단위의 magic command를 동작

주요 magic command

%pwd : 현재 주피터 노트북 파일의 경로
%ls : 현재 디렉토리의 파일 리스트
%whos : 현재 선언된 변수를 출력
%reset : 현재 선언된 변수를 모두 삭제

shell command

주피터 노트북을 실행 셀 환경의 명령을 사용
명령어 앞에 !를 붙여서 실행

주요 명령어 : ls, cat, echo 등

!echo python : 뒤에 오는 문자열(python)을 출력해줍니다.
!ls : 현재 디렉토리에 있는 데이터를 표시해줍니다.

python tuple unpacking

python 최대공약수(GCD)

os와 shutil을 이용한 file_copy

numpy_indexing & slicing

numpy 모듈을 사용하여 ndarray 데이터 생성하기

machine_learning CNN

python function

python 조건문 (if, while, for)

basic

jupyter notebook

Categories

Recent

Archives

Subscribe to Updates

Tags