본문 바로가기

CS/Python

(21)
Numerical Python - Numpy(2) @axis -모든 operation funtion을 실행할 때, 기준이 되는 dimension 축 import numpy as np print(np.arange(1, 13).reshape(3, 4)) output) [[ 1 2 3 4] [ 5 6 7 8] [ 9 10 11 12]] -처음 생기는 shape은 항상 0 그 후로 shape이 생기면 하나씩 뒤로 밀려 항상 새로 생기는 shape이 0, 기존의 shape은 1이 됨 import numpy as np test_array = np.arange(1, 13).reshape(3, 4) print(test_array.sum(axis=1)) output) [10 26 42] -axis=1 : column(열) 기준으로 더하라 import numpy as n..
Numerical Python - Numpy(1) @Numpy -Numerical Python의 약자 -파이썬의 고성능 과학 계산용 패키지 -Matrix와 Vector같은 Array 연산의 사실상 표준 -한글로 넘파이로 주로 통칭, 넘피/늄파이라고 부르기도 함 @Numpy 특징 -일반 List에 비해 빠르고, 메모리 효율적 -반복문 없이 데이터 배열에 대한 처리 지원 -선형대수와 관련된 다양한 기능 제공 -C, C++, 포트란 등의 언어와 통합 가능 *Python의 가장 큰 특징: Dynamic typing(동적 타이핑) 실행시점에 데이터 타입 결정 다양한 데이터 타입이 하나의 리스트에 들어가게 됨 but, numpy는 그걸 허락하지 않음 => ndarray와 list의 가장 큰 특징 !! @Array creation -input import numpy..
PCA: How to use in Python https://towardsdatascience.com/pca-clearly-explained-how-when-why-to-use-it-and-feature-importance-a-guide-in-python-7c274582c37e PCA clearly explained — How, when, why to use it and feature importance: A guide in Python In this post I explain what PCA is, when and why to use it and how to implement it in Python using scikit-learn. Also, I explain how to… towardsdatascience.com
Basic Linear Algebra | 선형대수 기본 선형대수는 일종의 언어라고 생각
News Categorization @News Categorization -비슷한 뉴스끼리 분류하기 컴퓨터는 문자 그대로 이해하지 못함 문자 -> 숫자 숫자로 유사하다는 표현을 어떻게 할까? 유사하다 -> 가깝다 어떤 숫자를 벡터로 바꿔줘야 함 문자 -> 숫자 -> 벡터 @One-hot Encoding(Bag of words) -가장 기본적인 문서에 대한 벡터 표현 기법 -문자를 벡터로 -하나의 단어를 벡터의 인덱스로 인식, 단어 존재시 1 없으면 0 -단어별로 인덱스 부여, 한 문장(또는 문서)의 단어 개수를 벡터로 표현 @유사성 -> 거리 측정 -Distance measure @Euclidian distance -피타고라스 정리, 두 점 사이의 직선의 거리 @Cosine distance -두 점 사이의 각도 -문서의 similarity..
Linear algebra codes @Vector representation of python -Vector를 python으로 표현하는 다양한 방법 존재 # There are various ways to represent vectors in Python vector_a = [1, 2, 10] vector_b = (1, 2, 10) vector_c = {'x':1, 'y':1, 'x':10} print(vector_a, vector_b, vector_c) # [1, 2, 10] (1, 2, 10) {'x': 10, 'y': 1} -최선의 방법은 없음 -값의 변경 유무, 속성값 유무에 따라 선택 가능 # Vector calculation u = [2,2] v = [2,3] z = [3,5] result = [sum(i) for i in zip..
Data Structure - Collections @Collections -List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조(모듈) -편의성, 실행 효율 등을 사용자에게 제공 -아래의 모듈이 존재 @deque -Stack과 Queue를 지원하는 모듈 -List에 비해 효율적인 자료 저장 방식 지원 -deque는 기존 list보다 효율적인 자료구조 제공 ->처리 속도 향상 deque 실습) from collections import deque deque_list = deque() for i in range(5): deque_list.append(i) print(deque_list) # deque([0, 1, 2, 3, 4]) deque_list = deque() for i in range(5): deque_list.app..
Asterisk @Asterisk(*) -단순 곱셈, 제곱 연산, 가변 인자 활용 등 다양하게 사용됨 **: 키워드 인자 dict 타입으로 들어감 실습) def asterisk_test(a, *args): print(a, args) # 1 (2, 3, 4, 5, 6) print(type(args)) # asterisk_test(1,2,3,4,5,6) def asterisk_test(a, **kargs): print(a, kargs) # 1 {'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6} print(type(kargs)) # asterisk_test(1, b=2, c=3, d=4, e=5, f=6) kargs: 키워드 인자 예시에서 1은 a에 들어가고 나머지는 dict 타입으로 kargs에 들어감..

Tiny Star