02. Numpy

02. Numpy

2021. 9. 23. 23:45ㆍAI 온라인 교육/데이터 분석을 위한 라이브러리

: Python에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리

(대표적으로 Pandas, Numpy, matplotlib)

Numpy를 사용하는 이유

- 데이터의 대부분은 숫자배열로 볼수있다. 그렇기 때문에 데이터를 배열로 보고 처리하기 위해서
- 반복문 없이 배열 처리 가능 -> 대용량의 데이터를 빨리 계산 가능
-> 메모리 효율적 사용

Numpy 사용법

list는 [0, 1, 2, 3, 4, 5] => ,로 구분, 배열은 [0 1 2 3 4 5] => 공백으로 구분

: 배열의 데이터 타입
- 파이썬 리스트와 달리 같은 데이터 타입만 저장가능 -> 단일데이터

dtype종류(숫자는 그 테이터를 저장할수 있는 용량을 말함)

- int 정수형 타입: i, int_, int32, int64,= i8
- float 실수형 타입: f, float_= float64=f8, float32
- str 문자열 타입: str, U(unicode약자), U32
- bool 부울 타입: ?, bool_

ndarray의 차원 관련 속성

- ndim(n+dimensim): 몇차원인지 출력

- shape: 배열의 모양을 출력

ndarray는 크기속성과 shape조절

* 형태 :'{인덱스0}, {인덱스1}'.format(값0, 값1)
.format 함수의 인자로 순서대로 변수를 넣는다.

: 인덱스로 값을 찾아냄

Boolean indexing

: 배열의 각 요소의 선택여부를 Boolean mask(True, False로 구성된 mask array)를 이용하여 지정하는 방식
- 조건에 맞는 데이터를 가져온다
- 참인지 거짓인지 알려준다.

Fancy indexing

:배열의 각 요소 선택을 Index 배열을 전달해 지정하는 방식(찾고 싶은 자리 = 인덱스에 어떤값?)

:인덱스의 값으로 배열의 일부분을 가져옴

Indexing&Slicing 함께 활용해보기

하마의 코딩일기