일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 김범준교수
- logistic regression
- 통계물리학
- scatter()
- pyplot
- Python
- 과학서적
- GMM
- Data Visualization
- Train-Test Split
- scikit-learn
- iris데이터
- confusion matrix
- 군집분석
- Today
- Total
목록코딩 (8)
Basin of Attraction

이번 예제에서는 scikit-learn의 Gaussian Mixture Model (GMM)을 사용하여 iris 데이터셋을 군집화하는 방법을 살펴보겠습니다. Gaussian Mixture Model은 데이터가 여러 개의 가우시안 분포에서 생성되었다고 가정하는 모델로, 데이터를 여러 개의 클러스터로 분리할 수 있습니다. 우선, 필요한 라이브러리를 가져옵니다. import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.mixture import GaussianMixture 다음으로, iris 데이터셋을 로드합니다. iris = datasets.load_iris() X = iris.data Gaussia..

MeanShift 클러스터링 알고리즘은 scikit-learn에서 제공되는 비지도 학습 알고리즘 중 하나로, 클러스터의 중심을 식별하고 데이터 포인트를 중심 주변의 밀도가 높은 영역에 그룹화하려고 시도합니다. 이 알고리즘은 데이터의 확률 밀도 함수를 추정하고, 클러스터의 중심을 고밀도 영역으로 반복적으로 이동시킴으로써 작동합니다. 이 예제에서는 MeanShift 알고리즘을 사용하여 합성 데이터셋을 클러스터링하는 방법을 살펴보겠습니다. 우선 필요한 라이브러리를 가져옵니다. import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import MeanShift, estimate_bandwidth from sklearn.datasets i..

위 코드에서는 matplotlib 모듈의 plot() 함수를 사용하여 시간에 따른 주가 데이터를 그래프로 표현하였습니다. 결과는 다음과 같습니다. 주가가 무작위로 변동하는 것을 확인할 수 있습니다. GBM 모형은 실제 주가와 비슷한 성질을 가지므로, 자산 가격의 변동성을 모델링하고 포트폴리오 최적화, 옵션 가격 계산 등의 분석에 유용하게 사용됩니다. Geometric Brownian Motion(GBM) 모형은 확률과 통계학에서 주로 이용되며, 자산 가격을 모델링할 때 널리 사용됩니다. 이번 예제에서는 GBM 모형을 사용하여 주가 데이터를 생성하고, 이를 시각화하는 과정을 살펴보겠습니다. GBM 모형 GBM 모형은 브라운 운동(Brownian Motion)이라는 개념에서 파생되었습니다. 브라운 운동은 입..
1. Dictionary 타입 생성 다음과 같이 {} 를 사용하여 딕셔너리를 생성할 수 있습니다. dic1 = {'a': 1, 'b': 2} 위 코드에서 dic1은 key-value pair 형태로 이루어진 딕셔너리입니다. 2. Dictionary 타입 합치기 두 개의 딕셔너리를 합쳐서 새로운 딕셔너리를 생성하는 방법입니다. dic2 = {'c': 3, 'd': 4} dic3 = {**dic1, **dic2} 위 코드에서 ** 연산자를 사용하여 두 딕셔너리를 합쳤습니다. 3. Dictionary 타입에서 Key 검색 다음과 같이 in 키워드를 사용하여 딕셔너리의 특정 key가 있는지 검색할 수 있습니다. print('a' in dic1) # Return True 위 코드에서 'a' 가 dic1 딕셔너리의..
본 예제는 Python 언어와 Scikit-learn 라이브러리를 이용하여 로지스틱 회귀 분석을 수행하고, confusion matrix를 시각화하는 방법을 다루고 있습니다. 1. 필요한 라이브러리 설치 및 불러오기 !pip install scikit-learn matplotlib from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression from sklearn.metrics import plot_confusion_matrix from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt 2. 데..