IT/Python

[Python] 데이터 시각화 Matplotlib 라이브러리 이용하기

멋진 선배 2025. 1. 12. 02:19
반응형

파이썬에 강력한 데이터 시각화 라이브러리인  Matplotlib에 대해 알아보도록 하겠습니다. Matplotlib는 데이터 과학자들이 가장 즐겨 사용하는 도구 중 하나로, 데이터를 시각적으로 표현하여 인사이트를 얻는 데 큰 도움을 줍니다.

Matplotlib이란?

Matplotlib는 파이썬에서 2D 그래프를 그리기 위한 라이브러리 입니다. MATLAB과 유사한 인터페이스를 제공하여, 데이터 시각화를 위한 다양한 그래프와 차트를 생성할 수 있습니다.

Matplotlib  시작하기

Matplotlib를 사용하기 위해서는 먼저 설치해야 합니다. 아나콘다를 사용하면 Matplotlib이 이미 포함되어 있어 편리 합니다. pip를 통해 설치 할 수 있습니다.

pip install matplotlib

설치 후, 다음과 같이 import 합니다.

import matplotlib.pyplot as plt

기본그래프 그리기

Matplotlib의 가장 기본적인 사용법은 선 그래프를 그리는 것 입니다. 다음은 간단한 선 그래프를 그리는 예제 입니다.

실행결과

import matplotlib.pyplot as plt

plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['axes.unicode_minus'] = False

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.plot(x, y)
plt.xlabel('X 축')
plt.ylabel('Y 축')
plt.title('기본 선 그래프')
plt.show()

이 코드는 x축과 y축에 라벨을 붙이고, 그래프에 제목을 추가한 기본적인 선 그래프를 생성합니다.

다양한 그래프 유형

Matplotlib는 선 그래프 외에도 다양한 유형의 그래프를 지원합니다. 몇가지 예를 살펴 보겠습니다.

 

막대그래프

categories = ['A', 'B', 'C', 'D', 'E']
values = [20, 35, 30, 25, 40]

plt.bar(categories, values)
plt.title('막대 그래프')
plt.show()

 

산점도

import numpy as np

x = np.random.rand(50)
y = np.random.rand(50)

plt.scatter(x, y)
plt.title('산점도')
plt.show()

 

파이차트

sizes = [30, 20, 25, 15, 10]
labels = ['A', 'B', 'C', 'D', 'E']

plt.pie(sizes, labels=labels, autopct='%1.1f%%')
plt.title('파이 차트')
plt.show()

그래프 커스터마이징

Matplotlib은 그래프의 모든 요소를 세밀하게 조정할 수 있는 기능을 제공 합니다.

 

색상과 스타일

plt.plot(x, y, color='red', linestyle='--', marker='o')

이 코드는 빨간색 점선에 원형 마커가 있는 그래프를 생성 합니다.

여러 그래프 동시에 그리기

plt.subplot(2, 1, 1)
plt.plot(x, y)
plt.title('첫 번째 그래프')

plt.subplot(2, 1, 2)
plt.scatter(x, y)
plt.title('두 번째 그래프')

plt.tight_layout()
plt.show()

이 코드는 하나의  figure에 두 개의 그래프를 수직으로 배치 합니다.

데이터 시각화의 중요성

데이터 시각화는 복잡한 데이터셋을 이해하기 쉬운 형태로 표현하는 강력한 도구 입니다. 시각화를 통해 우리는 데이터의 패턴, 추세, 이상치 등을 쉽게 파악할 수 있습니다.

 

Matplotlib는 이러한 데이터 시각화 과정을 매우 간단하고 효과적으로 수행할 수 있게 해줍니다. 기본적인 그래프부터 복잡한 차트까지, Matplotlib은 데이터 과학자들에게 필수적인 도구 입니다.

 

마치며

Matplotlib는 데이터 시각화의 기본이 되는 라이브러리 입니다. 이 글에서는 기본적인 사용법만 다뤘지만 실제로는 휠씬 더 다양하고 강력한 기능들이 있습니다. 데이터 분석에 관심이 있다면,  Matplotlib을 깊이 있게 학습해 보는 것을 추천 합니다.

반응형