要使用Matplotlib為機器學習數據集創建類別分布的直方圖和餅圖,你可以按照以下步驟操作:
1. 首先,確保你已經安裝了Matplotlib庫。如果沒有安裝,可以使用pip進行安裝:
pip install matplotlib
2. 然后,導入所需的庫并加載你的數據集。這里假設你的數據集是一個名為data
的Pandas DataFrame,并且類別標簽存儲在名為target
的列中。
3. 使用Matplotlib的pyplot
模塊繪制直方圖和餅圖。
以下是一個簡單的示例代碼:
import matplotlib.pyplot as plt
import pandas as pd
# 假設你的數據集已經加載到data變量中
# data = pd.read_csv('your_dataset.csv')
# 提取類別標簽
categories = data['target'].value_counts()
# 繪制直方圖
plt.figure(figsize=(10, 5))
plt.bar(categories.index, categories.values)
plt.xlabel('Category')
plt.ylabel('Count')
plt.title('Distribution of Categories')
plt.show()
# 繪制餅圖
plt.figure(figsize=(6, 6))
plt.pie(categories.values, labels=categories.index, autopct='%1.1f%%')
plt.title('Distribution of Categories (Pie Chart)')
plt.show()
這段代碼首先計算每個類別的數量,然后分別繪制直方圖和餅圖來展示這些數量。你可以根據需要調整圖表的大小、顏色和其他樣式。