관리 메뉴

물 만날 물고기

[DataSet] UCI - Wine Quality Data Set 가져오기 본문

데이터 마이닝/데이터셋 (Data Set)

[DataSet] UCI - Wine Quality Data Set 가져오기

Lung Fish 2023. 1. 12. 01:31

🔍 예상 검색어

더보기

# 와인 데이터셋

# 머신러닝 와인 데이터셋

# wine 데이터셋

# uci wine quality 데이터셋

# 기계학습 데이터셋

# 와인 분류문제 데이터셋

# UCI Wine Quality Data Set

# Wine Quality Data Set - UCI Machine Learning Repository

# https://archive.ics.uci.edu/ml/datasets/wine+quality

 

 UCI Wine Quality Data Set은 머신러닝 학습시 분류 문제로 많이 활용되고 있는 데이터셋이다. 데이터는 아래 링크에서 다운받을 수 있으며, url과 소스코드를 통해 데이터를 불러오는 방법은 아래 내용을 참고하면 된다.

 


UCI Machine Learning Repository: Wine Quality Data Set

 

UCI Machine Learning Repository: Wine Quality Data Set

Wine Quality Data Set Download: Data Folder, Data Set Description Abstract: Two datasets are included, related to red and white vinho verde wine samples, from the north of Portugal. The goal is to model wine quality based on physicochemical tests (see [Cor

archive.ics.uci.edu

 

# 데이터셋 불러오기 

  • pandas 모듈을 import 하고 아래에 uci 데이터셋 archive 링크를 이용하여 데이터를 불러올 수 있다. 
import pandas as pd
redwine = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv", sep=";", header = 0)
whitewine = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv", sep=";", header = 0)              
redwine["type"] = "red"
whitewine["type"] = "white"

 

# redwine 데이터셋 확인

redwine.head()

 

# whitewine 데이터셋 확인

whitewine.head()

 

# Attribute Information:

For more information, read [Cortez et al., 2009].
Input variables (based on physicochemical tests):
1 - fixed acidity
2 - volatile acidity
3 - citric acid
4 - residual sugar
5 - chlorides
6 - free sulfur dioxide
7 - total sulfur dioxide
8 - density
9 - pH
10 - sulphates
11 - alcohol
Output variable (based on sensory data):
12 - quality (score between 0 and 10)