일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- power-bi
- python
- 프로그래머스
- 물 만날 물고기
- Revising the Select Query II
- Tableau
- 코랩
- 데이터분석솔루션
- KNIME 데이터 분석
- pyinstaller
- sorted()
- 데이터프레임
- KNIME
- 리스트
- MYSQL
- leetcode
- 태블로
- SQL
- 물만날물고기
- 텐서플로우
- DB
- sklearn
- 나임
- 판다스
- 코딩테스트
- colab
- HackerRank
- 해커랭크
- pandas
- 파이썬
- Today
- Total
물 만날 물고기
[DataSet] UCI - Wine Quality Data Set 가져오기 본문
🔍 예상 검색어
# 와인 데이터셋
# 머신러닝 와인 데이터셋
# wine 데이터셋
# uci wine quality 데이터셋
# 기계학습 데이터셋
# 와인 분류문제 데이터셋
# UCI Wine Quality Data Set
# Wine Quality Data Set - UCI Machine Learning Repository
# https://archive.ics.uci.edu/ml/datasets/wine+quality
UCI Wine Quality Data Set은 머신러닝 학습시 분류 문제로 많이 활용되고 있는 데이터셋이다. 데이터는 아래 링크에서 다운받을 수 있으며, url과 소스코드를 통해 데이터를 불러오는 방법은 아래 내용을 참고하면 된다.
UCI Machine Learning Repository: Wine Quality Data Set
UCI Machine Learning Repository: Wine Quality Data Set
Wine Quality Data Set Download: Data Folder, Data Set Description Abstract: Two datasets are included, related to red and white vinho verde wine samples, from the north of Portugal. The goal is to model wine quality based on physicochemical tests (see [Cor
archive.ics.uci.edu
# 데이터셋 불러오기
- pandas 모듈을 import 하고 아래에 uci 데이터셋 archive 링크를 이용하여 데이터를 불러올 수 있다.
import pandas as pd
redwine = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv", sep=";", header = 0)
whitewine = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv", sep=";", header = 0)
redwine["type"] = "red"
whitewine["type"] = "white"
# redwine 데이터셋 확인
redwine.head()
# whitewine 데이터셋 확인
whitewine.head()
# Attribute Information:
For more information, read [Cortez et al., 2009].
Input variables (based on physicochemical tests):
1 - fixed acidity
2 - volatile acidity
3 - citric acid
4 - residual sugar
5 - chlorides
6 - free sulfur dioxide
7 - total sulfur dioxide
8 - density
9 - pH
10 - sulphates
11 - alcohol
Output variable (based on sensory data):
12 - quality (score between 0 and 10)
'데이터 마이닝 > 데이터셋 (Data Set)' 카테고리의 다른 글
[DataSet] sklearn - fetch california housing 데이터셋 가져오기 (Regression) (0) | 2023.01.16 |
---|---|
[DataSet] UCI - Breast Cancer Wisconsin (Original) 가져오기 (0) | 2023.01.15 |
[DataSet] sklearn - iris 가져오기 (0) | 2023.01.13 |