Filter Pada Pandas , Filter Attribute dan Type Data

  Umum

in [1] : Menggunakan Paket Yang diperlukan

from sklearn.cluster import KMeans
import numpy as np
import  pandas

In [2]: Mengambil Dataset, jika anda mememrlukan dataset iris dapat di download di https://raw.githubusercontent.com/ullilfahri/OpenData/master/IRIS.csv

dataset = pandas.read_csv("/home/mfahri/github/OpenData/IRIS.csv") print(dataset.keys()) 
Index(['sepal_length', 'sepal_width', 'petal_length', 'petal_width',
       'species'],
      dtype='object')

In [3]: mengetahui tipe data dari data iris

df = pandas.DataFrame(dataset) tipedata = df.dtypes print(tipedata) 
sepal_length    float64
sepal_width     float64
petal_length    float64
petal_width     float64
species          object
dtype: object

In [5]: filter hanya attribute yang diperlukan saja , dalam kasus ini saya mengeluarkan attribute species

dfx = df.filter(items=['sepal_length', 'sepal_width', 'petal_length', 'petal_width']) print(dfx) 
     sepal_length  sepal_width  petal_length  petal_width
0             5.1          3.5           1.4          0.2
1             4.9          3.0           1.4          0.2
2             4.7          3.2           1.3          0.2
3             4.6          3.1           1.5          0.2
4             5.0          3.6           1.4          0.2
..            ...          ...           ...          ...
145           6.7          3.0           5.2          2.3
146           6.3          2.5           5.0          1.9
147           6.5          3.0           5.2          2.0
148           6.2          3.4           5.4          2.3
149           5.9          3.0           5.1          1.8

[150 rows x 4 columns]

In [6]: hanya mengambil attribute dengan tipe data object ( string )

datax = df.select_dtypes(include=object) print(datax) 
       species
0       setosa
1       setosa
2       setosa
3       setosa
4       setosa
..         ...
145  virginica
146  virginica
147  virginica
148  virginica
149  virginica

[150 rows x 1 columns]

In [7]: hanya mengambil dengan tipe data float

nmer = df.select_dtypes(include=float) print(nmer) 
     sepal_length  sepal_width  petal_length  petal_width
0             5.1          3.5           1.4          0.2
1             4.9          3.0           1.4          0.2
2             4.7          3.2           1.3          0.2
3             4.6          3.1           1.5          0.2
4             5.0          3.6           1.4          0.2
..            ...          ...           ...          ...
145           6.7          3.0           5.2          2.3
146           6.3          2.5           5.0          1.9
147           6.5          3.0           5.2          2.0
148           6.2          3.4           5.4          2.3
149           5.9          3.0           5.1          1.8

[150 rows x 4 columns]

LEAVE A COMMENT