Pandas

Hızlı Notlar

  • df.dtypes Tablodaki özellikleri listeler

Json okuma ```py import gzip import simplejson as json with gzip.open('./data/yelp.json.gz', 'r') as f: yelp_data = [json.loads(line) for line in f] yelp_df = pd.DataFrame(yelp_data) yelp_df.head() ```

DataFrame Series

  • Datafrme dict of Series şeklinde tanımlanır

  • Seriler aynı np.array gibidir

    • index ile boyutlarını görebiliriz

    • RangeIndex(start=0, stop=37938, step=1)

  • yelp_df[100]['city'] şeklinde erişim olmaz

    • yelp_df['city'][100] şeklinde 100. öğeye erişilir

    • Veya yelp_df.loc[100, 'city'] şeklinde 100.verinin şehir verisi alınır