Koncepcja "tidy data":
- jedna obserwacja (jednostka statystyczna) = jeden wiersz w tabeli/macierzy/ramce danych
- wartosci danej cechy znajduja sie w kolumnach
- jeden typ/rodzaj obserwacji w jednej tabeli/macierzy/ramce danych
import numpy as np
data = np.genfromtxt('jajka1.csv', delimiter=";", dtype='|U16')
data2 = np.array([[s.replace(',', '.') for s in line] for line in data])
shape = data2.shape
sampleNumber = shape[0] * shape[1]
lokalizacja = np.empty([sampleNumber, 2], dtype='|U16')
cena = np.zeros(sampleNumber, dtype=float)
n = 0
for i in range(1, shape[0]):
for j in range(1, shape[1]):
if data2[i][j] != "":
lokalizacja[n][0] = data2[i][0]
lokalizacja[n][1] = data2[0][j]
cena[n] = float(data2[i][j])
n += 1
lokalizacja2 = lokalizacja[:-sampleNumber + n]
cena2 = cena[:-sampleNumber + n]
srednia = np.mean(cena2)
minCena = np.min(cena2)
lokMin = lokalizacja2[cena2 == minCena]
maxCena = np.max(cena2)
lokMax = lokalizacja2[cena2 == maxCena]