porimol/fillna.py

## fillna.py
import pandas as pd

data = pd.read_csv('test.csv')
# array3 = data['Column2'].replace(np.NaN,-1)
# length = array3.shape[0]
# print(length)
# arr3 = [];
# for i in range(length):
#     if array3[i] != -1:
# #         print(i)
#         arr3.append(array[i])
#
# print(arr3)
# trimmed = st.trim_mean(arr3,.05)
# mask=(data['Column1']=='Yes') & ((data['Column2'=='NA']) |(data['Column2'=='No'])
# data.loc[mask,'Column2']=pd.to_numeric(data['Column2'],errors='coerce').fillna(trimmed)

data['Column2'] = data['Column2'].fillna(data.apply(lambda cols: round(data['Column2'].mean(),2) if cols[0]=='yes' else -1, axis=1))
data.to_csv(r'data.csv', index=False)
	import pandas as pd

	data = pd.read_csv('test.csv')
	# array3 = data['Column2'].replace(np.NaN,-1)
	# length = array3.shape[0]
	# print(length)
	# arr3 = [];
	# for i in range(length):
	# if array3[i] != -1:
	# # print(i)
	# arr3.append(array[i])
	#
	# print(arr3)
	# trimmed = st.trim_mean(arr3,.05)
	# mask=(data['Column1']=='Yes') & ((data['Column2'=='NA']) \|(data['Column2'=='No'])
	# data.loc[mask,'Column2']=pd.to_numeric(data['Column2'],errors='coerce').fillna(trimmed)

	data['Column2'] = data['Column2'].fillna(data.apply(lambda cols: round(data['Column2'].mean(),2) if cols[0]=='yes' else -1, axis=1))
	data.to_csv(r'data.csv', index=False)
	Hypertension	Hypertension_medicine_years	Diabetes	Diabetes_medicine_years
0	Yes	1	No	NaN
1	Yes	6	Yes	13.00
2	Yes	VALID	No	NaN
3	NaN	NaN	NaN	NaN
4	Yes	2	No	NaN
5	Yes	6	No	NaN
6	Yes	14	Yes	14.00
7	Yes	5	No	NaN
8	Yes	0.5	Yes	2.00
9	No	NaN	No	NaN
10	Yes	VALID	Yes	3.00
11	No	NaN	No	NaN
12	No	NaN	No	NaN
13	Yes	VALID	No	NaN
14	No	NaN	No	NaN
15	Yes	2	No	NaN
16	No	NaN	No	NaN
17	No	NaN	No	NaN
18	Yes	VALID	Yes	7.00
19	Yes	VALID	Yes	5.95
20	No	NaN	Yes	7.00
21	No	NaN	No	NaN
22	Yes	4	No	NaN
23	No	NaN	Yes	3.00
24	No	NaN	No	NaN
25	Yes	2	Yes	5.95
26	Yes	5	No	NaN
27	Yes	3	Yes	2.00
28	Yes	10	No	NaN
29	Yes	2	Yes	8.00
30	Yes	0.5	Yes	0.50
31	No	NaN	No	NaN
32	Yes	10	No	NaN
33	No	NaN	No	NaN