在一列中有3個不同的值，并將它們替換成pandas中的0/1？

我有以下數據幀：

d = {'col1':['a','b','c','b','a','c','c','c'],'col2':[1,2,3,4,5,6,7,8]}
df = pd.DataFrame(data=d)

我想知道如何將'a'更改為1，'b'更改為0，將'c'的50%更改為1，其余的50%隨機更改為col1？

所以col1看起來像這樣[1,0,1,0,1,0,0,1]

發布于 2 月前

? 最佳回答：

將值按c比較為Series.eq的掩碼，然后使用Series.map按字典設置值，最后按Series.sample設置50%的值。僅過濾值：

m = df['col1'].eq('c')
df['col1'] = df['col1'].map({'a':1, 'b':0, 'c':0})

df.loc[df[m].sample(frac = 0.5).index, 'col1'] = 1

或者，您可以過濾值并將False值添加到Series.reindex上，以獲得大小類似原始DataFrame的掩碼：

m = df['col1'].eq('c')
df['col1'] = df['col1'].map({'a':1, 'b':0, 'c':0})

mask = m[m].sample(frac = 0.5).reindex(df.index, fill_value=False)
df.loc[mask, 'col1'] = 1
print (df)
   col1  col2
0     1     1
1     0     2
2     1     3
3     0     4
4     1     5
5     1     6
6     0     7
7     0     8

Numpy solution with numpy.random.choice:

m = df['col1'].eq('c')
df['col1'] = df['col1'].map({'a':1, 'b':0, 'c':0})

df.loc[m, 'col1'] = np.random.choice([0,1], p=[0.5, 0.5], size=m.sum())

公眾號：1024技術圈

?? 提供互聯網知識和資訊，分享IT前沿技術，熱門資源，大廠面試題 ??

在一列中有3個不同的值，并將它們替換成pandas中的0/1？

熱門問答

如何在Qt中將數據從非成員函數獲取到成員函數中？

如何透視和擴展dataframe列

如何更新Python3中函數外部的列表值

pyqt小部件未擴展到父級

如何在自定義遷移后在模型中添加新字段，在新字段之前訪問哪個模型？

取消選中TCheckListBox中的所有復選框

main 方法不是類 Deam 中的static, 請將 main 方法定義為: public static void main(String[] args)

python模塊相對導入的問題

Infragistics.WebUI.UltraWebListbar加載控件失敗

Android studio Run 窗口 javadoc 任務輸出亂碼

Vuex里面的commit為什么會讓prototype里的值響應式改變

Jest 如何測試 mouseMove, 改變 pageX, pageY？