<button id="eqmkc"></button>

<rt id="eqmkc"></rt>

Pandas從數據幀的字符串列中提取前N%的字符

python pandas

我有一個name列，我試圖提取字符串的前75%字符。

我所嘗試的：

data = [
    ["123", "NQMCare"],
    ["456", "CRAMER"],
    ["789", "Swinley Court"]
]
df = pd.DataFrame(data, columns=["ID", "Name"])
df["len"] = df["Name"].str.len()
df["len_75"] = (df.len * 0.75).fillna(0).astype(int)
df["Name 2"] = df["Name"].str[ : df.len_75 ]
df["Name 3"] = df["Name"].str.slice(0, df.len_75, 1)

df
#   ID  Name            len len_75  Name 2  Name 3
# 0 123 NQMCare         7   5       NaN     NaN
# 1 456 CRAMER          6   4       NaN     NaN
# 2 789 Swinley Court   13  9       NaN     NaN

我在嘗試分割字符串值時得到了NaN。我不知道哪里出錯了，因為像這樣df["Name"].str[:5]的整數值硬編碼是有效的。。。

發布于 2 月前

? 最佳回答：

pandas中的切片只能通過標量進行，如果可能需要每行不同的值，請使用DataFrame.apply或列表理解：

df["Name 2"] = df.apply(lambda x: x["Name"][ : x.len_75 ], axis=1)
df["Name 3"] = [a[:b] for a, b in zip(df['Name'], df['len_75'])]
print (df)

    ID           Name  len  len_75     Name 2     Name 3
0  123        NQMCare    7       5      NQMCa      NQMCa
1  456         CRAMER    6       4       CRAM       CRAM
2  789  Swinley Court   13       9  Swinley C  Swinley C

公眾號：1024技術圈

?? 提供互聯網知識和資訊，分享IT前沿技術，熱門資源，大廠面試題 ??

<rt id="weyuk"></rt>

Pandas從數據幀的字符串列中提取前N%的字符

熱門問答

C內聯隨機寫入系統調用只打印4個字符，但僅當使用“=a”作為輸出寄存器時

oracle在simple order by和Listag的order by上的排序方式不同

如何將一周中每天的平均小時數據可視化為R中七天的一個方面？

RoR：試圖繪制出復雜的模型關系

Azure管道獲取Pull請求源和目標分支名稱

庫類型的析構函數定義得好嗎？

在Apache中配置.htaccess時，如何確保mod_rewrite規則不會影響網站的其他部分

Python和Django如何利用緩存提高性能

python pandas 獲取列不帶索引

Python在數據框行中做標記顯示

nursery日期

webstorm顯示echart.init方法未定義