我有一個csv文件,列中的信息(id和文本)如下面的示例所示:
1, ?ildomos grindys
2, ?ildomos grindys, Rekuperacin? sistema
3,
4, Skalbimo ma?ina, Su baldais, ?aldytuvas, ?ildomos grindys
我想要的輸出是將ID傳輸?shù)揭恍校⑵渑c其文本關(guān)聯(lián)(用于數(shù)據(jù)庫)。由于csv文件非常大,我只給你一小部分來了解我想要什么:
| ID | Features
+----------------+-------------
| 1 | ?ildomos grindys
| 2 | ?ildomos grindys
| 2 | Rekuperacin? sistema
| 3 | null
| 4 | Skalbimo ma?ina
| 4 | Su baldais
| 4 | ?aldytuvas
| 4 | ?ildomos grindys
我如何通過python做到這一點?謝謝
這里有一種方法可以滿足您的要求:
Output:
UPDATE:
另一種方法是使用pandas(docs)。Pandas提供了許多處理表格數(shù)據(jù)的強大方法,但它也有一點學習曲線:
Output
pandas的文檔鏈接如下: