无遮挡无遮羞韩国歪歪漫画,日本韩国黄色,亚洲成人福利视频

pyspark如何根據值添加選定列

對于下面的數據結構，我希望返回一個基于condition列的新數據幀。例如，如果"condition" =='A'，新的數據幀在group1中應該有cols值，如果"condition" =='B'，新的數據幀在group2中應該有cols值。問題是我不想硬編碼列名，因為在anothervalue之后可能有很多列。我怎么能這么做？非常感謝你的幫助。例如，對于這個輸入數據幀，

+---------+---------+---------+
|condition|   group1|   group2|
+---------+---------+---------+
|        A|{SEA, WA}|{PDX, OR}|
|        B| {NY, NY}| {LA, CA}|
+---------+---------+---------+

我想得到這個輸出：

+---------+---------+
|condition|   group |  
+---------+---------+
|        A|{SEA, WA}|
|        B| {LA, CA}|
+---------+---------+

上述輸入數據幀是使用此json架構創建的：

jsonStrings = ['{"condition":"A","group1":{"city":"SEA","state":"WA"},"group2":{"city":"PDX","state":"OR"}}','{"condition":"B","group1":{"city":"NY","state":"NY"},"group2":{"city":"LA","state":"CA"}}']

發布于前

from pyspark.sql.functions import * conditions = when(col('condition') == 'A', col("group1"))\ .when(col('condition') == 'B', col("group2")).otherwise(None) df1.select(col('condition'), conditions.alias("group")).show(truncate=False)

pyspark如何根據值添加選定列

熱門問答

IF函數是否正在刪除javascript中的日期對象？

使用OpenAPI描述按名稱驗證Pydantic動態浮點枚舉

Python 3.10.1 0正在從完整路徑中提取文件名，不使用Path

創建后續時間變量

如何進一步了解AWS的RDS Aurora PostgreSQL9.6.19升級失敗？

dart中的繼承重寫了泛型類型

在Android開發中，如何使用整數來表示日歷中的月份和年份

如何在Facebook平臺上使用PHP處理實時數據流

APL語言在現代編程中的應用有哪些

取一個屬性從1個表到另一個表的平均值

android route命令

scrapy 里面 selenium 如何寫