所以我創建了一個簡單的代碼,用pandas讀取python3.0中的csv文件
import pandas as pd
df = pd.read_csv('https://www.goodreads.com/review_porter/export/153331182/goodreads_export.csv', on_bad_lines= 'skip')
print(df)
and instead of the csv file i ended with this:
<!DOCTYPE html>
0 <html>
1 <head>
2 <title>Sign Up</title>
3 <meta content='telephone=no' name='format-dete...
4 <link href='https://www.goodreads.com/user/sig...
.. ...
255 }
256 //]]>
257 </script>
258 </html>
259 <!-- This is a random-length HTML comment: xme...
[260 rows x 1 columns]
有人能幫我理解為什么在這個特殊的情況下不起作用,因為我嘗試了另一個。csv,效果很好。我使用的站點是https://www.goodreads.com/。csv文件來自導出部分。
這是因為在訪問csv文件之前,該鏈接需要經過身份驗證。由于您尚未通過任何身份驗證,因此只需閱讀注冊頁面并顯示HTML格式。
你可以試試這個:
即使您下載了csv文件,它也應該可以工作。