Re: [問題] tuber套件擷取YouTube頻道資訊
原文恕刪
後來我用以下方式可以成功抓到想要的資訊了!!
# Get Channel description
get_description <- function(id) {
get_channel_stats(id)$snippet$description
}
description <- lapply(data$id, get_description)
description_df <- do.call(rbind, lapply(description, data.frame))
# Get Channel region
get_Country <- function(id) {
get_channel_stats(id)$snippet$country
}
Country <- lapply(data$id, get_Country)
Country_df <- as.data.frame(data.table(Country))
但以上方式雖然成功抓到資料,有幾個問題也想請教前輩
1. 這邊只列出抓兩種資訊(description & country)
但假設我要抓五個以上資訊的話,只能像上述寫法寫五組嗎?
2. 由於抓出來的資訊有包含英文, 中文, 日文甚至是阿拉伯文在內
我用以下寫法產出的CSV檔,非英文都會出現亂碼或是大量這種<U+25B6>
write.table(x = data, file = "Youtube.csv",
fileEncoding = "UTF-8", row.names = F)
設定了Sys.setlocale("LC_CTYPE", "Japan")等語系都還是不行
想請問該如何解決?
謝謝各位
補上 sessionInfo()
R version 4.0.0 Patched (2020-04-26 r78306)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 18363)
Matrix products: default
locale:
[1] LC_COLLATE=English_United States.1252
LC_CTYPE=English_United States.1252
LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
LC_TIME=English_United States.1252
system code page: 950
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.87.209 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1592844650.A.2B6.html
※ 編輯: iambakr (111.250.87.209 臺灣), 06/23/2020 01:02:00
※ 編輯: iambakr (111.250.87.209 臺灣), 06/23/2020 01:06:14
→
06/23 09:38,
4年前
, 1F
06/23 09:38, 1F
→
06/23 09:38,
4年前
, 2F
06/23 09:38, 2F
→
06/23 09:38,
4年前
, 3F
06/23 09:38, 3F
→
06/23 09:38,
4年前
, 4F
06/23 09:38, 4F
→
06/23 09:38,
4年前
, 5F
06/23 09:38, 5F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章