R语言读取豆瓣电影top10

Posted on2020年1月1日Authorcnliutz

library(XML)
library(RCurl)
strurl<-‘https://movie.douban.com/top250’
movie<-RCurl::getURL(strurl)
movie=htmlParse(movie)
nodes<-getNodeSet(movie,”//div[@class=’info’]//a//span[1]”)
moviename<-sapply(nodes, xmlValue)
moviename[1:10]

[1] “肖申克的救赎” “霸王别姬” “阿甘正传” “这个杀手不太冷” “泰坦尼克号” “美丽人生” “千与千寻”
[8] “辛德勒的名单” “盗梦空间” “忠犬八公的故事”

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30