導航:首頁 > 相關訊息 > 電影詞雲圖片大全

電影詞雲圖片大全

發布時間：2024-04-30 10:24:27

㈠ Python豆瓣電影《肖申克的救贖》評論爬取

先看效果圖：

地址：（ https://movie.douban.com/subject/1292052/comments?sort=time&status=P）

爬取前1w條評論

存儲成txt文檔

數據預處理

中文分詞

統計top10的高頻詞

可視化展示高頻詞

根據詞頻生成詞雲

審核評論

================================================================

配置准備

中文分詞需要jieba

詞雲繪制需要wordcloud

可視化展示中需要的中文字體

網上公開資源中找一個中文停用詞表

根據分詞結果自己製作新增詞表

准備一張詞雲背景圖（附加項，不做要求）

paddlehub配置

#安裝jieba分詞和詞雲

pip install jieba

pip install wordcloud

#安裝paddle

pip install --upgrade PaddlePaddle

#安裝模型

#hub install porn_detection_lstm==1.1.0

pip install --upgrade paddlehub

pip install numpy

#安裝Beautifulsoup

pip install BeautifulSoup4

Github地址： https://github.com/mikite/python_sp_shawshank

有可能遇到的問題：

1.UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe8 in position 1: invalid continuation byte

解決方法：

1.不使用urlLib換做requests

2.去掉請求頭中的 'Accept-Encoding': 'gzip, deflate, br'

3.返回值reponse 轉字元串指定編碼utf-8

# 'Accept-Encoding': 'gzip, deflate, br',

2.關於cookie

解決方法：

1.去豆瓣請求頭中復制cookie設置到請求頭中

'Cookie': 'bid=WD6_t6hVqgM'

3.請求返回418的問題

解決方案模擬設置請求頭，設置user-agent

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36',

4.使用beautifulsoup獲取不到評論

解決方法：

第一步：指定解析參數為'lxml'

soupComment = BeautifulSoup(html, 'lxml')

第二步：

findAll方法指定css文件的class名

print('網頁內容：', soupComment.prettify())

comments = soupComment.findAll(class_='short')

點擊獲取源碼

㈡ python濡備綍鐢熸垚璇嶄簯鍥

from wordcloud import WordCloud
import jieba
import numpy
import PIL.Image as Image
#1.灝嗗瓧絎︿覆鍒囧垎
def chinese_jieba(text):
wordlist_jieba=jieba.cut(text)
space_wordlist=" ".join(wordlist_jieba)
return space_wordlist
with open("test.txt" ,encoding="utf-8")as file:
text=file.read()
text=chinese_jieba(text)
#2.鍥劇墖閬緗╁眰
mask_pic=numpy.array(Image.open("china.jpg"))
#3.灝嗗弬鏁癿ask璁懼間負錛歮ask_pic
wordcloud = WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",mask=mask_pic).generate(text)
image=wordcloud.to_image()
image.show()

濡傚浘鎵紺

閱讀全文

與電影詞雲圖片大全相關的資料

熱點內容

2021年春節帶孩子看什麼電影發布：2025-04-28 15:36:46 瀏覽：354

5d3拍微電影發布：2025-04-28 15:35:57 瀏覽：845

電影地雷戰視頻片段發布：2025-04-28 15:33:53 瀏覽：401

好男不當兵德語電影資源發布：2025-04-28 15:30:50 瀏覽：210

想做電影網站可以賺錢嗎發布：2025-04-28 15:12:45 瀏覽：893

bt資源論壇迅雷下載電影發布：2025-04-28 14:53:13 瀏覽：467

電影的作文怎麼寫發布：2025-04-28 14:40:13 瀏覽：783

救援車隊電影全集發布：2025-04-28 14:40:10 瀏覽：242

在線電影嘀哩發布：2025-04-28 14:25:36 瀏覽：608

一部外國電影不能說話發布：2025-04-28 14:16:29 瀏覽：351

除了電影學校還有哪裡可以當明星發布：2025-04-28 13:30:32 瀏覽：938

蜘蛛俠英雄遠征1電影在哪裡看發布：2025-04-28 13:26:19 瀏覽：316

龍城歲月電影完整版第一集發布：2025-04-28 12:59:28 瀏覽：865

八角籠電影在哪裡拍的發布：2025-04-28 12:58:51 瀏覽：104

情人節電影完整版發布：2025-04-28 12:42:46 瀏覽：310

電影悲慘世界1958國語下載發布：2025-04-28 12:42:38 瀏覽：87

小精靈舞曲是什麼電影主題曲發布：2025-04-28 12:30:55 瀏覽：28

家庭高級教程電影在線發布：2025-04-28 12:29:23 瀏覽：43

永不退縮下載電影天堂發布：2025-04-28 12:28:27 瀏覽：569

3d電影迅雷免費下載發布：2025-04-28 12:13:45 瀏覽：706