原來如此
最近實在經歷了太多事情不禁開始懷疑自己嗑CP的初心,其實對我來說搞羨澄的日子特別珍貴也特別開心,主要是因為這個CP給了我很大的動力去學習我不會的東西。
最開始是因為丹測搜索掛了,看到X老師提問說難道沒有軟體可以把貼文備份下來轉貼到另一個帳號上嗎?就想到我不是會爬蟲嗎?於是寫看看。
一開始真的特別難,對wb的介面不熟,只能用自動化模組去做,模仿真人滑動滑鼠使wb動態加載然後一則一則貼文備份,這效率不高而且大概滑個幾小時後就會當掉,所以我當時寫了特別多錯誤處理去解決這個問題,也花了很多時間,全部備完大概花了將近四、五天。等到我全部爬完才發現部分程式碼有問題,原本是想連圖片一起備份下來結果發現錯誤處理沒寫好,有一部分的圖片完全沒備份到(可惡)。但當時也沒力氣再重爬一次了,全部弄成一個csv就上傳上去讓大家自己看。
第二次是因為O在搞,看他把前廁當作私有物轉粉絲可見,拉黑X老師並且把新關注的人都移粉,看的太生氣了,覺得投稿都是大家的心血,怎麼可以這樣踐踏同擔的愛,遂暗自擬定計畫,要趁他睡著時把所有粉見貼文都備份下來。
這次任務的難度更高,因為一但被發現了就可能被移粉拉黑,所以我不僅要在有限的時間內完成,還不容許失敗。最好的方式就是趁著他去睡覺時進行備份,算他睡眠時間我大概也只有8-10小時左右。8小時,9600多則貼文,等於我3秒要備份一則,而且還不能觸發wb的反爬蟲機制。這好像在執行駭客任務啊啊啊好刺激好好玩XDDD
我發現我比自己想像中的聰明,很快就摸索出了第二套方法XD
第二套方法可以用更短的時間將貼文爬完不會有動態加載帶來的斷掉的問題。為求周全,我還先在原廁測試了程式碼,確認可行後,抓準某個平日的半夜1點開始進行備份。一到點我就去關注前廁,然後開始執行程式,中間還特地設了鬧鐘起床查看程式碼有沒有順利運行。發現操作頻繁ip被屏蔽了,趕緊換個ip,和wb鬥智鬥勇。
全部爬完後,我想如果像上次一樣以csv檔保存,閱讀不易,所以又研究了怎麼把這些文字、圖片還有評論做成方便手機閱讀的pdf檔,介面當然不可能100%還原,但可以讓大家看起來更舒適。沒做過,想說應該有點困難,靠著chatgpt及一些好用的python套件,噹啷~我做出來了!
想到那時候也真好笑,不過就是個屁點大的圈子,屁點大的事,大概一週過去就無人在意,我卻像打了雞血似的覺得自己在做一件很重要的事情XD
一直都是匿名在做,因為我並沒有想要同擔的感謝(事實上也沒人感謝我XDD),也不想要「一戰成名」,當女明星(?)。對我來說做這件事情最大的快樂不是同擔會關注我感謝我,而是因為我完成了一項有點難度的任務,也學到了新的東西。今天的我又比昨天的我進步了一點點。
寫文也是這種感覺,大學當了很久的現充,這兩年才開始復健。寫著寫著發現自己寫的東西一點古韻也沒有,跑去和親友哀嚎,他說,不然你去看金庸吧。我就把好久沒看的金庸撿回來複習。又想到我的紅樓夢止步於高中暑假指定閱讀的前40回,於是又把紅拿出來看,越讀越有意思,覺得我生在古代必定是丫鬟,那低眉順眼瞻前顧後的和主子說話的樣子簡直就是我vs我老闆。後來又發現最近有難得的特展,暫定8月去看。
嗑CP的快樂就在於此,因為愛而有動力學習,因為愛而慢慢拓展了自己的視野,若不是為了要搞男同(搞男同->研究寫文->去讀古書),我身為一個絕望的文盲只怕也不會想到要去翻紅樓夢,但我現在竟然還要去看展~~
玩查成分遊戲的時候學會了用head/cookie,了解了分群演算法。
最近發現了javascript在網頁上可以做到的事比python更多,又有新的可以努力的方向。
現在回想起來真的很開心。前陣子被圈內的人際關係搞得很煩躁,甚至感覺一切都沒有意義,但冷靜下來想想,最開心的那些事情那些日子,往往都和別人沒關係。