reimisak
3 years ago @Edit 3 years ago
突然回坑K雙王整理同人文,下定決心斷捨離,共花了整整三天瘦身。
latest #14
reimisak
3 years ago
先前主要確保各篇文有蒐集、刪除重複並挑完整文保留,因此主要整理比對大文包(以作者為分類的主要有2個相似)、小文包(各作者發布的文包),並以大文包的作者為主架構來分類。
因入坑以來就有存文習慣,並以非原著向、原著向來分類。因此自己過去存文若要與大文包整合,重點在於"分類要以誰為準"。此外比較晚時拿到lofter救文文包(主要2個),不過因為我本來lofter就看、挑過一遍,因此整合的重點就放在"要留txt、html、pdf哪種檔案類型"。
reimisak
3 years ago
最終決定分類:依舊作者主分類,但各資料夾加"非原"次分類,最終目標是將[作者、原著向]這兩資訊加到檔名。
reimisak
3 years ago
最終決定存文類型:txt>html>pdf。偶爾會兩者並存。
出於空間容量考量,最後還是屈服於純文字了。而針對想保存圖文並茂(其他繪者或自繪圖配文)或文字有做效果(分析小論文、心得文)的文,則以另存同名圖檔或存html的方式解決。因發現html在不同裝置,如手機平板的閱讀體驗,會比制式版面的pdf佳,因此還存活的文若能開啟,pdf會改html格式。但針對系列長文或是結合圖檔的文(r18文常見),則pdf能迅速整合並有書籤直跳各章節,會是較適合的儲存方式。
立即下載
reimisak
3 years ago
不過對於喜愛的作者,這次有多花時間把文章存成txt。若圖檔文篇數不多,ocr並抓蟲成,系列文也是merge合成單一檔案。
reimisak
3 years ago
目前整合進度:
1."非原"次分類已加,但文還沒分類完,因為開文確認耗時,所以僅先仰賴自己存文,並已將有建立作者資料夾的作者的文,從自己存文整合過去大文包。
2.已刪除lofter救文文包中在大文包有建立作者資料夾的作者文章。
-----
reimisak
3 years ago
後續預計:
step1-挑文以自己存文文包為主,將同作者的文,在大文包中建立作者資料夾。
step2-比對lofter救文文包,若有可用txt則取代自己存文常見的pdf、html。
reimisak
3 years ago
-----
因為過去自己存文以pdf為主,接下來應該還可以再瘦身一些?
reimisak
3 years ago
好吧,不在意容量的我因為入手電子書閱讀器,但發現連雲端開檔案閱讀速度不比在裝置本身讀順暢,而裝置容量好小,所以開始決定斷捨離掉美美的pdf,拜入txt純文字黨教。
於是只能花點時間merge系列文,只能說幸好各篇長文大文包已有整理,不然我不會想繼續接著整。不過比原預期多花不少時間(本來想說一天可解決?),這之後應該隔個一陣子才會再來工作了。
reimisak
3 years ago
-----
題外話,偏好雙王互攻者如我,整的文包也是三邊蒐集,之前分享自己存文時特別有挑過才敢分享出去,真希望這世界攻受消失,這樣永遠支持無差的我就不用那麼麻煩了
reimisak
3 years ago
好想求"十宗不語",但當初印量20多本,又在中國,我有生之年求得到嗎?
還是老實點先把"倘若相遇"的心得文生出來,再接手十宗,然後發文來求吧XDDD
reimisak
3 years ago
---
不少網站的網頁存html檔案大小會比丟adobe軟體的pdf大(可編輯),但推測應該和網頁列印的pdf差不多大小(不可編輯)。若是本來存的檔案是前一類型的pdf,就維持pdf;後一類型,則比大小替換成html甚至是txt(當html有mb時)。
reimisak
3 years ago
---
同時保留txt與原本的pdf:當後者的文字閱讀體驗ok且檔案存的比較小(各軟體轉來而非直接列印pdf)。不佳的情況主要指"字太小",即使電腦開文章閱讀也不好看文。
reimisak
3 years ago
---
對於比較少愛的文,pdf必存成容量較小的txt。
量少可手動,量多或為不可複製類型,則用自製蟲子去爬。
reimisak
3 years ago
---
又一個三天,總共整理到差不多百位作者了,整理這件事真得靠氣魄。
存成txt要注意空行空格,先複製到word再貼到純文字編輯器,可以除去因網頁語法多出的空行,回復成作者原先排版。
back to top