changwhs
13 years ago
string manipulation in shell script www.linuxtopia.org/onlin...
問題:
1. 效率不明,雖然搭配 grep、sed、wget、awk 後開發速度爆快。
2. 中文處理不確定是否有完美解法。
latest #9
changwhs
13 years ago
為了中文,保險起見我還是選 java,將來順便可以迅速轉型成網頁應用程式或 web service......
Nightmare
13 years ago
感覺不會比較快說@@
changwhs
13 years ago
nsysumis94: 是指 shell script 執行速度嗎?
立即下載
changwhs
13 years ago
要把非常多網頁表格轉存csv,本來要一行一行讀,讀到要的 column name 就把下一行相對應的 value 存下來,想不到 grep -F -A1 -f all_column_names.txt 再用 sed 把 html tag 拿掉、行尾符號換成逗點就完成了 XD
changwhs
13 years ago
只是這樣複雜度從 O(n) 增加成 O(column_number * n) ,但 grep 的 multiple pattern search optimization 可能可以補一點速度回來
Nightmare
13 years ago
不愧是大師 (worship)
changwhs
13 years ago
grep "#e1e9d3" $src_file -A 500 | grep "history.go(-1)" -B 500 > $tmp_file
changwhs
13 years ago
grep -F -A1 -f target_tags.txt $tmp_file | sed '/bgColor=#CCCC99/d;/--/d;s_</\?td>g;s_[[:blank:]]g;s/$/\t/g' | tr -d "\r\n" >> $dst_file
changwhs
13 years ago
原本用 C# ,寫一寫還在 debug 不知道錯在哪,某天的一個意外就像上面這樣完成了
back to top