Login
Sign Up For Free
English
中文 (繁體)
中文 (香港)
中文 (简体)
日本語
Filipino
Bahasa Indonesia
Bahasa Melayu
Pусский
Português (Brasil)
Magyar
Français
Español
Deutsch
Čeština
العربية
Català
Dansk
Ελληνικά
فارسی
Suomi
Gaeilge
Hindi
עברית
Hrvatski
Italiano
Norsk bokmål
Nederlands
한국어
Polski
Română
Slovenský
Svenska
Türkçe
українська
беларуская
ไทย
Standard view
changwhs
說
13 years ago
string manipulation in shell script
www.linuxtopia.org/onlin...
問題:
1. 效率不明,雖然搭配 grep、sed、wget、awk 後開發速度爆快。
2. 中文處理不確定是否有完美解法。
latest #9
changwhs
說
13 years ago
為了中文,保險起見我還是選 java,將來順便可以迅速轉型成網頁應用程式或 web service......
Nightmare
說
13 years ago
感覺不會比較快說@@
changwhs
說
13 years ago
nsysumis94
: 是指 shell script 執行速度嗎?
立即下載
changwhs
說
13 years ago
要把非常多網頁表格轉存csv,本來要一行一行讀,讀到要的 column name 就把下一行相對應的 value 存下來,想不到 grep -F -A1 -f all_column_names.txt 再用 sed 把 html tag 拿掉、行尾符號換成逗點就完成了 XD
changwhs
說
13 years ago
只是這樣複雜度從 O(n) 增加成 O(column_number * n) ,但 grep 的 multiple pattern search optimization 可能可以補一點速度回來
Nightmare
說
13 years ago
不愧是大師
changwhs
說
13 years ago
grep "#e1e9d3" $src_file -A 500 | grep "history.go(-1)" -B 500 > $tmp_file
changwhs
說
13 years ago
grep -F -A1 -f target_tags.txt $tmp_file | sed '/bgColor=#CCCC99/d;/--/d;s_</\?td>
g;s_[[:blank:]]
g;s/$/\t/g' | tr -d "\r\n" >> $dst_file
changwhs
說
13 years ago
原本用 C# ,寫一寫還在 debug 不知道錯在哪,某天的一個意外就像上面這樣完成了
back to top
Delete
Reply
Edit
Cancel
Cancel