[精讚] [會員登入]
4376

[PERL]] find 和 perl 的結合--大量檔案中文字的取代

利用PERL作大量的文件取代

分享此文連結 //n.sfs.tw/10677

分享連結 [PERL]] find 和 perl 的結合--大量檔案中文字的取代@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2023-03-24 11:28:07 最後編修
2017-01-24 13:53:24 By 張○○
 

自動目錄

如果要把所有的文件檔作取代,例如將字串"charset=big5" 改為 "charset=utf-8",文件檔如果不多直接編輯就好,但如果文件檔一多,甚至還放在子目錄裡,就很費工。

還好可以利用PERL的簡單的指令完成:

原字串:
charset=big5

取代後字串:
charset=utf-8

取代目前目錄包括子目錄的所有PHP檔

指令

$ find ./ -type f -name '*.php' -exec perl -i -pe s/charset=big5/charset=utf-8/gi {} \;

說明[2][3]

find
./ 開始目錄含子目錄尋找
-type f 指定檔案,不含目錄及連結
-name '*.php' 所有 *.php檔
-exec 找到目標後執行後面的指令
  perl -i -pe s/charset=big5/charset=utf-8/gi
    -i 直接修改原檔案不建立備份
    -p 重複執行直到檔案結束
    -e 執行後面的命令
        s/charset=big5/charset=utf-8/gi
         s 取代
         /原字串/換成字串/
         g 持續取代到行尾
         i 不分大小寫
{} find尋找到的檔案
\; find 指令結束

注意

1. 此項操作不能復原,所以千萬不能打錯字。
2. 此項操作不會有任何回應,除非指令打錯。
3. 這種方法可以擴大使用到所有的取代,換句話說,只要是取代檔案中的文字,就不用一個一個文件開啟

以上的方法對於簡單的比對字串是ok,但是對於複雜的字串取代,這個指令基本上就會出錯,例如要把網址 http://n.sfs.tw/10677 取代為空,這樣寫就出錯

$ find ./ -type f -name '*.php' -exec perl -i -pe s/http:\/\/n\.sfs\.tw\///gi {} \;

主要因為 console 的 shell 是不認識脫逸字元'\'

對於複雜的取代,最好的方法就是寫一個PERL的程式

所以我撰寫一個簡單的取代程式:replace.pl

#!/usr/bin/perl -w

if(  !$ARGV[0] )  {die  "請指定檔案\r\n";}
$fn= $ARGV[0];

open(FILE, $fn) or die "$!";
$cnt=0;
$data="";
while(<FILE>){
  $cnt += ($_ =~ s!http://n\.sfs\.tw/!!ig);
  $data .= $_;
}

print "[$fn]總共置換:". $cnt."筆\n";
close( FILE);
open( FILE, "> $fn") or die "$!";
print FILE $data;
close( FILE);

第3行,這個程式要接受一個傳入的參數,也就是要作取代字串的檔案。

再結合find 指令就能完全的取代:

$ find ./ -type f -name '*.php' -exec ./replace.pl {} \;

強到爆

後記

某外國網友sally看到這篇向我推薦他同事做的 cheatsheet (小抄),有興趣的可以參考一下[4]:

 https://www.pcwdld.com/perl-cheat-sheet 

參考資料

[1] EcStart PHP 技術討論論壇  http://bbs.ecstart.com/thread-8502-1-1.html

[2] http://stackoverflow.com/questions/6302025/perl-flags-pe-pi-p-w-d-i-t

[3] http://www.perl.com/pub/2004/08/09/commandline.html

[4] https://www.pcwdld.com/perl-cheat-sheet#wbounce-modal

END

你可能感興趣的文章

[PERL] 07-陣列 #1 -- 基本 perl的陣列

Perl 的列舉寫法(map list) 使用列舉的寫法來設定陣列,非常的強大

[PERL] 23-多執行緒 而多執行緒的程式,可在一次執行程式時間,同時進行多線程的計算,在效率上可獲得即大的提升。

[PERL] 中文字字串拆解,把中文字串逐字拆開 中文字字串拆解是門學問

[PERL] 10- 雜湊 Perl 的hash 指標陣列

[PERL] 02-註解、變數和常數 perl的註解、變數和常數

隨機好文

為什麼要買長達二十年的保單? 為什麼要買長達二十年的保單?找一個可以說服我買二十年保單的理由。

[Freebsd] 定時測試 ADSL 是否斷線並重連 中華電信 ADSL 雖有固定 ip,可是他卻會不定時「斷線」, 使用以下的 方法可以定時測試是否斷線,以及重新撥接。

[CodeIgniter3] 解決無法上傳特定檔案(.sb2)的問題 上傳時出現The filetype you are attempting to upload is not allowed,要怎麼解決?

[AS3] 我做的唯一一個Flash As3遊戲UFO INVADSION [AS3] 我做的唯一一個Flash As3遊戲,是第一個也是最後一個,後來就沒再寫as3,不過as3還滿好玩的。

APACHE的記錄檔格式 LogFormat 語法 在APACHE中有定義一些記錄的語法模版 在 /etc/httpd/conf/httpd.conf 中: LogForm