[精讚] [會員登入]
1781

[PERL]] find 和 perl 的結合--大量檔案中文字的取代

利用PERL作大量的文件取代

此文完整連結 http://n.sfs.tw/10677

複製連結 [PERL]] find 和 perl 的結合--大量檔案中文字的取代@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2020-01-21 10:51:01 最後編修
2017-01-24 13:53:24 By 張○○
 

自動目錄

如果要把所有的文件檔作取代,例如將字串"charset=big5" 改為 "charset=utf-8",文件檔如果不多直接編輯就好,但如果文件檔一多,甚至還放在子目錄裡,就很費工。

還好可以利用PERL的簡單的指令完成:

原字串:
charset=big5

取代後字串:
charset=utf-8

取代目前目錄包括子目錄的所有PHP檔

指令

$ find ./ -type f -name '*.php' -exec perl -i -pe s/charset=big5/charset=utf-8/gi {} \;

說明[2][3]

find
./ 開始目錄含子目錄尋找
-type f 指定檔案,不含目錄及連結
-name '*.php' 所有 *.php檔
-exec 找到目標後執行後面的指令
  perl -i -pe s/charset=big5/charset=utf-8/gi
    -i 直接修改原檔案不建立備份
    -p 重複執行直到檔案結束
    -e 執行後面的命令
        s/charset=big5/charset=utf-8/gi
         s 取代
         /原字串/換成字串/
         g 持續取代到行尾
         i 不分大小寫
{} find尋找到的檔案
\; find 指令結束

注意

1. 此項操作不能復原,所以千萬不能打錯字。
2. 此項操作不會有任何回應,除非指令打錯。
3. 這種方法可以擴大使用到所有的取代,換句話說,只要是取代檔案中的文字,就不用一個一個文件開啟

以上的方法對於簡單的比對字串是ok,但是對於複雜的字串取代,這個指令基本上就會出錯,例如要把網址 http://n.sfs.tw/10677 取代為空,這樣寫就出錯

$ find ./ -type f -name '*.php' -exec perl -i -pe s/http:\/\/n\.sfs\.tw\///gi {} \;

主要因為 console 的 shell 是不認識脫逸字元'\'

對於複雜的取代,最好的方法就是寫一個PERL的程式

所以我撰寫一個簡單的取代程式:replace.pl

#!/usr/bin/perl -w

if(  !$ARGV[0] )  {die  "請指定檔案\r\n";}
$fn= $ARGV[0];

open(FILE, $fn) or die "$!";
$cnt=0;
$data="";
while(<FILE>){
  $cnt += ($_ =~ s!http://n\.sfs\.tw/!!ig);
  $data .= $_;
}

print "[$fn]總共置換:". $cnt."筆\n";
close( FILE);
open( FILE, "> $fn") or die "$!";
print FILE $data;
close( FILE);

第3行,這個程式要接受一個傳入的參數,也就是要作取代字串的檔案。

再結合find 指令就能完全的取代:

$ find ./ -type f -name '*.php' -exec ./replace.pl {} \;

強到爆

參考資料

[1] EcStart PHP 技術討論論壇  http://bbs.ecstart.com/thread-8502-1-1.html

[2] http://stackoverflow.com/questions/6302025/perl-flags-pe-pi-p-w-d-i-t

[3] http://www.perl.com/pub/2004/08/09/commandline.html

你可能感興趣的文章

[PERL] 中文字字串拆解 中文字字串拆解是門學問

Freebsd11上安裝PERL模組 freebsd11+ perl module 在freebsd上安裝module還算簡單

[PERL] 命令列傳入參數 argv Perl 的外部傳參,是$ARGV[0]、$ARGV[1]、$ARGV[2].....

[PERL] 06-運算子 #2 PERL的運算子介紹,總共有21種

[PERL] 檢查IP是否在某個網段內:matchcidr 檢查IP是否在某個網段內 matchcidr in perl

[PERL] 02-註解、變數和常數 perl的註解、變數和常數

自行撰寫syslog server建立資訊安全控管中心#1 -- 前言及syslog介紹 利用PERL將syslog收攏到資料庫的程式

[PERL] 09-迴圈 perl的迴圈

自行撰寫syslog server建立資訊安全控管中心#4 -- 過濾條件設定 利用PERL將syslog收攏到資料庫的程式,過濾條件設定

自行撰寫syslog server建立資訊安全控管中心#2 -- 架構和作法 利用PERL將syslog收攏到資料庫的程式,架構和作法

我有話要說


限制:留言最高字數1000字,超過部分會被截掉。請注意:留言不可帶有網址,會被濾掉。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

HP SAS硬碟leds燈號說明 HP SAS硬碟leds燈號(hp g7/g6系統適用)說明

[jQuery] textarea 的取值和給值 HTML 的 TEXTAREA 標籤若要用 jquery 取值,不能使用 .text() 或 .html() ,使用 .

[jQuery] select 元件的取值及給值 html中的元件select,在jquery中要如何使用?

UTF-8 BOM (Byte Order Mark) 的問題 在 Michael Kaplan 那看到 Every character has a story #4: U+feff

PHP for sphinx 函式庫安裝 PECL/sphinx PHP>= 5.2.2 已經能原生支援 sphinx,可是預設的沒有裝,我們得自己裝才能用