[精讚] [會員登入]
4900

PERL一次讀取檔案所有內容的方法($/)

perl可以使用slurp mode一次讀完檔案所有內容的方法及一些範例

分享此文連結 //n.sfs.tw/13041

分享連結 PERL一次讀取檔案所有內容的方法($/)@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-25 04:24:19 最後編修
2019-01-17 12:03:32 By 張○○
 

自動目錄

如果要讀取檔案內容,一般而言是一行一行的讀取

open(FILE, 'file.txt') or die "$!";
while( defined( $line = <FILE> )){
  print $line;
}
close(FILE);

 

但是如果想要一行就讀完,perl提供一個快速的方法,也稱為貪吃模式(slurp mode)

他的原理就是把分行的符號改掉,原本是'\n' 改成未定義 undef

open(FILE, 'file.txt') or die "$!";
$/=undef;
$alllines = <FILE>;
print $allline;
close(FILE);
$/='\n';

第2行 $/ 就是分行的符號

第3行 所有的內容就會放到變數$alllines中,包括換行

第6行 把分行符號設回來

 

範例

這樣子可以直接進行操作,例如:

1. 加一行資料在檔案前面[2]

open(FILE, 'file.txt') or die "$!";
$/=undef;
$alllines = <FILE>; # 一次讀取全部
close(FILE);
$/='\n';
open(FILE, '> file.txt') or die "$!";
print FILE "這是加在最前面的一行";
print FILE $allline; 
close(FILE);

 

2.比對因為換行被切斷的文字

有些文字因為被切斷,在比對時會不成功,利用一次取回來比對,才能正確的比對,例如下面的文字
file.txt

There are several suggestions as to the origin of the phrase. The <這裡有個換行>
one most often repeated, especially within the walls of the Melton.

如果一行一行讀入,比對字串 "The one"是不會成功的,因此可用一次讀回的方法來比對,例如$alllines 是全部取回的字串。

print "The one有存在" if $alllines=~ /The one/; #比對不會成功
print "The one有存在" if $alllines=~ /The\s+one/; #比對成功
print "The one有存在" if $alllines=~ /The \none/; #比對成功

這裡的\s代表空白、換行、tab、\r等字元,可參考 [PERL] Regex 字元集(群組)所以比對可以成功,也可以把換行當成字元來處理,有興趣可以參考[PERL] 15-進階比對 #2--使用更多修飾子

3. 一次讀入時要判斷到底讀入幾行

一次讀入又想知道到底總行數是多少,可以查找換行的數量。簡單的方法是把換行取代為換行再+1,因為最後一行是沒有換行符號。

$n= $alllines=~ s/\n/\n/g +1;

 

4. 從第n行切斷字串

一次讀入的字串如果我想保留n行,把n+1行以後的資料截掉,怎麼做?

$n=1;
$kn=10; #要保留的行數
while($alllines=~ /\n/g){
  $keeplines= $` if $n==$kn;
  $n++;
}
print "你要保留前$n行的內容為:".$keeplines;

使用變數 $`就能輕易的得到比對目標之前的字串,此字串不含比對成功那個換行。

 

結論

1. 一次讀取全部字串使用特殊變數 $/=undef

2. 一次讀取全部字串才能做跨行的比對,比傳統檔案全部讀完再相粘的方法好。

3. 注意大檔案記憶體吃得凶,例如log。

4. 特殊變數$`可以取回比對目標之前的字串。

 

參考資料

[1] https://perlmaven.com/slurp

[2] https://perlmaven.com/how-to-write-to-the-beginning-of-a-file

END

你可能感興趣的文章

[PERL] 14-進階比對 #1--取回比對內容 perl的正規表達式進階比對

[PERL] 09-迴圈 perl的迴圈

Apache Worker MPM =worker 調整參數 Apache目前一共有三種穩定的MPM(Multi-Processing Module,多進程處理模式 簡稱: MPM)

[PERL] 使用CPAN安裝模組 在Linux 上,CPAN 可以用來安裝或管理 perl 的模組,此文教你怎麼做。

[PERL] Regex 字元集(群組) 幾個Perl在regular express會用到的特殊符號notation:字元集

[PERL] 位元運算 Bitwise operation PERL的位元運算整理

我有話要說

>>

限制:留言最高字數1000字。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

為什麼要買長達二十年的保單? 為什麼要買長達二十年的保單?找一個可以說服我買二十年保單的理由。

Linux shell 的date表示法 linux下SHELL中的date表示法

[CodeIgniter 3] 資料庫的使用方法整理1/2 --Select的使用 [CodeIgniter 3] 資料庫的使用方法整理:Select的使用

海棉寶寶超泡杯演奏的sweet victory 章魚哥和海棉寶寶在超泡杯的演奏歌曲

[Wildfly10] 發佈war檔 deploy war file onto wildfly10