3317
[兒時記趣] 老家有一條排水溝,很小的時候和姐姐過去另一岸探險,穿過荔枝樹下,沒幾米的路對我而言就很了不起了。
姐拿著一根木棍什麼的,我到河邊一個沒站好,就跌了一隻腳下去。
後來爬起來數落姐姐為什麼不把棍子給我,我才能撐著,她連聲道歉。
--
如果有名車有大房就算成功,我想很多人都達到這個標準,滿足了嗎?值得玩味。
--
翻譯機或翻譯器雖然很神奇,跨躍人肉翻譯機的利器,但有一個大問題,就是你不知道他翻出來對不對,如果你對目標語言一無所知的話。
有一點像是:「你正在說話,但是你不知道你說的是什麼。」然後聽話的人有所反應,但不確定他們的反應是不是正確的回應。舉一個簡單的例子:
外國人問你:「Do you have time?」
翻譯軟件:「你有時間嗎?」
你小鹿亂撞,害羞的說:「也許有,我要查看一下我的行程」
你原本的意思是,我不能馬上答應,所以說要看一下自己的行程表,這在中文是最簡不過的說法。
翻譯軟件:「Maybe yes, but I want to check my itinerary.」(可能有,但我要檢查我的旅程)
外國人一臉懵逼???
然後你沒根本不知道意思有沒有傳到,反而說:「when?」(這個不必翻譯軟件)
外國人完全黑人問號??(我問你你又問我是怎樣?)
為什麼?因為他只是問你時間而已。你自己在演什麼小劇場。
PS:如果人家要問你有沒有空,會說:「Are you free tonigt/now/tomorrow?」等等。
3295
我手上這盒白金牌鋼筆卡式墨水,不知道有多久了,印象中我高中時代(還是大學)就有了,怎麼來的忘記了,那時我應該沒有鋼筆才對?
現在還是能用耶!
3284
由圖形來判斷文字的第一個難題是,我們看到文字是「一下子全部都看到了」,但是電腦不是,他是由左上角的第一個點一行一行掃到最後,有點像古代的點陣式印表機
九針九針的打,發出吃力的撞擊聲,一行一行的來回工作才把內容給印出來
當還沒有印出來時,人腦看到印出的黑點,也不能夠知道最後的結果是什麼。
當一個字畫完被電腦看到後,對電腦來說就是一個個黑點和無點(白點),你得把這些點給連結起來。形成「線」才是對人腦有意義的文字。
這個步驟就超級難了,到這裡為止,都還沒談到辨識,因為連圖案都沒確定。
這就像,滿天的星星,對於不懂的人來說,只是一堆亮點,什麼星座什麼的?なにが?なんでもない!
當文字的靠另一個文字很近時,文字的邊界就變得很模糊,就像你看這篇文章一樣,人腦能快速的區分哪個區塊是哪個字的,就算文字黏在一起也可以。
但電腦就會錯亂,電腦沒辦法正確的區分邊界時,就會分析錯誤。
3273
年紀大不能再用年輕人的方法運動,很容易就受傷了。
身體的器官講求平衡,肌肉可能衰弱比較慢,但是軟骨和關節也許老化比較快。或是體重有增加,同樣的動作也許韌帶就傷了。
我的腰痛第三週了,還是沒好,「嘿咻」常常掛在嘴邊。也許籃球打到50歲就差不多了,我球友一堆也是傷來傷去。
--
第三代搜尋引擎,第一關:正規化。
3262
能辨識一個字靠的是學習,學習是個漫長的過程,包括他的形、音、和義。
這個過程我們經歷過,只是忘了他其中的辛苦,痛苦的事情過了忘記特別快 (你老是記不住--學習曲線告訴你其實記住是很難的@新精讚 )。
事後以為我們學習得很容易,其實不然,不知抄過多少作業,寫過多少圈詞,唸過多少課文,生活中使用,才讓我們快速建立這些字的神經連結。
電腦什麼都沒有。對於一個字,我認為是由這個字的特徵來知道他是什麼字。對於陌生的字,我們會露出困惑的表情,因為他的特徵會混亂我們的腦,
舉個例子,下面這兩個字:
完全無法辯識,也無法讀,他的特徵就像是馬的頭,象的身體,豬的腳拼湊出的怪物,看到就語塞。
特徵我把他分為可識特徵和不可識特徵,兩者的差別在於可識的能夠讓我們大腦重建全貌。舉個例子『說」,如果我把他拆分四塊:
每次都遮掉其中的1/4,除了2以外,其他三個都能看得出來是什麼。
以目前的技術來說,上面四個都難以辨識
如果遮到1/2,除了7和8可以判斷外,5和6已無法判斷。
可見7和8保留了字的某些可識特徵,但是5和6的特徵不足以判斷。
--
有來自奇怪國家的爬蟲,這個爬蟲引起我的注意,因為量體很大:
3251
最重要我最關心的人,只要你健康安好(很重要),什麼決定我都支持你!
--
google的刷新速度很快,我壯士斷腕不要歹戲拖棚的做法,讓GOOGLE直接拿掉HTTPS,現在流量慢慢的回來了。
不得不說GOOGLE的系統還真的很智能,不過那些是多少智慧人士的結晶,我憑一己之力想都不要想。
--
我捐給phpmyadmin 10美金,因為這個軟體對我的幫助很大(很大才給10美金,果然免費的東西…
--
今天建立了罕用字讀音1600個,進展很快。還剩5000個。不少同事曾問我說我的某些資料是從哪裡來的?
我說:「我自己刻的。」
他們都露出不可致信的表情?!
的確是這樣,真正的資料是你要不到的,你得自己刻出來。
換個角度,你辛苦收集出來的資料,你會輕易的給人嗎?那可是花錢和時間LOG下來的。
我一筆資料花一分鐘,1000筆就花了1000分鐘,那可是十幾個專注的小時。
10000筆就是10000分鐘,那就是好幾天好幾個月。
時間可能長達好幾個月。
我兒曾經問我說:「你真的要這樣一筆一筆建啊?」我回他:「難道你有更好的辦法?」
絕對沒有免費而且有效率的方法,因為珍貴的資料只能自己建立。
我還是要回到資訊科學最原始的標準,簡單來說:只要資訊是有限量,無論量體有多大,還是有收錄完的一天,就算要花一輩子,至少,不是無限量。
無限量,
只存在於數學,不存在於自然界,這事已經有人證實過(請搜尋:宇宙很大、資料的無限量)。
舉個例子,
銀行搜車系統,你的車,是權利車,
大家都想拖回來,不能讓你不還錢也不還車啪啪走,
所以要尋車,你的車只要不是停車庫,其實你以為你逃得掉,其實人家系統都有,只要用心找,
你根本逃不掉。至於那些資料怎麼來的,就是一群人一筆10元還是幾元慢慢建上去,怎麼可能不花成本?
然後有人還真的很天真的以為:「車這麼多,你找不到我的。」
誰說的?
債權人趁你買個東西的時候,車子就給你開走了的新聞難道只是幾百萬分之一偶然嗎?你真的太天真了。
我做系統的人一想到就發抖,你竟然可以天真到這種程度。
在我的眼裡,要不要處理只是我的一個決定,並不是我不知道啊~~
--
我不斷的思考人腦文字辨識的運作流程,實在想不通人腦是怎麼辨識文字的,實在太了不起了。
目前所有的辨識軟體,無論多強,辨識文字的成功率離人腦還很遠。
只有速度上比人腦快,但這是針對有格式的化的文字而言(例如一本書OCR)
如果非格式化的文字,電腦遠遠落後人腦不知幾條街。
無論速度或是正確率。
真是不可思議,我一直想不通。
不管什麼演算法,都輸給人腦。
舉個簡單的例子,側放的文字、藝術造型文字、部分被遮掩的文字、甚至是錯字。
人腦「都」能,大部分能,正確的快速轉譯辨視,至於電腦,完全不行。
因此,
我不斷的思考,
我覺得這是探索智慧的一個入口。
今天同事說,你做的「那個功能」,別人除非很懂,不然不會知道其中的用心。
怎麼說呢?我這近一直用phpmyadmin,我發現第四版的phpmyadmin簡直是逆天般的存在,
程式的細膩和貼心,讓我立馬轉了「10美元」給phpmyadmin這個組織。
我用phpmyadmin大概有十年,第一次覺得不轉錢不行。
也許我還會再轉錢給他們。
現階段我認為phpmyadmin實在是太用心在寫一個介面,10鎂不是大錢,我還付得起,感謝他們。
當然,我要說,phpmyadmin不是我第一個「捐錢」的軟體,我說捐錢有點不太禮貌,應該說「贊助」。
這個軟體很用心,用心到我仍不斷的感到驚豔!
好,這不是重點,回到原本我要說的,我想做的,除非很懂,或是剛好有需要或困擾的人,不會發現其中的精緻之處。
但是對我做系統的人來說,我不可能放著已知的錯誤不解決。
其實做系統和所有事情都一樣,要達到50%的準確度如果所費的功是一個 W,做到90%的話絕對不會只有增加80%(1.8W)而已,
而會是成倍的存在,也許是 3W。
91%和90%的差距也不會只有1%,可能是2倍的努力。
這就像考試,要考90雖然難,但是要考到92 ,甚至95、100,那中間的努力不會只有增加幾%而已。
而可能是成倍的付出。
結論是,我一直在思考人腦分辨文字的方式,這點非常的神奇,神奇到我已經無法思考了。
為什麼反著看的文字還是可以「毫無阻礙」的閱讀?????什麼角度都沒問題。
以現階段所有的OCR來說,都做不到這一點。
人腦辨識的可怕,肅然起敬。
說個簡單的例子,就算一個多重智障的人,他的腦運作能力,還是現在超級電腦做不到的,例如平衡、走路、人臉、空間和物品的判斷。
--
去年九月開始學習日文是我最有意義的決定,影響我們最深的語言,除了中文,就是英文和日文,怎麼可以放任?多可惜!
好處是原來不了解的都慢慢懂了(高興) 。
這就要說我用的無蝦米輸入法,原本我還想去教學推廣給別人,現在我熱忱全收起來,因為你們不值得,對於一個不想突破的人,你教這些是多餘。
怎麼突然想到這個?因為我在決定要學日文前,一直在掙扎說:日文中的漢字、片假名拚勉強我看得懂,又有翻譯軟件,為什麼要多學一個把自己搞這麼累?
「這就像我想到的,既然注音用爽爽,給自己找麻煩是哪招?」
因為你不懂,多說也無益。
古諺云:「道不同不相為謀」
只有你真心想知到想得到,給你的你才會欣然接受。
我想,「其斯之罕矣!熱忱收起來才是對的。」
--
現代資訊泛濫,你要人家仔細看你的說明,除非很有必要或喜愛,不然人家取他要的就閃了,誰管你寫什麼。
就連影片也是這樣,就別說以文字為主的文章了。
--
我這近一直在做苦工,但是成果慢慢的累積。這些都是看不見的背後工。的確,相對於前端使用者看到的部分,看不到的才是真正的精華。
曾經有人問我說你做這個前端很炫,花了不少時間吧,我就和他說,前端沒花什麼時間,後端花的時間才是前端的十倍以上。
我覺得回答的不好,我應該「的確,花不少時間!」
--
人腦對於文字的判斷好像是藉由外形吧,既然這樣,這些字應該都是同一個,就算寫法有稍微的不一樣。
但是不好意思,這四個字在unicode中分別存在,殘字就算了,其它三個應該統一一下吧,相關的例子真的不勝枚舉。
--
台灣漫畫家彭傑說的:
想當漫畫家,畫漫畫不能只是興趣;
當熱血用完了,剩下的東西才是真的。
第二句是精華。
3225
google 昨天開始把我的網站 https優先放到前面(原本是http)
害很多人連不到,因為我沒有買合法憑證,用免費的會跳警告,我後來就完全拿掉HTTPS。
因為我想把HTTPS做轉址成HTTP,但是會出現警告拿不掉。
後來想了一下理解了,原來(HTTP轉成HTTPS)和(HTTPS轉成HTTP)不一樣,前者只要一個導轉就解決了,但是後者你還是要有一個合法的憑證,才能進到導轉的程序。你沒有辦法先HTTPS認證前進行導轉。
問題來了,我要不要為此買個SSL憑證,我想一想還是算了,真的不需要。
因此我壯土斷腕,完全拿掉HTTPS。就算是連線掉一半也無所謂,那不是重點。
3214
家附近的某家店倒了,原本風風光光開幕並半價促銷,去試了一次,發現這個價格只是「剛好」,換句話說,調回原價的話,穩死。
後來這店還是苦撐了半年,還是倒了。
--
孔子對子路非常的不屑,只要子路說什麼他都呵呵或是噹回去,子路這人也怪怪的,孔子和你都這麼不投緣了,你還對他老人家這麼好,真是有情有義。
放到現代打燈籠都難找。
有一次孔子要他們幾個說說如果有人要用他們,他們會怎樣。子路率先說:「較大的國家又有外患和饑荒,我來幹,三年人人有勇氣、個個講道義。」
孔子呵呵!說他自大不謙虛(為國以禮,其言不讓,是故哂之)。
3181
如果放上請人家請我喝咖啡的連結,會不會有人請我喝?我很好奇,我認為不認識的應該不會請,認識的可能會有。
我辛苦寫出來的服務無人使用,不免生氣!
俗話說:「會做是師仔,會賣才是師傅」,東西好只是基本,要能賣得掉才是真的,工程師常常不懂這一塊,以為自己的東西有多好多棒,賣不掉都是屁。
人家根本動機不到掏錢想買,多好都是「屁」。
當老師常常會自我感覺良好,認為教的都是真理和生命,誰知道這些都換不到一杯咖啡,別笑死人了。
我又要來黑孔子了,他喔,就是有崇高的理想,但是就是找不到工作,當然最後在魯國有擔任過大司寇(現今司法院長)也不能說官小 。
但其實他不得志,他才說顏回「用之則行,舍之則藏,唯我與爾有是夫!」,其實他在說他自己啦,人家不要他的時候,說什麼我就自己隱起來。
要懂得行銷!行銷是們大學問,什麼都要行銷。
像那個「好難拖」,賣得嚇嚇叫,明明那麼貴,損壞率超高,就是賣有錢,氣不氣人。
3177
我系統中有人操作了1000多次,我以為我的系統被破解了,分析後發現是人在操作,足足用了五個小時,不止,至少10個小時。
這表示說,只要有免費的方案,不管多麻煩,還是有人會去操作。
那為什麼還要提供無限的免費方案,這就像遊戲一定要提供免費的玩家生存的空間一樣,如果都把免費的封死了,那遊戲就死了。
我很好奇對方的行為,於是做了分析,發現平均單次操作約11.2秒,一分鐘約5次。
我在這邊正在看著這個情況的發生,在遠方操作的人可能不知道我正在看著他的行為,無知無警覺真的很恐怖:
我常聽學校老師木馬後說:「和木馬和平共存,反正也刪不掉。」
另一種是用大陸機的人會說:「訊息傳到大陸也沒差,反正也沒什麼好保密的。」
不要笑死人好嗎,網路上的東西,凡走過必留下痕跡。
--
我的系統目前只成交了兩筆交易,一筆是老哥,另一筆是老姐給的,我不太在乎有幾筆交易,因為這是我觀察網路的櫥窗。
我也發現有人試用,然後把次數用到上限,然後就不用了。這有一點像是去百貨公司拿免費贈品的人的行為,我太以前也常幹這種事。
百貨公司提供贈品的目的無非是增加來客數,反正贈品也是廠商提供,百貨公司不花什麼成本。
為了領免費的贈品,有人大老遠開車過來,不小心就吃了東西買了東西,對百貨公司而言能提高營業額。
對廠商而言似乎不太合算,其實不然,這些贈品很多也是廠商賣不掉或是不好賣的東西,與其丟掉不如「捐」出去,
這也是為什麼那些贈品往往是中看不中用的東西,優質的贈品真的少之又少,有也是限量打廣告,你晚點來就換不到。
如果遇到很精的「客人」,他們只換贈品,完全不消費,那百貨公司豈不吃虧了?
錯!你錯太多了!
很精的客人有一個共通的特性,就是占了便宜他們一定會把這事告訴別人,因為這能獲得兩倍的喜悅!
別人知道這件事就和廣告一樣,100個人也許有10個就跟隨,10個中有一個就消費了。
真實的數據多少也許只有分析過big data的商家才知道,這是商業機密,人家也不會告訴你。
再想一想,
如果我是超級精的客人,我只領贈品不分享也不消費,那就沒有廣告的效果,真的虧了,也許是,也許不是,畢竟這都要先算在可能的比率中。
回到本文,我對這個太感興趣,因為我覺得研究意識(意志)是一件很神奇的事。
我對於這種行為,不但不阻止,還會高興的把試用的時間延長一倍,讓你慢慢用,為什麼?有人問我說:「每個帳號給試用一次就好,如果他們開多重帳號來試用,你怎麼辦?」
我說:「就給他用啊,我不但不限制,還放寬,一定時間就可以再試用,無限制。」
同事說:「這樣賺不到錢。」
我說:「這種人的錢你本來就賺不到,你要賺的是另一種人的。」
哪種?
很簡單,怕麻煩又懶的人。這種人的錢比較好賺,勤勞又努力又呆的人,不是好客戶。
--
74號西屯附近看到的,看一次笑一次
蝸輪傳動
超給力 ¯_༼ ಥ ‿ ಥ ༽_/¯
--
以前有什麼新發現會怕別人知道我哪得來的靈感,參考資料中會把主要那個不小心「故意遺漏」。
現在我反而相反,參考資料會把那個最重要的特別標注或放最上面,絕不會「不小心漏了」。
因為我知道,肯定別人才能成就自己。
--
今天問同學說:「你爸健康很差,怎麼了?」
「就中風過一次」他回答。
「魏應充也是,不是有錢就能不中風」他接著說。
這就是人生,我白目的和他說「中風一次會再中第二次。」
因為是三十年的同學了,尺度都ok,他說「就是這樣,沒辦法。」
3166
「黨」這個字解析是這樣的:當的上面 那個表示大空間。中間有一個口正在說話,黑是指有一群人,頭髮是黑的。
後來出現簡體的「党」,變成一個大空間中,裡面有兄弟。我認為應該寫成這樣:
共產黨和共产党。
疑,這不是簡體和正體的差別而已嗎?才不是呢,意思是,當窮的時候,大家都是兄弟;有錢以後,就要聽我的。
中國字是誰造的啊,怎麼這麼有趣。
--
聽笑話會笑是能接受到訊息傳達的第二個層次,甚至第三個層次,如果無法接收到第二或第三個層次的訊息,你就不會覺得好笑,還會覺得這訊息是無意義的,只是一個故事。
電腦目前還做不到這件事,因為電腦無法接受到第二或是第三層次的訊息。
例如小明說了一個笑話和小華聽:「小美走在路上,突然聽到有人罵他一聲豬;小美很生氣轉頭說:我又不認識你,幹嘛罵人?!結果就撞上一隻豬。」
這裡面小華聽了覺得笑話很好笑,就和小芳說,結果小芳不但沒笑,還瞪小華一眼:「你是不是覺得我胖得像豬!?」
你看這裡面有多少的轉折?甚至不存在的訊息都被產生出來。
--
意外的發現 utf8字竟然有星座,而且是彩色的,這些字不是我去著色的,而是他在瀏覽器中本身就是彩色的
https://www.key-shortcut.com/en/character-tables/unicode-2000-2fff/
226,153,136=> ♈ 226,153,137=> ♉ 226,153,138=> ♊ 226,153,139=> ♋ 226,153,140=> ♌ 226,153,141=> ♍ 226,153,142=> ♎ 226,153,143=> ♏ 226,153,144=> ♐ 226,153,145=> ♑ 226,153,146=> ♒ 226,153,147=> ♓
3133
蚊子如果現行犯被抓到,我會把他身體裡的血擠出來抹成一條。
如果是預謀犯(所有的蚊子沒吸血的都是),我只會把他電一下,有些沒死的會在原地打轉,因為翅膀也要角動量守恆的關係,只有一邊揮動時,必然打轉。
像我家現在一般的情況大概會有20-30隻蚊子,極大期會有50-60隻蚊子。這數據怎麼來?因為我曾經一天電死55隻蚊子的記錄,還把每隻蚊子黏在筆記本上。
很好奇蚊子是怎麼進來的?這房子的爛窗和門,唉~~
396
酸液亂吐的人似乎以為別人都聽不懂?
這是我覺得非常好奇的地方。
為什麼同樣一句話,帶了酸和中性,竟然可以分辨,心腦或電腦要怎麼去思維這件事?
這個我認為是訊息傳達的第二種層次。
訊息傳達會有幾個層次,第一層次是指令的傳達。
第二層是意義的傳達。
還有更高層的話,就是內心真實意義的傳達。
說得很抽象,舉個例子:
A對B說:「這事情還好有你,只有你能做得到。」
第一層是指令傳達「事情因為你完成了。」
第二層是意念的傳達:「非常感謝你這次的努力,事情做得很好。」
第三層是內心真正的意思:「你不應該做這麼好的,這樣我就失去表現機會。」
who knows?
對一般人而言,似乎都不困難,歷史上酸液吐在紙上的案子也不罕見,我就隨便說說。
有傳說司馬遷寫項羽本紀就是為了罵漢武帝窮兵獨武,寫項羽時講話就帶著酸:只會打仗最後輸死你活該,但至於是不是罵?也無從得知。
孔子也是這樣的人,述而篇說:
子謂顏淵曰:「用之則行,舍之則藏,唯我與爾有是夫!」子路曰:「子行三軍,則誰與?」子曰:「暴虎馮河,死而無悔者,吾不與也。必也臨事而懼,好謀而成者也。」
這句話國高中學到時,以為是要我們好好的僅慎思考,就像顏淵一樣,不要學子路一樣,當然考試也偏向是這樣的答案。
但後來這幾年我就覺得很奇怪,為什麼會有這樣的場景?這個句子怎麼會放在一起,我開始鍵盤柯南:
孔子看到顏淵,因為孔子很欣賞他,就誇了他一下。這時子路在旁邊很不爽,就問:你要打仗要找誰?孔子就回答說,有勇無謀的人我不敢跟。
看來一切很合理....才怪。
孔子講話酸死了,這個酸液是自身心態的表現。
孔子最看不起子路,覺得他做事衝動,是個莾夫,而他最欣賞顏回,因為顏回和他最像,最能接他的衣缽。
顏回也喜歡孔子,就像他曾喟然歎曰:「仰之彌高,鑽之彌堅,瞻之在前,忽焉在後! 」
孔子三不五十就誇一下顏回,顏回也三不五十誇一下孔子。
好好笑的鄉土肥皂劇情。我們幹嘛學人家演員背劇本,我指的是背論語?
事情就是和孔子想的不一樣,他的得意門生顏回40歲就死了,連什麼著作都沒留下,除了論語中那些說他多棒多棒的話外。
根本就是流浪漢。
反而子路這種兄弟風格的個性孔子看不起,他曾說:「若由也,不得其死然。」(不得好死)
結果子路,算是孔子門生裡面混得最好的,雖然62歲算非善終,但在春秋那個年代也算長壽,有趣的是孔子這時還活著。
有道是歷史是文人寫的,天下是武人打的。被陰的人很多,被歌的人也很多。
現在反思歷史,發現很多人的功和過都不太合理,有空我再寫。
2192
電鍋壞了,不讓煮。
--
啤酒真好喝,不過喝太多了,好像變胖了,只胖肚子。
--
現在要說小陳的故事,小陳剛進某家公司,年輕有報負也有能力,也決心效忠公司。
小陳擔任的工作主要是專案管理和小額的採購。
另一個前輩老林和他說:「年輕人,別太衝,別強出頭。」
小陳沒聽在耳裡,想說這老頭就是這樣,難怪中年了還一事無成,心中不以為然。
小陳果然在各方面表現積極很快就得到主管的注意,前輩一直提醒小陳別峰芒太露,無奈小陳急於表現,沒太搭理。
最後結果是不到三年小陳就離職了...一件事最後逼得他不得不離職。
事情是這樣的,小陳的努力後來得到主管的信任,決定讓他執行一個專案,這對一個剛進半年的新人來說,非常的不容易,
小陳也拚盡了全力辦好每件事,認為這是表現的好機會,態度積極,早進晚退。
這個專案得執行一個採購,由於金額不小,有很多廠商來說明簡報,
其中一家廠商A,各方面都符合需求,但是在議價時,小陳有一個正常不過的想法:他希望能替公司省下每一分錢。
於是在議價時,就像上市場殺價一樣,不斷的砍廠商的價格,擴大採購的範圍。
雖然這正常不過,但對這家廠商A來說,多次折衝後被砍到幾乎沒有利潤,只好滿頭灰的退出。
小陳希望替公司結省經費,無可厚非,最後他最後選擇了一家尚可符合需求,價格也折讓很多的廠商B。
替公司省了不少經費,專案也繼續演了下去。
事情如果很順利,就不會有這個故事了。
原來廠商B在評估時因為經驗不足,很多執行的困難點都沒有評估到,真正在執行時,發現議定的金額不但賺不到錢,越做還越賠錢。
廠商B也不甘願就此賠罰金和成本,於是開始在契約中找漏洞,利用漏洞,把專案一直拖,原本應該結案的時間都被拖過了,一個爛攤子還收拾不了。
變成俗稱的爛尾樓,因為合約的關係進行不了也拆不了,甚至要告也告不了。
於是小陳離職了,離職的時間前輩小林說了一句經典的話,也許小陳永遠會記得,他說:
「替公司省下的一分錢不是你的,能替自己省下麻煩才是你的。」
故事還沒完,這個爛攤子搞到後來公司片面中止契約,還賠錢給廠商B,然後重新招標,最後廠商A重新接案,金額是原來的二倍,公司一毛都不砍,廠商A還意思性的讓一點作價給接手負責專案的人,因為負責的人是老林前輩。他說:「我神經病砍他報價幹嘛?只要能把事情做好,價格干我屁事。」現在他負責這個專案已完成,只要有問題,電話一打,人家馬上處理,根本不用操心,他只要負責每年簽維護就好。
人生有太多的事情要讓,你讓人人讓你,小陳沒明白這個道理。
三不五時開會時,主管還會說,這個維護費實在有夠貴的,能不能要廠商A便宜一點?
老林一付事不關己的回答:「運作順暢這維護費一點也不貴,話說出了事情老闆要追究,你扛?」
2166
睡了一整天,好好睡。
團隊合作本來就是一件很困難的事。
2144
我不想重灌硬碟,我複製硬碟成功了, 系統碟硬碟複製(磁區複製) ,這篇不是教操作,其實只是一個札記,花了五個小時。
2133
台中最髒的區是哪裡?
我台中也算到處跑過不少地方,每個區我都去過。要說哪個區是最髒最亂的地方,我認為最髒的區應該是太平區無誤。說個排名的話:
1. 太平區
2. 東區
3. 北屯區、潭子區
道路交通狀況最糟的區,我認為應該是:
1. 太平區(這個道路和違規...)
2. 西屯區(違規停車最嚴重)
3. 沙鹿區(第3名不好選,基本上還都算順暢,勉強認為在沙鹿行車比較不順暢)
2111
桌機一的硬碟WD 640G(WD6400AAKS),這是系統碟,這近常常會叫不起來,開機找不到他,這情況往往把電源或線插拔一下就叫得起來。
有可能是電源的問題,也有可能是硬碟快掛了,我稍微檢查也沒發現什麼異狀。
這顆算一算大概是98.6間買的,用一用也快10年,中間還換過1次主機板,更驚人的是我的系統還是10年前裝的 Windows7,美中不足的是32bit而已。
使用CrystalDiskinfo 查看,使用時數是48509(等於連續開機5.53年),次數是5043。
<<黑標真的很值得買,就算貴一倍也值得,時間會告訴你一切>>
很想再衝數據,但還是到了該要換系統硬碟的時候了,於是買了一顆1TB金標,金標很貴,所以買的容量比較小,而且還是庫存品。
但是我不想重灌系統,這就是我一直在掙扎的點。
░我░不░想░重░灌░系░統░
--
更新Alexa排名
241
過年就是一個制度化演完,照公式演。
這公式有很多條,基本上是差不多,例如:
除夕吃團"員"飯,過年到處拜年(或是待在家)
初二三回太娘家,"呆"在那,
然後回來等上班。
寫到這裡,不禁的想到人生也不過是照公式演,幾乎無法避免。
1281
休假回來再看自己寫的程式有沒有順利的運作,嘿,我的程式都乖乖的跑。
然後呢,我又看了自己寫好的程式,有些程式我忘記是幹嘛用的。寫程式的幾個重點:
1. 有能懂的註解,不要懶。以前初學者寫程式時,註解很多,後來註解越來越少,後來幾乎都不註解,註解是給自己用的,不要以為自己三個月三天後會記得。
2. 重覆執行或是隨便執行也不會發生意外的錯誤,例如刪除掉不該刪的或是重覆建立資料,意思是,程式要有防呆機制。
3. 寫程式要想好各種可能的錯誤,所有不可能的事都有可能發生,臭蟲無所不在。
4. 足夠的錯誤提示,自己的程式報錯要知道是哪裡送出的錯誤。提示太多有所謂安全性的理由請忽略。
5. 想好規畫好再行動,因為上線後的程式就像心臟一樣,很難叫他停機檢修。
6. 使用固定的風格寫程式,例如命名方式 (程式、函數、資料庫命名的風格) 這樣的好處是你才比較不會打錯,花很多時間處理這類的低級錯誤。
7. 存檔,隨時記得存檔,不小心刪掉檔案時,只有備份能救你。
8. 用什麼程式寫都不是重點,不要以為會某些語言很了不起,使用者才不理你,重點是你的程式能做什麼?
9. 很當兵一樣,不要和不懂的人談當兵,他們會打呵欠。
10. 拿到別人的程式碼,盡量的給予別人回饋或感謝,程設師習慣上網抄程式,抄完閃人不是好行為。
1207
又改寫已經寫好的程式,因為原本不想考慮分枝,換句話說,箱子裡面還有多個箱子,本來想全部算在一起。
但是後來想想如果不處理的話,未來要擴充會遇到瓶頸,畢竟如果資料都算在一起,未來要拆開來分析是不可能的。
只好重新改寫部分的模組。痛,但是痛一次,痛是因為要去理解自己寫的程式?咦?不是自己寫的嗎?
秒忘是真的。
--
想解決另一個問題,弄到快四點才完成,原因是伺服器有好幾台,每台都有自己的記錄檔,有一主和多從。
可以在從先把記錄檔分析完後收集起來,或是把記錄檔收集起來分析。
但要先分析就得每台主從都裝程式,安裝測試,還要傳遞資訊到主。
主從傳遞資訊也很麻煩,要透過資料庫等,又得穿過防火牆,然後還有同步的問題。
傳遞記錄檔也有個問題,就是傳遞完後,我得下指令把從的記錄檔刪掉,以免越來越大未來傳遞會很吃速度。
從也許能設定定時去清除,但是這樣子我就不知道到底會不會遺失資料,例如我還沒複製到主就已經被從刪掉了。
我想到的方法是由主把從的記錄檔拷過來,拷完後再刪掉從的。
然後我就想,要怎麼刪掉從的檔案,用最簡單的方法?因為我不想進去從下指令。
想很久,後來發現用複製一個空的檔案過去從蓋掉記錄檔,就等於是清空了,帥~~天才
為了這個目的,我全部改寫程式,不能只分析一個機器的檔案,要同時分析多台機器多個檔案,分門別類的整理好,有N台我都不怕。
然後程式還得要強壯(robust),如果資料檔有誤或是重複,都要能避開,換句話說,沒執行到或是重複執行都能自動補齊資料,也不會有重覆問題。
--
再來是研究資料儲存的問題。
原本我想用資料庫來處理,後來計算一下發現資料量實在太大,資料庫會爆。
5分鐘一筆,一天288筆,一次有1000個分項,一天就有288000分項,4台機器每天就會有約100萬筆。
一個月就有3000萬筆,所以怎麼存也要想清楚。就算5分鐘的量只存一天,也有100萬的量。
再加上對資料庫頻繁的操作,系統會很吃力吧。
一個原始記錄檔一天約100MB,經過程式跑過,一天剩1MB,這樣4台1年的量大概就是 1*4*365=1.2G左右。感覺運作個10年都不會爆。
程式的階段主要分為:
1.原始LOG分析 <完成>
2. 分析過LOG歸納 <完成>
3. 多筆歸納檔整合
4. 歸納檔製圖可視化,這就是大數據可視化。 <先做這個>
然後我測試加一台從進來從設定到弄好開始產生資料,只要幾分鐘就設定完開始產生資料,我的程式真的太強了。歡呼!於是我就去洗碗了。
大數據可視化做完,所有的人就會閉嘴,本來要動的人就全部被定住動不了,因為這個部分很有震憾力!
其實我自己也想看可視化後的結果,不然程式都在背景跑,連個聲都不響,發生啥事都不知道。
就像你的手機,到底哪個程式一直在吃網路?你得有東西可以看得到。
1207
今天寫一個程式,主要目的是從記錄檔中取出資料進行分天的統計,會寫成札記是因為思考上很複雜,寫起來很簡潔,但是不容易看得懂其中的思路,執行的結果
原始資料大概長這樣,每個時戳中有的是累積量,但是有可能會歸0重新記錄,如下154744401這行就是計數器歸0。
記錄檔的時間是遞減
難就是難在要計算的是總值,但資料中是累積值,也就是說要算出增量:第n-第n+1筆。
本來想法是加總,每5分鐘一筆,一天有288筆,把288筆的資料相加。
上面這種想法很沒效率,所以我就放棄了。
另外一種是突然歸0的狀態,你不能拿第n-第n+1筆,會出現負值。
還有一個難處就是每筆資料的數據不一定是如範例是4個,有可能10多個,程式要有彈性自動判斷。
然後還要分天計算。
以上這些外還要考慮「邊界」的問題。例如假設前一天23:59:56的累積值是 1000,今天00:00:01的累積值是 1050。你不能只算到今天1050為止。
應該要把多的這50算成今天的量,雖然他有跨到昨天去。
再來是我要開啟的檔案有1000多個,要在一次執行完全部跑完,分析整個資料匣下的所有檔案,排除非檔案。
所以我一直沒動手寫這個程式,開始在腦中先想邏輯,就在騎車的路上,我把整個邏輯想通了。
我設一個上界 @a,一個下界@b,一個指標@p和加總@s。
-- 指標讀取記錄由上往下,把下界推下去,推到時間邊界之外,就計算差值,所以我只要計算一次就好。
-- 如果指標推下去時發現下面的值比上面的大,表示資料歸0重設,就先計算總和,並把上界放到目前的位置,下界歸0交給指標去推。
-- 推到時間邊界外時,就設定新的上界,把下界歸0,指標繼續往下直到全部計算完畢。
-- 指標到計算時間外或未進入計算時間時,都會排除,所以文件不必全部掃完,因為未來文件有可能幾千行,每次都重頭掃到尾沒效率。
這樣的寫法我只要把記錄文件重頭到尾掃一次就全算完了,不必重覆執行。
不得不說PERL實在是太懶了,可以讓你的懶惰發揮到極致。
這程式看起來真像天書,還滿有成就感的,不必用太多的程式碼就全部解析完畢。
因為未來會有上萬筆的資料放在上千個檔案中,效率的解析很重要。
執行結果,1000個檔案,第一次執行3秒,接下來執行不到1秒完成。
1152
發現網站開始讀取很慢,我研究了一個多月,找不到原因,記得以前很快,我又沒有改什麼。
耗掉不少時間研究似乎沒有什麼進展(其實也不是沒進展,至少排除我推測的原因)。
結果今天我把問題解決了~~~
耶!我發現原因竟然是…
寫入來訪記錄時,把資料表弄了幾百萬筆,造成後面越寫越慢。
這是我沒料想到的情況。
「我最不懷疑我寫的這一行,因為它從網站一開站就存在了…」我和同事說
「我都沒改過」不知不覺,我接著說出資訊組長最會說的一句話。(我是真的沒改過)
沒改過不表示原本寫的是正確的,或者說,原本寫的也許有問題,但這問題得到某個數量級才會發生。
於是我想到以前,很久以前(20年以前,我那時菜鳥一枚),看了一個同事寫的程式,他只是把資料讀出來顯示到網頁上。
我曾說,這個程式會有問題,但是不是現在發生,當資料量很多時,就會當掉。
作個簡單的比喻,1+1=2很簡單運算很快,
但是 1+1+.....很多很多....+1+1=1000000000時
再快的電腦都要加很久,除非你的程式寫成乘法:1*1000000000
--
現在懂網路的人好像變少了,想想網路還真的很複雜。
可能是薪水並不特別高的原因吧。
1126
大陸人常把日本稱為「某島國」或「小日本」,在我眼裡,中國拿什麼和日本比?髒亂、到處都要錢、人擠人、交通不方便。
咱台灣也好不到哪去,自私和貪婪!
舉個例子:滿地的垃圾和亂停的車子,這不是自私最好的表象嗎?
工廠寧可接暗管把廢水偷排出去,趁著下雨拚命的排放廢氣,為了營收,不願意花錢做減污或減排的事。
不旦自私而且貪婪。
--
留言時要人家輸入驗證碼,或是還得要登入什麼,根本就是無能的象徵。
難道不能自動判斷那是「留言」還是「廣告」?
於是我去看某外國網站的留言,因為我看不懂外文,所以完全無法分辨人家寫什麼。
既然我都無法正確的確定那是留言還是廢物,怎麼能知道那是真正的留言?
其實還是有辦法,方法就是用「行為」。
我開始有想法,決定來做這一塊。
1115
很多人喜歡把所有程式都放在雲端,例如網站、cdn、js、圖片、css。
這樣子好處是不吃自己的伺服器網路資源,但是缺點就是當國外的連線很糟的時候,網站就死了。
畢竟你是中文的網站,連線的以台港中日居多。
--
很多事你一開始排斥它、避免它、逃避它
直到無法躲開時,非對面對…
你排斥、應付它、敷衍它
經過不短的時間後,你發現無法甩開它,甚至一輩子都甩不掉…
後來你慢慢的發現它的好、它有有趣之處
開始喜歡它、研究它並極致它。
有一天你發現它的美好,並成為一項專長。
太神奇了~~
1104
語言這東西很奇怪:1. 聽到很熟析,不知道意思。2. 聽到懂了,不知回什麼,能說的話太少。3. 聽到完全不懂,一臉問號。4. 聽到不懂或不懂,亂說一通,對方也不懂。
有一天,竟然慢慢能聽懂,神奇?!何必博士說:沒有不必背單詞就會的語言,一定要努力背才行。
真的,我想想也是,以前台語不練轉的時間,也是一句一句心中默念,有機會就說,慢慢的越來越順就像母語一樣(不靈光的母語)。
再說英語,學了二十多年,現在比較能聽到直接懂,不再需要心中的翻譯,雖然我還不能用英語思考。
--
太平舊市區的路很小,本來很不習慣,去過日本後,覺得太平的路剛好。
182
滿地的煙頭、垃圾和狗屎,台灣和大陸的差別並不大。
亂停車問題 ,每天都讓人開車時心情不好。
167
無欲則剛,但無欲的人和死沒什麼分別,很可怕。
145
錢只不過是個數字,但咱沒有數字可數!
134
狗的敵人是另一隻狗
123
日語很奇怪的地方就是常會用一些毫不相關的漢字。
調子どう? (事情進行怎樣?和調子無關)
それは素晴らしいです (太棒了!素晴是啥鬼?)
お
這類的例子很多,有些甚至是你不認識的漢字,沒学過是不可能猜対的。