
只要三分鐘,立即來學習如何使用開源工具來分析資料吧
只要三分鐘,立即來學習如何使用開源工具來分析資料吧
想必大家最近都玩過最夯的 http://how-old.net/ ,系統判別的準不準倒是其次,但應該對該系統所呈現出來的臉部、年齡、性別辨識技術一定感到相當驚奇。但其實完成臉部偵測的技術並不難,這次就教各位該如何透過OpenCV,讓你/妳能用短短的幾行程式碼,做出個山寨版的how-old.net
本次教學將教各位如何透過OpenCv,以影像辨識的手法將台灣證券交易所買賣日報表五碼驗證碼獨立分解成五個單一文字,以利之後透過機器學習演算法(Machine Learning)辨識圖像文字(OCR)。
繼上一次我們已經可以將驗證碼分解成獨立的字母圖片後,接下來便可以透過OCR 技術辨識圖像文字,在這邊我們將圖片變更成同一大小後(resize),我們先試著使用pytesser 做圖片辨識,但是發現效果不佳,因此我們土炮式的用Word 建立基準圖片後,使用簡單的Mean Square Error 計算兩張圖片的相似度,果然簡單的最好,輕輕鬆鬆破解惱人的驗證碼。 想收到更新訊息,請至Facebook粉絲團按讚: https://www.facebook.com/largitdata