[爬蟲實戰] 如何破解高鐵驗證碼 (2) - 使用迴歸方法去除多餘弧線?

[爬蟲實戰] 如何破解高鐵驗證碼 (2) - 使用迴歸方法去除多餘弧線?

[爬蟲實戰] 如何破解高鐵驗證碼 (2) - 使用迴歸方法去除多餘弧線?

在去除掉腦人的噪音點後,如何該去除掉跟字一樣粗的弧線便是大問題。所幸,所有高鐵驗證碼的弧線都可以簡單的用一個二項式迴歸公式表示,因此我們便可以用sklearn 的linear model去適配出迴歸線後,便可以擦去這條煩人的弧線,提高圖片的可辨識率! 程式碼: https://github.com/ywchiu/largitdata/blob/master/code/Course_97.ipynb

  • Wed 01 Nov 2017
回到最上面